U-Net - U-Net

U-Net это сверточная нейронная сеть который был разработан для биомедицинской сегментации изображений на факультете компьютерных наук Университета Фрайбурга, Германия.[1] Сеть основана на полностью сверточной сети[2] и его архитектура была изменена и расширена для работы с меньшим количеством обучающих образов и получения более точных сегментов. Сегментация изображения 512 × 512 занимает меньше секунды на современном GPU.

Описание

В U-Net Архитектура происходит от так называемой «полностью сверточной сети», впервые предложенной Лонгом, Шелхамером и Дарреллом.[2]

Основная идея состоит в том, чтобы дополнить обычную контрактную сеть последовательными уровнями, где операции объединения заменяются на повышающая дискретизация операторы. Следовательно, эти слои увеличивают разрешение вывода. Более того, последовательный сверточный слой затем может научиться составлять точный вывод на основе этой информации.[1]

Одно важное изменение в U-Net заключается в том, что в части повышающей дискретизации имеется большое количество функциональных каналов, которые позволяют сети распространять контекстную информацию на уровни с более высоким разрешением. Как следствие, расширяющаяся дорожка более или менее симметрична сжимающейся части и дает U-образную архитектуру. Сеть использует только действительную часть каждого свертка без полностью связанных слоев.[2] Чтобы предсказать количество пикселей в пограничной области изображения, недостающий контекст экстраполируется путем зеркального отражения входного изображения. Эта стратегия листов важна для применения сети к большим изображениям, поскольку в противном случае разрешение будет ограничено GPU объем памяти.

История

U-Net был создан Олафом Роннебергером, Филиппом Фишером, Томасом Брокс в 2015 году в статье «U-Net: сверточные сети для сегментации биомедицинских изображений».[1] Это усовершенствование и развитие FCN: Эван Шелхамер, Джонатан Лонг, Тревор Даррелл (2014). «Полностью сверточные сети для семантической сегментации».[2]

Сетевая архитектура

Сеть состоит из сокращающегося пути и расширяющегося пути, что придает ей U-образную архитектуру. Контрактный путь представляет собой типичную сверточную сеть, состоящую из многократного применения извилины, за каждым последующим выпрямленный линейный блок (ReLU) и максимальный пул операция. Во время сжатия пространственная информация уменьшается, а характерная информация увеличивается. Расширяющийся путь сочетает в себе функции и пространственную информацию посредством последовательности восходящих сверток и конкатенаций с функциями высокого разрешения из сокращающегося пути.[3]

Это пример архитектуры U-Net для создания k масок 256 на 256 для изображения RGB 256 на 256.

Приложения

Есть много приложений U-Net в биомедицине сегментация изображения, например, сегментация изображения мозга ("BRATS"[4]) и сегментации изображения печени ("siliver07"[5]). Варианты U-Net также применялись для реконструкции медицинских изображений.[6] Вот несколько вариантов и приложений U-Net:

  1. Пиксельная регрессия с использованием U-Net и его приложения для панорамирования;[7]
  2. 3D U-Net: изучение плотной объемной сегментации из разреженных аннотаций;[8]
  3. TernausNet: U-Net с кодировщиком VGG11, прошедший предварительную подготовку в ImageNet для сегментации изображений.[9]

Реализации

jakeret (2017): "Tensorflow Unet"[10]

U-Net исходный код из службы распознавания образов и обработки изображений факультета компьютерных наук Фрайбургского университета, Германия.[11]

Основные статьи по системе[1][2][8][9] были процитированы 3693, 7049, 442 и 22 раза соответственно на Google ученый по состоянию на 24 декабря 2018 г.[12]

Рекомендации

  1. ^ а б c d Роннебергер, Олаф; Фишер, Филипп; Брокс, Томас (2015). «U-Net: сверточные сети для сегментации биомедицинских изображений». arXiv:1505.04597 [cs.CV ].
  2. ^ а б c d е Лонг, Дж .; Shelhamer, E .; Даррелл, Т. (2014). «Полностью сверточные сети для семантической сегментации». IEEE Transactions по анализу шаблонов и машинному анализу. 39 (4): 640–651. arXiv:1411.4038. Дои:10.1109 / TPAMI.2016.2572683. PMID  27244717.
  3. ^ «Код U-Net».
  4. ^ «MICCAI BraTS 2017: Область применения | Секция анализа биомедицинских изображений (SBIA) | Медицинская школа Перельмана при Университете Пенсильвании». www.med.upenn.edu. Получено 2018-12-24.
  5. ^ "SLIVER07: Дом". www.sliver07.org. Получено 2018-12-24.
  6. ^ Андерссон Дж., Альстрём Х., Куллберг Дж. (Сентябрь 2019 г.). «Разделение сигнала воды и жира в градиентном эхо-сканировании всего тела с использованием сверточных нейронных сетей». Магнитный резонанс в медицине. 82 (3): 1177–1186. Дои:10.1002 / mrm.27786. ЧВК  6618066. PMID  31033022.
  7. ^ Яо, Вэй; Цзэн, Чжиган; Лянь, Ченг; Тан, Хуэйминь (27.10.2018). «Пиксельная регрессия с использованием U-Net и его приложения для паншарпенинга». Нейрокомпьютинг. 312: 364–371. Дои:10.1016 / j.neucom.2018.05.103. ISSN  0925-2312.
  8. ^ а б Чичек, Озгюн; Абдулкадир, Ахмед; Лиенкамп, Серен (2016). "3D U-Net: Изучение плотной объемной сегментации из разреженных аннотаций". arXiv:1606.06650 [cs.CV ].
  9. ^ а б Игловиков, Владимир; Швец, Алексей (2018). «TernausNet: U-Net с кодировщиком VGG11, прошедший предварительное обучение в ImageNet для сегментации изображений». arXiv:1801.05746 [cs.CV ].
  10. ^ Акерет, Джоэл (2018-12-24), Общая реализация U-Net Tensorflow для сегментации изображений: jakeret / tf_unet, получено 2018-12-24
  11. ^ "U-Net: сверточные сети для сегментации биомедицинских изображений". lmb.informatik.uni-freiburg.de. Получено 2018-12-24.
  12. ^ U-net Данные цитирования Google Scholar