Визуальная рутина - Visual routine

А визуальная рутина это средство извлечения информации из визуальной сцены.

В своих исследованиях человеческого зрения познание, Шимон Ульман предложил, чтобы человек зрительная система Задача восприятия свойств формы и пространственных отношений разделена на два последовательных этапа: «ранний»вверх дном «состояние, во время которого базовые представления генерируются из визуального ввода, а позже»низходящий «этап, на котором высокоуровневые примитивы, названные« визуальными процедурами », извлекают желаемую информацию из базовых представлений.[1] У людей базовые представления, генерируемые на восходящей стадии, соответствуют ретинотопные карты (более 15 из которых существуют в коре головного мозга) для таких свойств, как цвет, ориентация краев, скорость движения и направление движения. Эти базовые представления полагаются на фиксированные операции, выполняемые единообразно по всему полю визуального ввода, и не используют знания, относящиеся к конкретным объектам, знаниям, связанным с конкретными задачами, или другую информацию более высокого уровня.[2]

Визуальные процедуры, предложенные Уллманом, представляют собой высокоуровневые примитивы, которые анализируют структуру сцены, извлекая пространственную информацию из базовых представлений. Эти визуальные процедуры состоят из последовательности элементарных визуальных операторов, специфичных для конкретной задачи. Визуальные процедуры отличаются от фиксированных операций базовых представлений тем, что они не применяются равномерно по всей поле зрения --- скорее, они применяются только к объектам или областям, указанным в процедурах.[1]

Ульман приводит следующие примеры визуальных операторов: смещение фокуса обработки, индексирование значимого элемента для дальнейшей обработки, распространение активации по области, ограниченной границами, отслеживание границ и маркировка местоположения или объекта для использования в будущем. При объединении в визуальные процедуры эти элементарные операторы могут использоваться для выполнения относительно сложных пространственных задач, таких как подсчет количества объектов, удовлетворяющих определенному свойству, или распознавание сложной формы.[1]

Ряд исследователей реализовали визуальные процедуры для обработки изображений с камеры, чтобы выполнять такие задачи, как определение объекта, на который указывает человек на изображении с камеры.[3][4][5] Исследователи также применили подход визуальных процедур к искусственным представлениям карт для воспроизведения 2D в реальном времени. видеоигры. Однако в этих случаях карта видеоигры предоставлялась напрямую, что избавляло от необходимости иметь дело с реальными задачами восприятия, такими как распознавание объекта и окклюзия компенсация.

использованная литература

  1. ^ а б c «Визуальные рутины Ульмана и зарисовки Теккоцу» (PDF).
  2. ^ Huang, J .; Векслер, Х. (апрель 2000 г.). «Визуальные процедуры для определения местоположения глаз с использованием обучения и эволюции». IEEE Transactions по эволюционным вычислениям. 4 (1): 73–82. Дои:10.1109/4235.843496. ISSN  1089-778X.
  3. ^ Джонсон, М. П. (август 1996 г.). Автоматическое создание визуальных процедур с использованием генетического программирования. Материалы 13-й Международной конференции по распознаванию образов.. 1. С. 951–956 т.1. Дои:10.1109 / ICPR.1996.546164. ISBN  978-0-8186-7282-8.
  4. ^ Асте, Марко; Росси, Массимо; Каттони, Ролдано; Каприль, Бруно (1998-06-01). «Визуальные процедуры для мониторинга поведения транспортных средств в реальном времени». Машинное зрение и приложения. 11 (1): 16–23. CiteSeerX  10.1.1.48.5736. Дои:10.1007 / s001380050086. ISSN  0932-8092.
  5. ^ Рао, Сатьяджит. «Визуальные распорядки и внимание» (PDF). Лаборатория компьютерных наук и искусственного интеллекта Массачусетского технологического института.