Изучение геометрических элементов - Geometric feature learning - Wikipedia

Изучение геометрических элементов это техника, сочетающая машинное обучение и компьютерное зрение для решения визуальных задач. Основная цель этого метода - найти набор репрезентативных характеристик геометрической формы для представления объекта путем сбора геометрических элементов из изображений и их изучения с использованием эффективных машинное обучение методы. Люди решают визуальные задачи и могут быстро реагировать на окружающую среду, извлекая перцептивную информацию из того, что они видят. Исследователи моделируют способность человека распознавать объекты для решения задач компьютерного зрения. Например, M. Mata et al. (2002) [1] прикладные методы изучения особенностей мобильный робот навигация задачи во избежание препятствий. Они использовали генетические алгоритмы для обучения особенностям и распознавание объектов (цифры). Методы обучения геометрическим элементам могут не только решать проблемы распознавания, но и предсказывать последующие действия путем анализа набора последовательных входных сенсорных изображений, обычно некоторых извлекающих элементов изображений. Посредством обучения выдается некоторая гипотеза следующего действия и, в соответствии с вероятностью каждой гипотезы, дается наиболее вероятное действие. Этот метод широко используется в области искусственный интеллект.

Вступление

Методы изучения геометрических элементов извлекают из изображений отличительные геометрические элементы. Геометрические элементы - это элементы объектов, построенных из набора геометрических элементов, таких как точки, линии, кривые или поверхности. Этими элементами могут быть угловые элементы, элементы краев, капли, гребни, текстура изображения выступающих точек и т. Д., Которые могут быть обнаружены с помощью обнаружение функции методы.

Геометрические особенности

Примитивные особенности
  • Углы: Углы - очень простая, но важная особенность объектов. В частности, сложные объекты обычно имеют разные угловые элементы друг с другом. Углы объекта можно извлечь с помощью техники, вызывающей Обнаружение углов. Чо и Данн [2] использовал другой способ определения угла по расстоянию и углу между двумя отрезками прямой. Это новый способ определения объектов как параметризованной композиции из нескольких компонентов.
  • Края: Края - это одномерные структурные элементы изображения. Они представляют собой границу различных областей изображения. Контур объекта можно легко определить, найдя край с помощью техники обнаружение края.
  • BLOB-объекты: BLOB-объекты представляют собой области изображений, которые можно обнаружить с помощью обнаружение капли метод.
  • Гребни: с практической точки зрения гребень можно рассматривать как одномерную кривую, которая представляет ось симметрии. Метод обнаружения гребней - см. обнаружение гребня
  • основные моменты - см. Детектор выраженности Кадира – Брэди
  • текстура изображения
Составные особенности[3]
  • Геометрическая композиция

Геометрический компонент представляет собой комбинацию нескольких примитивных элементов, и он всегда состоит из более чем двух примитивных элементов, таких как края, углы или капли. Извлечение геометрического вектора признаков в точке х может быть вычислена в соответствии с опорной точкой, которая показана ниже:

x означает расположение расположения функций, означает ориентацию, означает внутреннюю шкалу.

  • Логическая композиция

Составной логический объект состоит из двух подкомпонентов, которые могут быть примитивными или составными. Есть два типа логических признаков: конъюнктивный признак, значение которого является продуктом двух под-признаков, и дизъюнктивный признак, значение которого является максимальным из двух под-признаков.

Пространство функций

Пространство функций был впервые рассмотрен в области компьютерного зрения компанией Segen.[4] Он использовал многоуровневый граф, чтобы представить геометрические отношения локальных объектов.

Алгоритмы обучения

Существует множество алгоритмов обучения, которые можно применить, чтобы научиться находить Отличительные черты объектов на изображении. Обучение может быть постепенным, что означает, что классы объектов могут быть добавлены в любое время.

Методы извлечения геометрических элементов

Алгоритм изучения функций

1. Приобретите новый тренировочный образ «Я».

2. По алгоритму распознавания оцените результат. Если результат верен, распознаются новые классы объектов.

  • алгоритм распознавания

Ключевым моментом алгоритма распознавания является нахождение наиболее отличительных черт среди всех признаков всех классов. Итак, используя приведенное ниже уравнение, чтобы максимизировать функцию

Измерьте ценность объекта на изображениях, и и локализуйте функцию:

Где определяется как

  • оценка

После распознавания признаков необходимо оценить результаты, чтобы определить, можно ли распознать классы. Существует пять категорий оценки результатов распознавания: правильные, неправильные, неоднозначные, запутанные и невежественные. Если оценка верна, добавьте новый тренировочный образ и тренируйте его. Если распознавание не удалось, узлы признаков должны иметь максимальную различительную силу, которая определяется расстоянием Колмогорова-Смирно (KSD).

3.Алгоритм обучения функции После того, как функция распознана, ее следует применить к Байесовская сеть чтобы распознать изображение, используя алгоритм обучения функции для тестирования.

  • Основная цель алгоритма изучения признаков - найти новую функцию из образца изображения, чтобы проверить, распознаются ли классы или нет. Следует рассмотреть два случая: поиск новой функции истинного класса и неправильного класса из образца изображения соответственно. Если обнаруживается новая функция истинного класса, а неправильный класс не распознается, то класс распознается, и алгоритм должен завершиться. Если признак истинного класса не обнаружен, а признак ложного класса обнаружен в образце изображения, следует предотвратить распознавание ложного класса и эту особенность следует удалить из байесовской сети.
  • Использование байесовской сети для реализации процесса тестирования

Алгоритм обучения функций на основе модели PAC

Структура обучения

Модель «Вероятно приблизительно правильная» (PAC) была применена Д. Ротом (2002) для решения проблемы компьютерного зрения путем разработки теории обучения без распределения, основанной на этой модели.[5] Эта теория в значительной степени опиралась на разработку подхода к обучению с эффективным использованием функций. Цель этого алгоритма - изучить объект, представленный некоторыми геометрическими элементами изображения. Вход - это вектор признаков а на выходе - 1, что означает успешное обнаружение объекта, в противном случае - 0. Основным моментом этого подхода к обучению является сбор репрезентативных элементов, которые могут представлять объект через функцию и тестирование путем распознавания объекта по изображению, чтобы найти представление с высокой вероятностью. Алгоритм обучения нацелен на прогнозирование того, принадлежит классу, где X - пространство экземпляров, состоящее из параметров, а затем проверяет, верен ли прогноз.

Рамки оценки

После изучения функций должны быть некоторые алгоритмы оценки для оценки алгоритмов обучения. Д. Рот применил два алгоритма обучения:

1.Система разреженной сети Winnows (SNoW)
  • SNoW-Поезд
    • Начальный шаг: начните набор функций который связан с целью t для всех . T - это набор целей объекта, элементы которого к
    • Если каждый целевой объект в наборе T принадлежит к списку активных функций, свяжите объект с целью и установите начальный вес одновременно.
    • Оцените цели: сравните цели с , куда - вес на одной позиции, соединяющий элементы i с целью t. theta_ {t} - это порог для цели, а не t.
    • Обновите вес в соответствии с результатом оценки. Есть два случая: предсказанный положительный на отрицательном примере ( и цели отсутствуют в списке активных функций) и прогнозируемый отрицательный на положительном примере ( и цели находятся в списке активных функций).
  • SNoW-Оценка
    • Оцените каждую цель, используя ту же функцию, что и выше.
    • Прогноз: примите решение выбрать доминирующий активный целевой узел.
2. опорные векторные машины

Основная цель SVM - найти гиперплоскость разделить набор образцов куда - входной вектор, который представляет собой набор функций и это ярлык . Гиперплоскость имеет следующий вид:

это функция ядра

Оба алгоритма разделяют данные обучения, находя линейную функцию.

Приложения

  • Изучение ориентиров для топологической навигации[6]
  • Моделирование детектирования объектного процесса зрительного поведения человека[7]
  • Изучение самопроизвольного действия [8]
  • Отслеживание транспортных средств[9]

Рекомендации

  1. ^ М. Мата и Дж. М. Армингол, А. Де Ла Эскалера и М. А. Саликс "Изучение визуальных ориентиров для навигации мобильного робота ", В материалах 15-го Всемирного конгресса Международной федерации автоматического управления, 2002 г.
  2. ^ Чо, К., и Данн, С.М. «Обучение формам». IEEE Transactions on Pattern Analysis and Machine Intelligence 16,9 (1994), 882-888
  3. ^ Юстус Х. Пиатер, «Обучение визуальным особенностям» (1 января 2001 г.). Электронные докторские диссертации для UMass Amherst. Бумага AAI3000331.
  4. ^ Сеген, Дж. Изучение графовых моделей формы. В трудах 5-й Международной конференции по машинному обучению (Анн-Арбор, 12–14 июня 1988 г.), J. Larid, Ed., Morgan Kaufmann
  5. ^ Д. Рот, М-Н. Ян и Н. Ахуджа. Учимся распознавать трехмерные объекты. Нейронные вычисления, 14(5): 1071–1104, 2002.
  6. ^ М. Мата, Дж. М. Армингол, Изучение визуальных ориентиров для навигации мобильных роботов, Отдел системного проектирования и автоматизации, Мадрид, Испания, 2002 г.
  7. ^ Рыбак И.А., БМВ: Поведенческая модель визуального восприятия и распознавания, Человеческое зрение, обработка изображений и цифровой дисплей IV
  8. ^ П. Фитцпатрик, Г. Метта, Л. Натале, С. Рао и Дж. Сандини, «Изучение объектов через действие - первые шаги к искусственному познанию, ”В IEEE Int. Конференция по робототехнике и автоматизации, 2003 г., стр. 3140–3145.
  9. ^ Дж. М. Ферриман, А. Д. Уорролл, С. Дж. Maybank. Изучение улучшенных 3D-моделей для отслеживания транспортных средств. В Proc. Британской конференции по машинному зрению, 1998 г.