Целенаправленное преследование проекции - Targeted projection pursuit - Wikipedia

Пример преследования целевой проекции
В этом примере преследование целевой проекции используется для изучения проекций экспрессия гена набор данных. Каждая из 122 точек соответствует образцу, взятому из рака. опухоль четырех диагностических классов (обозначены цветом). Для каждого образца регистрировали уровень экспрессии 100 генов (представленных осями). Анимация показывает, что TPP может четко разделить два класса (красный и фиолетовый), но два других нельзя различить (синий и зеленый). Затем положение осей указывает активацию того, какие гены наиболее связаны с каждым классом.

Целенаправленное преследование проекции это тип статистического метода, используемый для разведочный анализ данных, визуализация информации, и выбор функции. Это позволяет пользователю в интерактивном режиме исследовать очень сложные данные (обычно имеющие от десятков до сотен атрибутов), чтобы найти функции или шаблоны, представляющие потенциальный интерес.

Обычный, или "слепой", преследование проекции, находит наиболее "интересные" возможные прогнозы в многомерных данных, используя алгоритм поиска который оптимизирует некоторый фиксированный критерий "интересности", например отклонение от нормальное распределение. Напротив, целевое преследование проекций позволяет пользователю исследовать пространство проекций, манипулируя точками данных непосредственно в интерактивном режиме. диаграмма рассеяния.

Целенаправленное проектирование нашло применение в Микрочип ДНК анализ данных,[1] белок анализ последовательности,[2] макет графика[3] и цифровая обработка сигналов.[4] Он доступен как пакет для WEKA машинное обучение Инструментарий.

Рекомендации

  1. ^ Вера, Джозеф; Роберт Минтрам; Майя Ангелова (2006). «Целевая проекция для визуализации классификаций данных экспрессии генов» (PDF). Биоинформатика. 22 (21): 2667–267. Дои:10.1093 / биоинформатика / btl463. PMID  16954139.
  2. ^ Хэддоу, Крис; Маркус Даррант; Джастин Перри; Джо Фейт (2011). «Прогнозирование функциональных остатков выравнивания белковых последовательностей как задача выбора признаков». Международный журнал интеллектуального анализа данных и биоинформатики. 5 (6): 691–705. Дои:10.1504 / IJDMB.2011.045417. PMID  22295751.
  3. ^ Гибсон, Хелен; Джо Фейт (2011). "Схема узла-атрибута для сетей малого мира". Материалы 15-й Международной конференции по визуализации информации.
  4. ^ Суджан, Раджбхандари; Джо Фейт (2010). «Использование линейных проекций в визуальном анализе сигналов в внутренней оптической беспроводной линии связи». 2010 7-й Международный симпозиум по системам связи, сетям и цифровой обработке сигналов (CSNDSP 2010). IEEE. С. 576–581. Дои:10.1109 / CSNDSP16145.2010.5580367. ISBN  978-1-4244-8858-2.

дальнейшее чтение

внешняя ссылка