Случайное отображение - Random mapping

Когда векторы данных являются многомерными, с вычислительной точки зрения невозможно использовать алгоритмы анализа данных или распознавания образов, которые многократно вычисляют сходства или расстояния в исходном пространстве данных. Следовательно, необходимо уменьшить размерность перед, например, кластеризацией данных.RM) быстрый уменьшение размерности метод, отнесенный к категории извлечение признаков метод. В RM состоит в генерации случайной матрицы, которая умножается на каждый исходный вектор и приводит к уменьшенному вектору. Текстовый анализ В контексте показано, что классификация документов точность, полученная после уменьшения размерности с помощью метода случайного отображения, будет почти такой же хорошей, как и исходная точность, если конечная размерность достаточно велика (около 100 из 6000). Фактически, можно показать, что внутренний продукт (сходство) между отображенными векторами точно следует внутренний продукт оригинала векторов.

Смотрите также

Рекомендации

  • Каски, С. Снижение размерности с помощью случайного отображения: быстрое вычисление подобия для кластеризации. Труды Международной совместной конференции IEEE 1998 г. по нейронным сетям, 1998 г., стр. 413–418. DOI: 10.1109 / IJCNN.1998.682302