Извлечение отношений - Relationship extraction
А извлечение отношений задача требует обнаружения и классификации семантические отношения упоминаний в наборе артефакты обычно из текст или же XML документы. Задача очень похожа на задачу извлечение информации (IE), но IE дополнительно требует удаления повторяющихся отношений (устранение неоднозначности ) и обычно относится к извлечению множества различных отношений.
Приложения
Области приложений, в которых полезно извлечение взаимосвязей, включают взаимосвязи ген-болезнь,[1] белок-белковое взаимодействие[2] и Т. Д.
Бесконечное изучение языка это семантический машинное обучение система разработан исследовательской группой в Университет Карнеги Меллон который извлекает отношения из открытой сети.
Подходы
Один из подходов к этой проблеме предполагает использование домена онтологии.[3][4]Другой подход включает визуальное обнаружение значимых отношений в параметрических значениях объектов, перечисленных в таблице данных, которые меняют позиции, когда таблица переставляется автоматически, как это контролируется пользователем программного обеспечения. Плохое покрытие, редкость и стоимость разработки, связанные со структурированными ресурсами, такими как семантические лексики (например. WordNet, UMLS ) и онтологии предметной области (например, Генная онтология ) привела к появлению новых подходов, основанных на обширных, динамичных фоновых знаниях в Интернете. Например, техника АРХИЛЕС[5] использует только количество страниц в Википедии и поисковой системе для получения крупномасштабных отношений для создания облегченных онтологий.
Отношения могут быть представлены с использованием различных формализмов / языков. Одним из таких языков представления данных в Интернете является RDF.
Совсем недавно были предложены сквозные системы, которые совместно учатся извлекать упоминания сущностей и их семантические отношения с большим потенциалом для получения высокой производительности.[6]
Смотрите также
- Текстовая аналитика
- Семантическая аналитика
- Разметка семантических ролей
- Извлечение информации
- Бизнес-аналитика 2.0
Рекомендации
- ^ Хон-Ву Чун; Йошимаса Цуруока; Джин-Донг Ким; Рие Шиба; Наоки Нагата; Теруёси Хишики; Дзюн-ичи Цудзи (2006). «Извлечение связи ген-болезнь из Medline с использованием словарей предметной области и машинного обучения». Тихоокеанский симпозиум по биокомпьютингу. CiteSeerX 10.1.1.105.9656.
- ^ Минли Хуан, Сяоянь Чжу, Ю Хао, Дональд Г. Паян, Кунбинь Цюй и Мин Ли (2004). «Обнаружение закономерностей для извлечения белок-белковых взаимодействий из полных текстов». Биоинформатика. 20 (18): 3604–3612. Дои:10.1093 / биоинформатика / bth451. PMID 15284092.
- ^ Т. К. Риндфлеш, Л. Танабе, Дж. Н. Вайнштейн и Л. Хантер (2000). «Эдгар: Извлечение лекарств, генов и отношений из биомедицинской литературы». Proc. Тихоокеанский симпозиум по биокомпьютингу. С. 514–525. ЧВК 2709525.
- ^ К. Рамакришнан, К. Дж. Кочут и А. П. Шет (2006). «Платформа для обнаружения взаимосвязей на основе схемы из неструктурированного текста». Proc. Международная конференция по семантической сети. С. 583–596.
- ^ В. Вонг, В. Лю и М. Беннамун (2009). «Получение семантических отношений с помощью Интернета для создания облегченных онтологий». Proc. 13-я Тихоокеанско-азиатская конференция по открытию знаний и интеллектуальному анализу данных (PAKDD). Дои:10.1007/978-3-642-01307-2_26.
- ^ Дат Куок Нгуен и Карин Верспур (2019). «Сквозное извлечение нейронных отношений с использованием глубокого биаффинного внимания». Труды 41-й Европейской конференции по поиску информации (ECIR). arXiv:1812.11275. Дои:10.1007/978-3-030-15712-8_47.
Этот Информатика статья - это заглушка. Вы можете помочь Википедии расширяя это. |