Извлечение отношений - Relationship extraction

А извлечение отношений задача требует обнаружения и классификации семантические отношения упоминаний в наборе артефакты обычно из текст или же XML документы. Задача очень похожа на задачу извлечение информации (IE), но IE дополнительно требует удаления повторяющихся отношений (устранение неоднозначности ) и обычно относится к извлечению множества различных отношений.

Приложения

Области приложений, в которых полезно извлечение взаимосвязей, включают взаимосвязи ген-болезнь,^[1] белок-белковое взаимодействие^[2] и Т. Д.

Бесконечное изучение языка это семантический машинное обучение система разработан исследовательской группой в Университет Карнеги Меллон который извлекает отношения из открытой сети.

Подходы

Один из подходов к этой проблеме предполагает использование домена онтологии.^[3]^[4]Другой подход включает визуальное обнаружение значимых отношений в параметрических значениях объектов, перечисленных в таблице данных, которые меняют позиции, когда таблица переставляется автоматически, как это контролируется пользователем программного обеспечения. Плохое покрытие, редкость и стоимость разработки, связанные со структурированными ресурсами, такими как семантические лексики (например. WordNet, UMLS ) и онтологии предметной области (например, Генная онтология ) привела к появлению новых подходов, основанных на обширных, динамичных фоновых знаниях в Интернете. Например, техника АРХИЛЕС^[5] использует только количество страниц в Википедии и поисковой системе для получения крупномасштабных отношений для создания облегченных онтологий.

Отношения могут быть представлены с использованием различных формализмов / языков. Одним из таких языков представления данных в Интернете является RDF.

Совсем недавно были предложены сквозные системы, которые совместно учатся извлекать упоминания сущностей и их семантические отношения с большим потенциалом для получения высокой производительности.^[6]

Смотрите также

Рекомендации

^ Хон-Ву Чун; Йошимаса Цуруока; Джин-Донг Ким; Рие Шиба; Наоки Нагата; Теруёси Хишики; Дзюн-ичи Цудзи (2006). «Извлечение связи ген-болезнь из Medline с использованием словарей предметной области и машинного обучения». Тихоокеанский симпозиум по биокомпьютингу. CiteSeerX 10.1.1.105.9656.
^ Минли Хуан, Сяоянь Чжу, Ю Хао, Дональд Г. Паян, Кунбинь Цюй и Мин Ли (2004). «Обнаружение закономерностей для извлечения белок-белковых взаимодействий из полных текстов». Биоинформатика. 20 (18): 3604–3612. Дои:10.1093 / биоинформатика / bth451. PMID 15284092.
^ Т. К. Риндфлеш, Л. Танабе, Дж. Н. Вайнштейн и Л. Хантер (2000). «Эдгар: Извлечение лекарств, генов и отношений из биомедицинской литературы». Proc. Тихоокеанский симпозиум по биокомпьютингу. С. 514–525. ЧВК 2709525.
^ К. Рамакришнан, К. Дж. Кочут и А. П. Шет (2006). «Платформа для обнаружения взаимосвязей на основе схемы из неструктурированного текста». Proc. Международная конференция по семантической сети. С. 583–596.
^ В. Вонг, В. Лю и М. Беннамун (2009). «Получение семантических отношений с помощью Интернета для создания облегченных онтологий». Proc. 13-я Тихоокеанско-азиатская конференция по открытию знаний и интеллектуальному анализу данных (PAKDD). Дои:10.1007/978-3-642-01307-2_26.
^ Дат Куок Нгуен и Карин Верспур (2019). «Сквозное извлечение нейронных отношений с использованием глубокого биаффинного внимания». Труды 41-й Европейской конференции по поиску информации (ECIR). arXiv:1812.11275. Дои:10.1007/978-3-030-15712-8_47.

Этот Информатика статья - это заглушка. Вы можете помочь Википедии расширяя это.

[Chun06-1] Хон-Ву Чун; Йошимаса Цуруока; Джин-Донг Ким; Рие Шиба; Наоки Нагата; Теруёси Хишики; Дзюн-ичи Цудзи (2006). «Извлечение связи ген-болезнь из Medline с использованием словарей предметной области и машинного обучения». Тихоокеанский симпозиум по биокомпьютингу. CiteSeerX 10.1.1.105.9656.

[huang04-2] Минли Хуан, Сяоянь Чжу, Ю Хао, Дональд Г. Паян, Кунбинь Цюй и Мин Ли (2004). «Обнаружение закономерностей для извлечения белок-белковых взаимодействий из полных текстов». Биоинформатика. 20 (18): 3604–3612. Дои:10.1093 / биоинформатика / bth451. PMID 15284092.

[rindflesch00-3] Т. К. Риндфлеш, Л. Танабе, Дж. Н. Вайнштейн и Л. Хантер (2000). «Эдгар: Извлечение лекарств, генов и отношений из биомедицинской литературы». Proc. Тихоокеанский симпозиум по биокомпьютингу. С. 514–525. ЧВК 2709525.

[ramakrishnan06-4] К. Рамакришнан, К. Дж. Кочут и А. П. Шет (2006). «Платформа для обнаружения взаимосвязей на основе схемы из неструктурированного текста». Proc. Международная конференция по семантической сети. С. 583–596.

[wongetal09-5] В. Вонг, В. Лю и М. Беннамун (2009). «Получение семантических отношений с помощью Интернета для создания облегченных онтологий». Proc. 13-я Тихоокеанско-азиатская конференция по открытию знаний и интеллектуальному анализу данных (PAKDD). Дои:10.1007/978-3-642-01307-2_26.

[ecir2019-6] Дат Куок Нгуен и Карин Верспур (2019). «Сквозное извлечение нейронных отношений с использованием глубокого биаффинного внимания». Труды 41-й Европейской конференции по поиску информации (ECIR). arXiv:1812.11275. Дои:10.1007/978-3-030-15712-8_47.

[1]

[2]

[3]

[4]

[5]

[6]