WordNet - WordNet

WordNet
A snapshot of WordNet's definition of itself.
Снимок определения WordNet самого себя.
Разработчики)Университет Принстона
изначальный выпусксередина 1980-х
Стабильный выпуск
3.1 / июнь 2011 г.; 9 лет назад (2011-06)[1]
Написано вПролог
Операционная системаUnix, Linux, Solaris, Windows
Размер16 МБ (включая 155 327 слов, организованных в 175 979 синсетов, всего 207 016 пар слов)
Доступно вБолее 200 языков
ТипЛексическая база данных
ЛицензияBSD-подобный
Интернет сайтWordnet.princeton.edu

WordNet это лексическая база данных из семантические отношения между слова на более чем 200 языках.[2] Ссылки WordNet слова в семантические отношения включая синонимы, гипонимы, и меронимы. Синонимы сгруппированы в синсеты с краткими определениями и примерами использования. Таким образом, WordNet можно рассматривать как комбинацию и расширение толковый словарь и тезаурус. Хотя он доступен для пользователей через веб-браузер,[3] его основное использование - автоматическое анализ текста и искусственный интеллект Приложения. WordNet был впервые создан в английский язык[4] и английский WordNet база данных и программного обеспечения инструменты были выпущены под Лицензия в стиле BSD и свободно доступны для загрузки с этого веб-сайта WordNet.

История и члены команды

WordNet был впервые создан на английском языке только в Наука о мышлении Лаборатория Университет Принстона под руководством психология профессор Джордж Армитаж Миллер начиная с 1985 года и в последние годы[когда? ] к Кристиан Феллбаум. Первоначально проект финансировался Управлением военно-морских исследований США, а затем и другими правительственными учреждениями США, включая DARPA, то Национальный фонд науки, то Офис подрывных технологий (бывшее направление перспективных исследований и разработок) и REFLEX. Джордж Миллер и Кристиана Феллбаум были награждены премией 2006 года. Приз Антонио Замполли за их работу с WordNet.

Глобальная ассоциация WordNet - это некоммерческая организация, которая предоставляет платформу для обсуждения, обмена и подключения WordNets для всех языков мира и имеет Кристиан Феллбаум и Piek Th.J.M. Фоссен и в качестве сопрезидентов.[5]

Содержимое базы данных

Пример записи «Гамбургер» в WordNet

База данных содержит 155 327 слов, организованных в 175 979 синсеты всего 207 016 смысловых пар; в сжатый форма, это около 12 мегабайты по размеру.[6]

WordNet включает лексические категории существительные, глаголы, прилагательные и наречия но игнорирует предлоги, определители и другие служебные слова.

Слова из одной лексической категории, которые являются примерно синонимами, сгруппированы в синсеты. Синсеты включают симплексные слова, а также словосочетания например, «поесть вне дома» и «в машине». Различные смыслы многозначный словоформы присваиваются разным синсетам. Значение синсета дополнительно поясняется коротким определением блеск и один или несколько примеров использования. Пример синсета прилагательного:

хороший, правильный, спелый - (наиболее подходящий или подходящий для конкретной цели; «хорошее время, чтобы сажать помидоры»; «подходящее время для действий»; «время пришло для великих социологических изменений»)

Все синсеты связаны с другими наборами посредством семантических отношений. Эти отношения, не все общие для всех лексических категорий, включают:

  • Существительные
    • гиперонимы: Y это гипероним Икс если каждый Икс это (вид) Y (собачий это гипероним собака )
    • гипонимы: Y это гипоним Икс если каждый Y это (вид) Икс (собака это гипоним собачий)
    • условия согласования: Y является координатным членом Икс если Икс и Y поделитесь гипернимом (волк является координатным членом собака, и собака является координатным членом волк)
    • мероним: Y это мероним Икс если Y является частью Икс (окно это мероним строительство)
    • холоним: Y это холоним Икс если Икс является частью Y (строительство это холоним окно)
  • Глаголы
    • гиперным: глагол Y является гиперонимом глагола Икс если деятельность Икс это (вид) Y (воспринимать является гипернимом слушать)
    • тропоним: глагол Y это тропоним глагола Икс если деятельность Y делается Икс каким-то образом (шепелявить это тропоним говорить)
    • логическое следствие: глагол Y влечет за собой Икс если делая Икс вы должны делать Y (спать влечет за собой храпеть)
    • условия согласования: глаголы с общим гипернимом (шепелявить и кричать)

Эти семантические отношения сохраняются между всеми членами связанных синсетов. Отдельные члены синсета (слова) также могут быть связаны лексическими отношениями. Например, (в одном смысле) существительное «директор» связано (в одном смысле) с глаголом «прямой», от которого оно образовано, посредством «морфосемантической» связи.

Функции морфологии программного обеспечения, распространяемого с базой данных, пытаются вывести лемма или же корень форма слово с ввода пользователя. Неправильные формы хранятся в списке, и поиск «съел» вернет, например, «есть».

Структура знаний

И существительные, и глаголы организованы в иерархии, определяемые гиперным или же ЭТО отношения. Например, в одном смысле слова собака находится по гиперонимной иерархии; слова на том же уровне представляют членов синсета. Каждый набор синонимов имеет уникальный индекс.

  • собака, домашняя собака, Canis familis
    • собачий, псовый
      • плотоядное животное
        • плацентарный, плацентарное млекопитающее, эвтерианское млекопитающее, человеческое млекопитающее
          • млекопитающее
            • позвоночное, черепное
              • хордовый
                • животное, живое существо, зверь, животное, существо, фауна
                  • ...

На верхнем уровне эти иерархии организованы в 25 "деревьев" для начинающих для существительных и 15 для глаголов (называемых лексикографические файлы на уровне обслуживания). Все они связаны с уникальным синсетом для новичков, "сущностью". Иерархия существительных намного глубже иерархии глаголов.

Прилагательные не организованы в иерархические деревья. Вместо этого два «центральных» антонима, таких как «горячий» и «холодный», образуют бинарные полюса, в то время как «спутниковые» синонимы, такие как «дымящийся» и «холодный», соединяются со своими соответствующими полюсами через отношения «подобия». Таким образом прилагательные можно представить как «гантели», а не как «деревья».

Психолингвистические аспекты

Первоначальной целью проекта WordNet было создание лексической базы данных, которая соответствовала бы теориям семантической памяти человека, разработанным в конце 1960-х годов. Психологические эксперименты показали, что говорящие организовали свои знания концепций экономическим, иерархическим образом. Время поиска, необходимое для доступа к концептуальным знаниям, казалось, напрямую связано с количеством иерархий, которые говорящему необходимо «пройти», чтобы получить доступ к знаниям. Таким образом, докладчики могли быстрее проверить, что канарейки могут петь потому что канарейка - певчая птица, но потребовалось немного больше времени, чтобы убедиться, что канарейки могут летать (где им нужно было получить доступ к понятию «птица» на вышестоящем уровне) и еще больше времени для проверки у канареек есть кожа (требуется поиск на нескольких уровнях гипонимии, вплоть до «животного»).[7]Хотя такие психолингвистический эксперименты и лежащие в их основе теории подвергались критике, часть организации WordNet согласуется с экспериментальными данными. Например, аномическая афазия выборочно влияет на способность говорящих создавать слова из определенной семантической категории, иерархии WordNet. Антонимные прилагательные (центральные прилагательные WordNet в структуре гантелей) встречаются гораздо чаще, чем случайность, и этот факт, как было обнаружено, справедлив для многих языков.

Как лексическая онтология

WordNet иногда называют онтологией - настойчивое заявление, которого не делают его создатели. Отношения гипероним / гипоним среди синсетов существительных можно интерпретировать как отношения специализации между концептуальными категориями. Другими словами, WordNet можно интерпретировать и использовать как лексический онтология в Информатика смысл. Однако такую ​​онтологию следует исправить перед использованием, поскольку она содержит сотни основных семантических несоответствий; например, есть: (i) общие специализации для исключительных категорий и (ii) избыточность в иерархии специализаций. Более того, преобразование WordNet в лексическую онтологию, используемую для представления знаний, обычно также должно включать (i) различение отношений специализации на subtypeOf и экземпляр отношения, и (ii) присвоение интуитивно понятных уникальных идентификаторов каждой категории. Хотя такие исправления и преобразования были выполнены и задокументированы как часть интеграции WordNet 1.7 в совместно обновляемую базу знаний WebKB-2,[8] большинство проектов, претендующих на повторное использование WordNet для приложений, основанных на знаниях (как правило, для поиска информации, ориентированного на знания), просто повторно используют его напрямую.

WordNet также был преобразован в формальную спецификацию с помощью гибридной восходящей и нисходящей методологии для автоматического извлечения ассоциативных отношений из WordNet и интерпретации этих ассоциаций в терминах набора концептуальных отношений, формально определенных в Базовая онтология DOLCE.[9]

В большинстве работ, в которых утверждается, что WordNet интегрирован в онтологии, содержание WordNet не просто исправлялось, когда это казалось необходимым; вместо этого WordNet был сильно переинтерпретирован и обновлен по мере необходимости. Так было, когда, например, была реструктурирована онтология верхнего уровня WordNet.[10] согласно OntoClean основанный на подходе, или когда WordNet использовался в качестве основного источника для построения низших классов онтологии SENSUS.

Ограничения

Наиболее широко обсуждаемое ограничение WordNet (и связанных ресурсов, таких как ImageNet ) заключается в том, что некоторые из семантические отношения больше подходят для конкретных концепций, чем для абстрактных концепций.[11] Например, легко создать отношения гипонимов / гиперонимов, чтобы зафиксировать, что "хвойное дерево "это тип"дерево "," дерево "- это разновидность"растение ", а" растение "- это разновидность"организм ", но трудно разделить эмоции, такие как" страх "или" счастье ", на столь же глубокие и четко определенные гипонимные / гипернимальные отношения.

Многие концепции WordNet специфичны для определенных языков, и наиболее точное соответствие между языками составляет 94%.[12] Синонимы, гипонимы, меронимы и антонимы встречаются на всех языках, где есть WordNet, но другие семантические отношения зависят от языка.[13] Это ограничивает взаимодействие между языками. Однако это также делает WordNet ресурсом для выделения и изучения различий между языками, поэтому это не обязательно ограничение для всех случаев использования.

WordNet не включает информацию о этимология или произношение слов, и он содержит только ограниченную информацию об использовании. WordNet нацелен на охват большинства повседневных слов и не включает в себя много предметной терминологии.

WordNet - это наиболее часто используемый компьютерный лексикон английского языка для значение смысла слова (WSD), задача, направленная на присвоение контекстно-зависимых значений (то есть членов синсета) словам в тексте.[14] Однако утверждалось, что WordNet кодирует слишком мелкие смысловые различия. Эта проблема не позволяет системам WSD достичь уровня производительности, сопоставимого с производительностью людей, которые не всегда соглашаются, когда сталкиваются с задачей выбора смысла из словаря, который соответствует слову в контексте. Проблема детализации решена путем предложения кластеризация методы, которые автоматически группируют похожие значения одного и того же слова.[15][16][17]

Оскорбительный контент

WordNet включает слова, которые можно воспринимать как уничижительный или оскорбительный.[18] Толкование слова может изменение с течением времени и между социальными группами, поэтому WordNet не всегда может определить слово как "уничижительный "или" оскорбительный "по отдельности. Поэтому люди, использующие WordNet, должны применять свои собственные методы для определения оскорбительных или уничижительных слов.

Однако это ограничение справедливо и для других лексических ресурсов, таких как словари и тезаурусы, которые также содержат уничижительный и оскорбительные слова. Некоторые словари указывают слова, которые уничижительные, но не включают все контексты, в которых слова могут быть приемлемыми или оскорбительными для различных социальных групп. Поэтому люди, использующие словари, должны применять свои собственные методы для выявления всех оскорбительных слов.

Лицензированные и открытые сети WordNets

Некоторые сети слов были впоследствии созданы для других языков. В опросе 2012 года перечислены сети слов и их доступность.[19] Стремясь распространить использование WordNets, глобальное сообщество WordNet медленно перелицензировало свои WordNet на открытый домен, где исследователи и разработчики могут легко получить доступ и использовать WordNets в качестве языковых ресурсов для предоставления онтологический и лексический знания в Обработка естественного языка задачи.

Открытый многоязычный WordNet[20] обеспечивает доступ к открытая лицензия Wordnet на разных языках, все они связаны с Princeton Wordnet of English (PWN). Цель состоит в том, чтобы упростить использование сетей слов на нескольких языках.

Приложения

WordNet использовался для ряда целей в информационных системах, включая словесная неоднозначность, поиск информации, автоматическая классификация текста, автоматическое резюмирование текста, машинный перевод и даже автоматическое создание кроссвордов.

Обычно WordNet используется для определения сходство между словами. Были предложены различные алгоритмы, в том числе измерение расстояния между словами и наборами синхросигналов в структуре графа WordNet, например, путем подсчета числа ребер среди наборов синхросигналов. Интуиция подсказывает, что чем ближе два слова или синсета, тем ближе их значение. Ряд алгоритмов подобия слов на основе WordNet реализован в Perl пакет под названием WordNet :: Similarity,[21] и в Python пакет называется НЛТК.[22] Другие более сложные методы подобия на основе WordNet включают ADW,[23] чья реализация доступна в Ява. WordNet также можно использовать для связывания других словарей.[24]

Интерфейсы

Принстон ведет список связанных проектов[25] который включает ссылки на некоторые из широко используемых интерфейсы прикладного программирования доступен для доступа к WordNet с использованием различных языков программирования и сред.

Связанные проекты и расширения

WordNet подключен к нескольким базам данных Семантическая сеть. WordNet также часто повторно используется через сопоставления между наборами синтаксиса WordNet и категориями из онтологий. Чаще всего отображаются только категории верхнего уровня WordNet.

Глобальная ассоциация WordNet

Глобальная ассоциация WordNet (GWA)[26] это общественная некоммерческая организация, которая предоставляет платформу для обсуждения, обмена и соединения сетей Word для всех языков мира. GWA также способствует стандартизации сетей слов в разных языках, чтобы обеспечить единообразие при перечислении синсетов в человеческих языках. GWA ведет список сетей слов, разработанных по всему миру.[27]

Другие языки

  • Арабский WordNet:[28][29] WordNet для арабского языка.
  • Арабская онтология, лингвистическая онтология, которая имеет ту же структуру, что и wordnet, и сопоставлена ​​с ней.
  • Проект BalkaNet[30] разработал WordNets для шести европейских языков (болгарский, чешский, греческий, румынский, турецкий и сербский). Для этого проекта был разработан бесплатный редактор WordNet на основе XML. Этот редактор - VisDic - больше не находится в активной разработке, но все еще используется для создания различных WordNets. Его преемник, DEBVisDic, является клиент-серверным приложением и в настоящее время используется для редактирования нескольких WordNets (голландский в проекте Cornetto, польский, венгерский, несколько африканских языков, китайский).
  • BulNet болгарская версия WordNet, разработанная на кафедре компьютерной лингвистики Институт болгарского языка, Болгарская академия наук.[31]
  • CWN (китайский Wordnet или 中文 詞彙 網路) поддерживается Национальный Тайваньский университет.[32]
  • В EuroWordNet проект[33] создал WordNets для нескольких европейских языков и связал их вместе; однако они не доступны в свободном доступе. Проект Global Wordnet пытается координировать создание и связывание «сетей слов» для всех языков.[34] Oxford University Press, издатель Оксфордский словарь английского языка, озвучил планы по созданию собственного онлайн-конкурента WordNet.[нужна цитата ]
  • FinnWordNet - это финская версия WordNet, куда были переведены все статьи оригинального английского WordNet.[35]
  • GermaNet - это немецкая версия WordNet, разработанная Тюбингенским университетом.[36]
  • В IndoWordNet[37] представляет собой связанную лексическую базу знаний из словарных сетей 18 запланированных языков Индии, а именно, Ассамский, Bangla, Бодо, Гуджарати, хинди, Каннада, Кашмири, Конкани, Малаялам, Meitei (Манипури), Маратхи, Непальский, Одиа, Пенджаби, санскрит, Тамильский, телугу и Урду.
  • JAWS (просто еще одно подмножество WordNet), еще одна французская версия WordNet[38] построено с использованием Викисловаря и семантических пространств
  • WordNet Bahasa: WordNet для малайского и индонезийского языков, разработанный Наньянский технологический университет.
  • Малаялам WordNet, разработан Кочинский университет науки и технологий.[39]
  • Многоязычный центральный репозиторий (MCR) интегрируется в одну и ту же структуру EuroWordNet - словесные сети от испанского, каталонского, баскского, галисийского и португальского языков до английского.[40]
  • Проект MultiWordNet,[41] многоязычный WordNet, нацеленный на создание итальянского WordNet, строго согласованного с Princeton WordNet.
  • OpenDutchWordNet,[42] - голландская лексико-семантическая база данных.
  • OpenWN-PT - это бразильская португальская версия оригинальной WordNet, свободно доступная для загрузки по лицензии CC-BY-SA.[43]
  • plWordNet[44] это польская версия WordNet, разработанная Вроцлавский технологический университет.
  • PolNet[45] это польская версия WordNet, разработанная Университет Адама Мицкевича в Познани (распространяется по лицензии CC BY-NC-ND 3.0).

Такие проекты, как BalkaNet и EuroWordNet, сделали возможным создание автономных сетей слов, связанных с исходной. Одним из таких проектов стал русский WordNet под патронатом Петербургский государственный университет путей сообщения[46] под руководством С.А.Яблонского[47] или Русснет[48] к Санкт-Петербургский государственный университет

  • UWN - это автоматически созданная многоязычная лексическая база знаний, расширяющая WordNet и охватывающая более миллиона слов на многих разных языках.[49]
  • WOLF (WordNet Libre du Français), французская версия WordNet.[50]

Связанные данные

  • BabelNet,[51] очень большой многоязычный семантическая сеть с миллионами концепций, полученных путем интеграции WordNet и Википедии с использованием алгоритма автоматического сопоставления.
  • В СУМО онтология[52] произвел сопоставление между всеми синсетами WordNet (включая существительные, глаголы, прилагательные и наречия), и СУМО классы. Последнее добавление сопоставлений предоставляет ссылки на все более конкретные термины в онтологии уровня MI (MILO), которая расширяет SUMO.
  • OpenCyc,[53] открытый онтология и база знаний повседневных знаний здравого смысла содержит 12 000 терминов, связанных с наборами синонимов WordNet.
  • DOLCE,[54] является первым модулем библиотеки фундаментальных онтологий WonderWeb (WFOL). Эта верхняя онтология была разработана в свете строгих онтологических принципов, вдохновленных философской традицией, с четкой ориентацией на язык и познание. OntoWordNet[55] является результатом экспериментального согласования верхнего уровня WordNet с DOLCE. Предполагается, что такое согласование могло бы привести к «онтологически подслащенному» WordNet, который должен быть концептуально более строгим, когнитивно прозрачным и эффективно используемым в нескольких приложениях.
  • DBpedia,[56] база данных структурированной информации связана с WordNet.
  • В Расширенный WordNet[57] это проект в Техасский университет в Далласе который направлен на улучшение WordNet путем семантического анализа глосс, что делает информацию, содержащуюся в этих определениях, доступной для систем автоматической обработки знаний. Он находится в свободном доступе под лицензией, аналогичной WordNet.
  • В GCIDE проект создал словарь, объединив всеобщее достояние Словарь Вебстера с 1913 г. с некоторыми определениями WordNet и материалами, предоставленными добровольцами. Он был выпущен под авторское лево лицензия GPL.
  • ImageNet представляет собой базу данных изображений, организованную в соответствии с иерархией WordNet (в настоящее время только существительные), в которой каждый узел иерархии представлен сотнями и тысячами изображений.[58] В настоящее время в среднем на каждый узел приходится более 500 изображений.
  • BioWordnet, биомедицинское расширение Wordnet, было прекращено из-за проблем со стабильностью версий.[59]
  • WikiTax2WordNet, соответствие между наборами синтаксиса WordNet и Категории Википедии.[60]
  • WordNet ++, ресурс, включающий более миллионов семантических границ, собранных из Википедии, и соединяющих пары наборов синсетов WordNet.[61]
  • SentiWordNet, ресурс для поддержки приложений сбора мнений, полученных путем пометки всех наборов синхронизации WordNet 3.0 в соответствии с их предполагаемой степенью положительности, отрицательности и нейтральности.[62]
  • ColorDict - это Android-приложение для мобильных телефонов, использующих базу данных Wordnet и другие, такие как Wikipedia.
  • UBY-LMF база данных из 10 ресурсов, включая WordNet.

Связанные проекты

  • FrameNet - это лексическая база данных, которая имеет некоторое сходство с WordNet и относится к ней.
  • Фреймворк лексической разметки (LMF) - это стандарт ISO, указанный в ISO / TC37 чтобы определить общую стандартизированную структуру для построения лексиконов, включая WordNet. Подмножество LMF для Wordnet называется Wordnet-LMF. В рамках проекта KYOTO был создан экземпляр.[63]
  • Программа UNL это проект под эгидой ООН направлена ​​на консолидацию лексико-семантических данных многих языков для использования в машинном переводе и извлечение информации системы.

Распределения

База данных WordNet распространяется в виде пакета словарей (обычно в виде одного файла) для следующего программного обеспечения:

Смотрите также

Рекомендации

  1. ^ "Новости WordNet".
  2. ^ «WordNets в мире». Глобальная ассоциация WordNet. Получено 19 января 2020.
  3. ^ «Поиск WordNet - 3.1».
  4. ^ Г. А. Миллер, Р. Беквит, К. Д. Феллбаум, Д. Гросс, К. Миллер. 1990. WordNet: онлайн-лексическая база данных. Int. J. Lexicograph. 3, 4, с. 235–244.
  5. ^ «О всемирной ассоциации WordNet». Глобальный WordNet. Получено 19 января 2020.
  6. ^ «Статистика WordNet». Wordnet.princeton.edu. Получено 2018-06-22.
  7. ^ Коллинз А., Куиллиан М. Р. 1972. Эксперименты по семантической памяти и пониманию языка. В Познание в обучении и памяти. Вили, Нью-Йорк.
  8. ^ http://www.phmartin.info. «Интеграция WordNet 1.7 в WebKB-2». Webkb.org. Получено 2014-03-11.
  9. ^ Гангеми, А .; Navigli, R .; Веларди, П. (2003). Проект OntoWordNet: расширение и аксиоматизация концептуальных отношений в WordNet (PDF). Proc. Международной конференции по онтологиям, базам данных и приложениям семантики (ODBASE 2003). Катания, Сицилия (Италия). С. 820–838.
  10. ^ Oltramari, A .; Гангеми, А .; Guarino, N .; Масоло, К. (2002). Реструктуризация верхнего уровня WordNet: подход OntoClean. OntoLex'2 Workshop, онтологии и лексические базы знаний (LREC 2002). Лас-Пальмас, Испания. С. 17–26. CiteSeerX  10.1.1.19.6574.
  11. ^ Рудницкая, Ева; Бонд, Фрэнсис; Грабовский, Лукаш; Пясецки, Мацей; Пиотровский, Тадеуш (2018). «Лексический взгляд на Wordnet для отображения Wordnet». Материалы 9-й Глобальной конференции WordNet (GWC 2018): 210.
  12. ^ Бонд, Фрэнсис; Фостер, Райан (2013). «Связывание и расширение открытой многоязычной сети Wordnet» (PDF). Труды 51-го ежегодного собрания Ассоциации компьютерной лингвистики: 1352–1362. Получено 20 января 2020.
  13. ^ Феллбаум, Кристиана; Фоссен, Пик (2012). «Проблемы для многоязычной сети Word». Языковые ресурсы и оценка. 46 (2): 313–326. Дои:10.1007 / s10579-012-9186-z. S2CID  10117946.
  14. ^ Р. Навильи. Устранение неоднозначности смысла слов: обзор, Опросы ACM Computing, 41 (2), 2009, стр. 1–69
  15. ^ Э. Агирре, О. Лопес. 2003. Кластеризация WordNet Word Senses. В Proc. конференции «Последние достижения естественного языка» (РАНЛП’03), Боровец, Болгария, стр. 121–130.
  16. ^ Р. Навильи. Значимая кластеризация смыслов помогает повысить эффективность устранения многозначности слов, В Proc. 44-го ежегодного собрания Ассоциации компьютерной лингвистики совместно с 21-й Международной конференцией по компьютерной лингвистике (COLING-ACL 2006), Сидней, Австралия, 17–21 июля 2006 г., стр. 105–112.
  17. ^ Р. Сноу, С. Пракаш, Д. Джурафски, А. Я. Нг. 2007 г. Учимся объединять смыслы слов, В Proc. совместной конференции 2007 г. по эмпирическим методам обработки естественного языка и компьютерному изучению естественного языка (EMNLP-CoNLL), Прага, Чешская Республика, стр. 1005–1014.
  18. ^ Джулия Кэрри Вонг. 2019. Вирусное селфи-приложение ImageNet Roulette казалось забавным, пока не назвали меня расистским оскорблением. Хранитель
  19. ^ Фрэнсис Бонд и Кёнхи Пайк 2012a. Обзор Wordnet и их лицензий. В материалах 6-й Глобальной конференции WordNet (GWC 2012). Мацуэ. 64–71
  20. ^ «Открытая многоязычная Wordnet». compling.hss.ntu.edu.sg. Получено 10 апреля 2018.
  21. ^ "Тед Педерсен - WordNet :: Сходство". D.umn.edu. 2008-06-16. Получено 2014-03-11.
  22. ^ НЛП с использованием Python NLTK /
  23. ^ М. Т. Пилехвар, Д. Юргенс и Р. Навильи. Выровнять, устранить неоднозначность и пройти: единый подход к измерению семантического сходства.. Proc. 51-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL 2013), София, Болгария, 4–9 августа 2013 г., стр. 1341-1351.
  24. ^ Ballatore A, et al. (2014). «Связывание географических словарей через WordNet». Летопись ГИС. 20 (2): 73–84. arXiv:1404.5372. Bibcode:2014arXiv1404.5372B. Дои:10.1080/19475683.2014.904440. S2CID  9246582.
  25. ^ «Связанные проекты - WordNet - Связанные проекты». Wordnet.princeton.edu. 2014-01-06. Получено 2018-06-22.
  26. ^ Всемирная ассоциация WordNet (04.02.2010). "globalwordnet.org". globalwordnet.org. Получено 2014-03-11.
  27. ^ «Wordnet в мире». Архивировано из оригинал на 2011-10-21.
  28. ^ Блэк У., Элкатеб С., Родригес Х., Алхалифа М., Фоссен П., Пиз А., Бертран М., Феллбаум К., (2006) Арабский проект WordNet, Материалы LREC 2006
  29. ^ Лахсен Абуенур, Карим Бузубаа, Паоло Россо (2013) Об оценке и улучшении охвата арабского WordNet и удобства использования, Языковые ресурсы и оценка 47 (3) стр. 891–917
  30. ^ Д. Туфис, Д. Кристя, С. Стаму. 2004 г. Балканет: цели, методы, результаты и перспективы. Общий обзор. Румынский J. Sci. Tech. Сообщить. (Специальный выпуск о Балканете), 7 (1-2), стр. 9–43.
  31. ^ "Булнет". dcl.bas.bg. Получено 2015-05-07.
  32. ^ Официальная страница китайского Wordnet (中文 詞彙 網路) в Национальном Тайваньском университете
  33. ^ П. Фоссен, Под ред. 1998. EuroWordNet: многоязычная база данных с лексико-семантическими сетями. Клувер, Дордрехт, Нидерланды.
  34. ^ «Всемирная ассоциация WordNet». Globalwordnet.org. 2010-02-04. Получено 2014-01-05.
  35. ^ «FinnWordNet - Финский WordNet - Департамент общего языкознания». Ling.helsinki.fi. Получено 2014-01-05.
  36. ^ «ГермаНет». Sfs.uni-tuebingen.de. Получено 2014-03-11.
  37. ^ Пушпак Бхаттачарья, IndoWordNet, Конференция по разработке лексических ресурсов 2010 г. (LREC 2010), Мальта, май 2010 г.
  38. ^ К. Мутон, Г. де Шалендар. 2010 г.JAWS: еще одно подмножество WordNet. В Proc. ТАЛН 2010.
  39. ^ Интернет сайт
  40. ^ http://adimen.si.ehu.es/web/mcr/
  41. ^ Э. Пианта, Л. Бентивогли, К. Жирарди. 2002 г. MultiWordNet: разработка согласованной многоязычной базы данных. В Proc. 1-й Международной конференции по Global WordNet, Майсур, Индия, стр. 21–25.
  42. ^ http://wordpress.let.vupr.nl/odwn/
  43. ^ "arademaker / openWordnet-PT - GitHub". Github.com. Получено 2014-01-05.
  44. ^ http://plwordnet.pwr.wroc.pl/wordnet/ официальная веб-страница
  45. ^ http://www.ltc.amu.edu.pl/polnet/ официальная веб-страница
  46. ^ "Русский WordNet". Pgups.ru. Получено 2014-01-05.
  47. ^ Балкова Валентина; Сухоногов Андрей; Яблонский, Сергей (2003). «Русский WordNet от UML-нотации до реализации базы данных в сети / интранете» (PDF). Протокол GWC 2004: 31–38. Получено 12 марта 2017.
  48. ^ "РуссНет: Главная страница". Project.phil.spbu.ru. Получено 2014-03-11.
  49. ^ «UWN: на пути к универсальной многоязычной сети Word - D5: базы данных и информационные системы (Институт информатики им. Макса Планка)». Mpi-inf.mpg.de. 2011-08-14. Получено 2014-01-05.
  50. ^ С. Бенуа, Ф. Дарья. 2008 г. Создание бесплатной французской сети Wordnet из многоязычных ресурсов. В Proc. Онтолекс 2008, Марракеш, Марок.
  51. ^ Р. Навильи, С. П. Понцетто. BabelNet: создание очень большой многоязычной семантической сети. Proc. 48-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL 2010), Упсала, Швеция, 11–16 июля 2010 г., стр. 216–225.
  52. ^ А. Пиз, И. Найлз, Дж. Ли. 2002 г. Предлагаемая верхняя объединенная онтология: большая онтология для семантической сети и ее приложений.. В Proc. семинара AAAI-2002 по онтологиям и семантической сети, Эдмонтон, Канада.
  53. ^ С. Рид и Д. Ленат. 2002 г. Отображение онтологий в цикле. В Proc. семинара конференции AAAI 2002 по онтологиям для семантической сети, Эдмонтон, Канада, 2002 г.
  54. ^ Масоло, К., Борго, С., Гангеми, А., Гуарино, Н., Ольтрамари, А., Шнайдер, Л.С. 2002 г. Результат работы WonderWeb D17. Библиотека основополагающих онтологий WonderWeb и онтология DOLCE. Отчет (вер. 2.0, 15.08.2002)
  55. ^ Гангеми, А., Гуарино, Н., Масоло, К., Ольтрамари, А. 2003 Подсластить WordNet с помощью DOLCE. В AI Magazine 24 (3): Fall 2003, стр. 13–24.
  56. ^ К. Бизер, Дж. Леманн, Г. Кобиларов, С. Ауэр, К. Беккер, Р. Цыганиак, С. Хеллманн, DBpedia - точка кристаллизации Сети данных. Веб-семантика, 7 (3), 2009, стр. 154–165.
  57. ^ С. М. Харабагиу, Г. А. Миллер, Д. И. Молдован. 1999 г. WordNet 2 - Морфологически и семантически расширенный ресурс. В Proc. семинара ACL SIGLEX: Стандартизация лексических ресурсов, стр. 1–8.
  58. ^ Дж. Дэн, В. Донг, Р. Сочер, Л. Ли, К. Ли, Л. Фей-Фэй. ImageNet: крупномасштабная база данных иерархических изображений. В Proc. конференции IEEE 2009 г. по компьютерному зрению и распознаванию образов
  59. ^ М. Попрат, Э. Байсвангер, У. Хан. 2008 г. Построение BIOWORDNET с использованием форматов данных WORDNET и программной инфраструктуры WORDNET - история неудач. В Proc. семинара по программной инженерии, тестированию и обеспечению качества для обработки естественного языкаС. 31–39.
  60. ^ С. Понцетто, Р. Навильи. Крупномасштабное картографирование таксономии для реструктуризации и интеграции Википедии, В Proc. 21-й Международной совместной конференции по искусственному интеллекту (IJCAI 2009), Пасадена, Калифорния, 14–17 июля 2009 г., стр. 2083–2088.
  61. ^ С. П. Понцетто, Р. Навильи. Богатые знаниями устранение неоднозначности, конкурирующие с контролируемыми системами. В Proc. 48-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL), 2010 г., стр. 1522–1531.
  62. ^ С. Баччанелла, А. Эсули и Ф. Себастьяни. SentiWordNet 3.0: расширенный лексический ресурс для анализа настроений и сбора мнений. В материалах 7-й конференции по языковым ресурсам и оценке (LREC'10), Валлетта, MT, 2010, стр. 2200–2204.
  63. ^ Пик Фоссен, Клаудиа Сориа, Моника Монакини: Wordnet-LMF: стандартное представление многоязычных сетей Word, в Структура лексической разметки LMF, отредактированный Гилом Франкопуло ISTE / Wiley 2013 (ISBN  978-1-84821-430-9)
  64. ^ "Вавилон WordNet". Babylon.com. Получено 2014-03-11.
  65. ^ "GoldenDict - Обзор / словари на Sourceforge.net". Sourceforge.net. 2010-12-01. Получено 2014-01-05.
  66. ^ "Lingoes WordNet". Lingoes.net. 2007-11-16. Получено 2014-03-11.

внешняя ссылка