GermaNet - GermaNet

GermaNet это семантическая сеть для немецкий язык. Это относится существительные, глаголы, и прилагательные семантически путем группировки лексических единиц, выражающих одно и то же понятие, в синсеты и определив семантический отношения между этими синсетами.[1] GermaNet предоставляется бесплатно для академического использования после подписания лицензии. GermaNet имеет много общего с английским WordNet и его можно рассматривать как онлайн тезаурус или легкий онтология. GermaNet был разработан и поддерживается в Тюбингенский университет с 1997 г. в составе исследовательской группы по общей и компьютерной лингвистике. Он был интегрирован в EuroWordNet, многоязычная лексико-семантическая база данных.[2]

База данных

Содержание

GermaNet разделяет лексическое пространство на набор концептов, связанных семантическими отношениями. Семантическое понятие моделируется синсет. Synset - это набор слов (называемых лексическими единицами), в котором все слова имеют одинаковое или почти одинаковое значение. Таким образом, синсет - это набор синонимов, сгруппированных под одним определением или «глоссом».

В дополнение к глоссу синсеты помечены своей синтаксической функцией и сопровождаются примерами предложений для каждого отдельного значения в синсете.[3]Как и в WordNet, для каждой категории слов семантическое пространство делится на ряд семантические поля тесно связаны с основными узлами семантической сети: Орт, или "местоположение", Körper, или "тело" и т. д.[2]

Начиная с версии 15.0 (выпуск в мае 2020 г.) GermaNet содержит:[2]

  • Синсеты: 144113
  • Лексические единицы: 185000
  • Литералы: 169521
  • Концептуальные отношения: 157921
  • Лексические отношения (без синонимии): 12203
  • Разделенные соединения: 98905
  • Записи межъязыкового индекса (ILI): 28564
  • Описаний смысла викисловаря: 29548

Формат

Все данные GermaNet хранятся в PostgreSQL реляционная база данных. Схема базы данных соответствует внутренней структуре GermaNet: есть таблицы для хранения наборов синтаксических данных, лексических единиц, концептуальных и лексических отношений и т. Д.[3] Данные GermaNet распространяются как в этом формате базы данных, так и в виде XML файлы. В данных XML два типа файлов, один для наборов данных, а другой для отношений, представляют все данные, доступные в базе данных GermaNet.[4]

Интерфейсы

Есть программные библиотеки и API доступны для Ява, Python, JavaScript, и Perl.[5][6] Эти программы распространяются под лицензии на бесплатное программное обеспечение и обеспечить легкий доступ ко всей информации в различных версиях GermaNet.

GermaNet Rover - это онлайн-приложение, которое можно использовать для поиска синсетов в GermaNet, изучения связанных с ними данных и расчета семантическое сходство пар синсетов. Он имеет визуализацию гиперным отношения и расширенные параметры фильтрации для поиска синсетов.

Лицензии

GermaNet 15.0 (выпущен в мае 2020 г.) может распространяться под одним из следующих типов: лицензионные соглашения:[7]

  • Лицензионное соглашение об академических исследованиях: с целью исследования в академических учреждениях. Лицензионный сбор за академическое использование отсутствует. Лицензии не выдаются отдельным студентам, и тем, кто хочет получить лицензию, необходимо поговорить с научным консультантом.
  • Лицензионное соглашение на исследования и разработки: относится к неакадемическим учреждениям и исследовательским консорциумам. Используется исключительно для разработки технологий и внутренних исследований.
  • Соглашение о коммерческой лицензии: относится к неакадемическим учреждениям и коммерческим предприятиям. Он разрешает разработку технологий и внутренние исследования, а также дает неисключительное право распространять и продавать любой производный продукт или услугу.

Альтернативы

Open-de-WordNet - это свободно доступная альтернатива GermaNet, совместимая с WordNet.[8]

Лингвистические приложения

GermaNet используется для множества приложений, в том числе:

  • семантический анализ[9]
  • поверхностное распознавание неявной структуры документа[9]
  • составной анализ[9]
  • анализ секционных предпочтений[10]
  • значение смысла слова[11]

Смотрите также

Рекомендации

  1. ^ Петра Сторйоханн (23 июня 2010 г.). Лексико-семантические отношения: теоретические и практические аспекты. Издательская компания Джона Бенджамина. С. 165–. ISBN  978-90-272-3138-3. Получено 16 ноября 2011.
  2. ^ а б c «GermaNet - Введение». uni-tuebingen.de. Получено 1 октября, 2020.
  3. ^ а б В. Генрих, Э. Хинрихс. 2010 г. GernEdiT - Инструмент редактирования GermaNet. В: Материалы седьмой конференции по международным языковым ресурсам и оценке.
  4. ^ "Формат данных". Получено 1 октября, 2020.
  5. ^ «Приложения и инструменты». uni-tuebingen.de. Получено 1 октября, 2020.
  6. ^ "GermaNet :: Flat". metacpan.org. Получено 1 октября, 2020.
  7. ^ «Лицензии». uni-tuebingen.de. Получено 1 октября, 2020.
  8. ^ "GitHub - hdaSprachtechnologie / odenet: Open German WordNet". 14 ноября 2019 г.,. Получено 20 ноября, 2019 - через GitHub.
  9. ^ а б c Мануэла Кунце и Дитмар Рёснер. 2004. Проблемы использования GermaNet как ресурса в реальных приложениях.
  10. ^ Сабина Шульте им Вальде, 2004. GermaNet Synsets как селекционные предпочтения в семантической кластеризации глаголов.
  11. ^ Сайто и др., 2002. Оценка GermanNet: проблемы с использованием GermaNet для автоматического устранения неоднозначности.

внешняя ссылка