GermaNet - GermaNet
Эта статья слишком полагается на Рекомендации к основные источники.Ноябрь 2011 г.) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
GermaNet это семантическая сеть для немецкий язык. Это относится существительные, глаголы, и прилагательные семантически путем группировки лексических единиц, выражающих одно и то же понятие, в синсеты и определив семантический отношения между этими синсетами.[1] GermaNet предоставляется бесплатно для академического использования после подписания лицензии. GermaNet имеет много общего с английским WordNet и его можно рассматривать как онлайн тезаурус или легкий онтология. GermaNet был разработан и поддерживается в Тюбингенский университет с 1997 г. в составе исследовательской группы по общей и компьютерной лингвистике. Он был интегрирован в EuroWordNet, многоязычная лексико-семантическая база данных.[2]
База данных
Содержание
GermaNet разделяет лексическое пространство на набор концептов, связанных семантическими отношениями. Семантическое понятие моделируется синсет. Synset - это набор слов (называемых лексическими единицами), в котором все слова имеют одинаковое или почти одинаковое значение. Таким образом, синсет - это набор синонимов, сгруппированных под одним определением или «глоссом».
В дополнение к глоссу синсеты помечены своей синтаксической функцией и сопровождаются примерами предложений для каждого отдельного значения в синсете.[3]Как и в WordNet, для каждой категории слов семантическое пространство делится на ряд семантические поля тесно связаны с основными узлами семантической сети: Орт, или "местоположение", Körper, или "тело" и т. д.[2]
Начиная с версии 15.0 (выпуск в мае 2020 г.) GermaNet содержит:[2]
- Синсеты: 144113
- Лексические единицы: 185000
- Литералы: 169521
- Концептуальные отношения: 157921
- Лексические отношения (без синонимии): 12203
- Разделенные соединения: 98905
- Записи межъязыкового индекса (ILI): 28564
- Описаний смысла викисловаря: 29548
Формат
Все данные GermaNet хранятся в PostgreSQL реляционная база данных. Схема базы данных соответствует внутренней структуре GermaNet: есть таблицы для хранения наборов синтаксических данных, лексических единиц, концептуальных и лексических отношений и т. Д.[3] Данные GermaNet распространяются как в этом формате базы данных, так и в виде XML файлы. В данных XML два типа файлов, один для наборов данных, а другой для отношений, представляют все данные, доступные в базе данных GermaNet.[4]
Интерфейсы
Есть программные библиотеки и API доступны для Ява, Python, JavaScript, и Perl.[5][6] Эти программы распространяются под лицензии на бесплатное программное обеспечение и обеспечить легкий доступ ко всей информации в различных версиях GermaNet.
GermaNet Rover - это онлайн-приложение, которое можно использовать для поиска синсетов в GermaNet, изучения связанных с ними данных и расчета семантическое сходство пар синсетов. Он имеет визуализацию гиперным отношения и расширенные параметры фильтрации для поиска синсетов.
Лицензии
GermaNet 15.0 (выпущен в мае 2020 г.) может распространяться под одним из следующих типов: лицензионные соглашения:[7]
- Лицензионное соглашение об академических исследованиях: с целью исследования в академических учреждениях. Лицензионный сбор за академическое использование отсутствует. Лицензии не выдаются отдельным студентам, и тем, кто хочет получить лицензию, необходимо поговорить с научным консультантом.
- Лицензионное соглашение на исследования и разработки: относится к неакадемическим учреждениям и исследовательским консорциумам. Используется исключительно для разработки технологий и внутренних исследований.
- Соглашение о коммерческой лицензии: относится к неакадемическим учреждениям и коммерческим предприятиям. Он разрешает разработку технологий и внутренние исследования, а также дает неисключительное право распространять и продавать любой производный продукт или услугу.
Альтернативы
Open-de-WordNet - это свободно доступная альтернатива GermaNet, совместимая с WordNet.[8]
Лингвистические приложения
GermaNet используется для множества приложений, в том числе:
- семантический анализ[9]
- поверхностное распознавание неявной структуры документа[9]
- составной анализ[9]
- анализ секционных предпочтений[10]
- значение смысла слова[11]
Смотрите также
- Гипоним
- Это
- Машиночитаемый словарь
- Онтология (информатика)
- Семантическая сеть
- Семантическая сеть
- Синоним Кольцо
- Таксономия
- МысльСокровище
- UBY-LMF
- Устранение неоднозначности смысла слова
Рекомендации
- ^ Петра Сторйоханн (23 июня 2010 г.). Лексико-семантические отношения: теоретические и практические аспекты. Издательская компания Джона Бенджамина. С. 165–. ISBN 978-90-272-3138-3. Получено 16 ноября 2011.
- ^ а б c «GermaNet - Введение». uni-tuebingen.de. Получено 1 октября, 2020.
- ^ а б В. Генрих, Э. Хинрихс. 2010 г. GernEdiT - Инструмент редактирования GermaNet. В: Материалы седьмой конференции по международным языковым ресурсам и оценке.
- ^ "Формат данных". Получено 1 октября, 2020.
- ^ «Приложения и инструменты». uni-tuebingen.de. Получено 1 октября, 2020.
- ^ "GermaNet :: Flat". metacpan.org. Получено 1 октября, 2020.
- ^ «Лицензии». uni-tuebingen.de. Получено 1 октября, 2020.
- ^ "GitHub - hdaSprachtechnologie / odenet: Open German WordNet". 14 ноября 2019 г.,. Получено 20 ноября, 2019 - через GitHub.
- ^ а б c Мануэла Кунце и Дитмар Рёснер. 2004. Проблемы использования GermaNet как ресурса в реальных приложениях.
- ^ Сабина Шульте им Вальде, 2004. GermaNet Synsets как селекционные предпочтения в семантической кластеризации глаголов.
- ^ Сайто и др., 2002. Оценка GermanNet: проблемы с использованием GermaNet для автоматического устранения неоднозначности.