TimeML - TimeML - Wikipedia

TimeML представляет собой набор правил для электронного кодирования документов. Он определен в спецификации TimeML версии 1.2.1.[1] разработан несколькими усилиями, в значительной степени возглавляемыми Лабораторией лингвистики и вычислений в Университет Брандейса.

Цель проекта TimeML - создать стандартную язык разметки временных событий в документе. TimeML решает четыре проблемы, связанные с разметкой событий, включая отметку времени (с помощью которой событие привязывается ко времени), упорядочивание событий по отношению друг к другу, рассуждение с помощью контекстно не заданных временных выражений и рассуждения о продолжительности событий и их результатах.[2]

История

TimeML была концептуализирована в 2002 году во время семинаров TERQAS (Распознавание времени и событий для систем ответов на вопросы), организованных профессором Джеймс Пустеевский из Университет Брандейса. Семинары TERQAS направлены на решение проблемы улучшения естественного языка ответ на вопрос системы для ответов на временные вопросы о событиях и объектах в новостных статьях. Во время этих семинаров была определена версия 1.0 TimeML, и в качестве иллюстрации был создан корпус TimeBank.

В 2003 году семинары TANGO (TimeML Annotation Graphical Organizer) разработали инструмент для графических аннотаций для TimeML.

Проект TARSQI (Системы временной осведомленности и рассуждений для интерпретации вопросов) в настоящее время разрабатывает алгоритмы, которые маркируют события и выражения времени в текстах на естественном языке, привязывают их во времени и упорядочивают их.

Версии

Согласно официальному сайту TimeML, в настоящее время существует три версии языка спецификации TimeML, хотя, по слухам, существуют и другие версии.[3]

Версия 1.1

TimeML версии 1.1 был выпущен в 2004 году.

Версия 1.2

TimeML версии 1.2 был выпущен в 2004 году, вскоре после выпуска версии 1.1.

Версия 1.2.1

В 2005 году была определена версия 1.2.1. В язык было внесено несколько изменений, которые описаны в руководстве TimeML версии 1.2.1 как таковые:

  • Атрибут nf_morph, который был частью MAKEINSTANCE, был изменен на pos (часть речи), а элементы PRESPART, PASTPART и INFINITIVE в nf_morph перераспределены на время.
  • Необязательный атрибут синтаксиса был добавлен в SLINK, ALINK и TLINK. Синтаксис может использоваться для хранения CDATA, но обычно используется только программами аннотации для хранения данных, которые привели к созданию тега.
  • Необязательный атрибут комментария был добавлен ко всем элементам TimeML, чтобы дать аннотаторам (людям) место для размещения наблюдений за аннотированным текстом.

ISO-TimeML

ISO-TimeML был представлен на рассмотрение ISO в качестве стандарта в августе 2007 года. Затем он был пересмотрен, принят на голосование и утвержден в качестве международного стандарта к марту 2009 года.

Члены рабочей группы

  • Джеймс Пустеевский из Университет Брандейса (Редактор)
  • Роб Гайзаускас
  • Грэм Кац
  • Боб Ингрия
  • Хосе Кастаньо
  • Розер Саури
  • Анна Румшиски
  • Индерджит Мани
  • Антонио Санфилиппо
  • Драгомир Радев
  • Патрик Хэнкс
  • Марк Верхаген
  • Бет Сундхейм
  • Андреа Сетцер
  • Фрэнк Шильдер
  • Джерри Хоббс


Теги TimeML

Следующие теги определены спецификацией TimeML версии 1.2.1.[4]

TIMEML

Тег TIMEML похож на корневой тег в XML-документе. Он заявляет, что остальная часть документа, окруженная тегом TIMEML, закодирована с помощью тегов TimeML.

МЕРОПРИЯТИЕ

Тег EVENT используется для аннотирования тех элементов в тексте, которые отмечают описываемые им семантические события. Синтаксически СОБЫТИЯ обычно являются глаголами, хотя номиналы событий, такие как «сбой» в «... убит в результате сбоя», также будут аннотированы как СОБЫТИЯ. Тег EVENT также используется для аннотирования подмножества состояний в документе. Это подмножество состояний включает те, которые являются временными или явно отмечены как участвующие во временных отношениях. Дополнительные сведения см. В руководстве по аннотациям TimeML.

TIMEX3

Тег TIMEX3 в основном используется для разметки явных временных выражений, таких как время, даты, продолжительность и т. Д. Он смоделирован на теге TIMEX Setzer (2001), а также на TIDES (Ferro, et al. (2002)) TIMEX2. тег. Поскольку он отличается как по структуре атрибутов, так и по использованию, казалось, что лучше дать ему отдельное имя, которое раскрывает его наследие и в то же время указывает на то, что он отличается от своих предков.

СИГНАЛ

Тег SIGNAL представляет собой временной сигнал. Это любые функциональные слова, которые предполагают определенные временные отношения. Примеры СИГНАЛОВ: когда, в, после.

TLINK

TLINKS, или временные ссылки, устанавливают отношения между двумя или более событиями с целью упорядочения их во времени. Временные ссылки являются наиболее распространенными, поскольку они показывают, как элементы TimeML (события и временные выражения) связаны друг с другом во времени.

ССЫЛКА

События, отмеченные как АСПЕКТУАЛЬНЫЕ, представляют собой АЛИНК или Аспективную ссылку. Эти ссылки довольно просты, поскольку они возникают только тогда, когда аспектное событие имеет другое событие в качестве аргумента. Например, в предложении «Мария завершила марафон» «завершена» - это аспектное событие, а марафон - событие.

SLINK

Как и ALINK, SLINK (подчиненные ссылки) вводятся только определенными классами событий, а именно сообщениями о событиях, интенсиональными событиями (I ACTION и I STATE) и событиями восприятия. Кроме того, эти события должны подчинять себе другое событие, принимая его в качестве аргумента. SLINK используются в основном для того, чтобы дать возможность задавать временные отношения даже для событий, которые могли или не могли произойти. Например, сообщение о таких событиях, как "сказал", представляет собой СВИДЕТЕЛЬСТВЕННЫЙ СЛИНК. Рассмотрим предложение «Он даже не остановился», - сказал один свидетель ». Здесь событие« стоп »подчиняется« упомянутому »событию.

Рекомендации

  1. ^ "Спецификация TimeML 1.2.1". Timeml.org. Получено 2017-02-28.
  2. ^ "Язык спецификации TimeML". Timeml.org. 2003-05-27. Получено 2017-02-28.
  3. ^ [1]
  4. ^ [2]

внешняя ссылка