TimeML - это набор правил для электронного кодирования документов. Он определен в спецификации TimeML версии 1.2.1 [1], разработанной несколькими усилиями, в значительной степени возглавляемыми лабораторией лингвистики и вычислений Университета Брандейса .
Цель проекта TimeML - создать стандартный язык разметки для временных событий в документе. TimeML решает четыре проблемы, связанные с разметкой событий, включая отметку времени (с помощью которой событие привязывается ко времени), упорядочивание событий по отношению друг к другу, рассуждение с помощью контекстуально заниженных временных выражений и рассуждения о продолжительности событий и их результатах. [2]
История
Концепция TimeML была разработана в 2002 году во время семинаров TERQAS (Распознавание времени и событий для систем ответов на вопросы), организованных профессором Джеймсом Пустейовским из Университета Брандейс . TERQAS Мастерские изложены для решения проблемы о том , как улучшить естественный язык вопрос отвечать на системы , чтобы ответить на вопросы о событиях и юридических лицах в новостных статьях во время на основе. Во время этих семинаров была определена версия 1.0 TimeML, и корпус TimeBank был создан в качестве иллюстрации.
В 2003 году семинары TANGO (TimeML Annotation Graphical Organizer) разработали инструмент графического аннотации для TimeML.
Проект TARSQI (Системы временной осведомленности и рассуждений для интерпретации вопросов) в настоящее время разрабатывает алгоритмы, которые маркируют события и выражения времени в текстах на естественном языке, привязывают их во времени и упорядочивают их.
Версии
Согласно официальному веб-сайту TimeML, в настоящее время существует три версии языка спецификации TimeML, хотя, по слухам, существуют и другие версии. [3]
Версия 1.1
Версия 1.1 TimeML была выпущена в 2004 году.
Версия 1.2
TimeML версии 1.2 был выпущен в 2004 году, вскоре после выпуска версии 1.1.
Версия 1.2.1
В 2005 году была определена версия 1.2.1. В язык было внесено несколько изменений, которые описаны в руководстве TimeML версии 1.2.1 как таковые:
- Атрибут nf_morph, который был частью MAKEINSTANCE, был изменен на pos (часть речи), а элементы PRESPART, PASTPART и INFINITIVE в nf_morph перераспределены на время.
- Необязательный атрибут синтаксиса был добавлен в SLINK, ALINK и TLINK. Синтаксис может использоваться для хранения CDATA, но обычно используется только программами аннотации для хранения данных, которые привели к созданию тега.
- Необязательный атрибут комментария был добавлен ко всем элементам TimeML с целью дать аннотаторам (людям) место для размещения наблюдений за аннотированным текстом.
ISO-TimeML
ISO-TimeML был представлен на рассмотрение ISO в качестве стандарта в августе 2007 года. Затем он был пересмотрен, принят на голосование и утвержден в качестве международного стандарта к марту 2009 года.
Члены рабочей группы
- Джеймс Пустеевский из Университета Брандейс (редактор)
- Роб Гайзаускас
- Грэм Кац
- Боб Ингрия
- Хосе Кастаньо
- Розер Саури
- Анна Румшиски
- Индерджит Мани
- Антонио Санфилиппо
- Драгомир Радев
- Патрик Хэнкс
- Марк Верхаген
- Бет Сундхейм
- Андреа Сетцер
- Фрэнк Шильдер
- Джерри Хоббс
Теги TimeML
Следующие теги определены спецификацией TimeML версии 1.2.1. [4]
TIMEML
Тег TIMEML похож на корневой тег в XML-документе. Он заявляет, что остальная часть документа, окруженная тегом TIMEML, закодирована с помощью тегов TimeML.
МЕРОПРИЯТИЕ
Тег EVENT используется для аннотирования тех элементов в тексте, которые отмечают описываемые им семантические события. Синтаксически СОБЫТИЯ обычно являются глаголами, хотя названия событий, такие как «сбой» в «... убит в результате сбоя», также будут аннотированы как СОБЫТИЯ. Тег EVENT также используется для аннотирования подмножества состояний в документе. Это подмножество состояний включает те, которые являются временными или явно отмечены как участвующие во временных отношениях. Дополнительные сведения см. В руководстве по аннотациям TimeML.
TIMEX3
Тег TIMEX3 в основном используется для разметки явных временных выражений, таких как время, даты, продолжительность и т. Д. Он смоделирован на основе тега TIMEX Setzer (2001), а также TIDES (Ferro, et al. (2002)) TIMEX2. тег. Поскольку он отличается как по структуре атрибутов, так и по использованию, казалось, что лучше дать ему отдельное имя, которое раскрывает его наследие и в то же время указывает на то, что он отличается от своих предков.
СИГНАЛ
Тег SIGNAL представляет собой временной сигнал. Это любые служебные слова, указывающие на определенные временные отношения. Примеры СИГНАЛОВ: когда, в, после .
TLINK
TLINKS, или временные ссылки, устанавливают отношения между двумя или более событиями с целью упорядочения их во времени. Временные ссылки являются наиболее распространенными, поскольку они показывают, как элементы TimeML (события и временные выражения) связаны друг с другом во времени.
ССЫЛКА
События, отмеченные как АСПЕКТУАЛЬНЫЕ, представляют собой АЛИНК или Аспективную ссылку. Эти ссылки довольно просты, поскольку они возникают только тогда, когда аспектное событие имеет другое событие в качестве аргумента. Например, в предложении «Мария завершила марафон» «завершена» - это аспектуальное событие, а марафон - событие.
SLINK
Как и ALINK, SLINK (подчиненные ссылки) вводятся только определенными классами событий, а именно сообщениями о событиях, интенсиональными событиями (I ACTION и I STATE) и событиями восприятия. Кроме того, эти события должны подчинять себе другое событие, принимая его в качестве аргумента. SLINK используются в основном для того, чтобы дать возможность задавать временные отношения даже для событий, которые могли или не могли произойти. Например, сообщение о таких событиях, как "сказал", представляет собой СВИДЕТЕЛЬСТВЕННЫЙ СЛИНК. Рассмотрим предложение «Он даже не остановился», - сказал один свидетель ». Здесь событие« стоп »подчиняется« упомянутому »событию.
Рекомендации
- ^ "Спецификация TimeML 1.2.1" . catalog.ldc.upenn.edu . Источник 2021-01-29 .
- ^ «Язык спецификации TimeML» . cs.brandeis.edu . Источник 2021-01-29 .
- ^ [1]
- ^ [2]