Временная аннотация - это исследование того, как автоматически добавлять семантическую информацию о времени в документы на естественном языке . Он играет важную роль в обработке естественного языка и компьютерной лингвистике .
О
Временная аннотация включает применение семантической аннотации к документу. Важные стандарты временной аннотации включают TimeML , ISO-TimeML и TIDES . [1] Эти стандарты обычно включают аннотации для некоторых или всех временных выражений (или временных индексов ), событий, временных отношений, временных сигналов [2] и типов временных отношений.
В текстах на естественном языке события могут быть связаны со временем; например, они могут начинаться или заканчиваться в определенное время. События также связаны с другими событиями, например, происходящими до или после них. Мы называем эти отношения временными отношениями. Типизация временных отношений классифицирует отношения между двумя аргументами и является важной и сложной подзадачей определения всей временной информации в документе. Алгебра интервалов Аллена - это одна из схем типов временных отношений. Подходы к разработке правил и машинного обучения к временной аннотации оказались успешными, хотя достижение высокой производительности при типизации временных отношений остается сложной задачей.
Приложения
Успешная временная аннотация позволяет системам узнавать, когда факты, изложенные в текстах, верны, строить временные рамки [3], извлекать планы и обнаруживать упоминания об изменениях. Это имеет применение во многих областях, такие как извлечение информации , цифровая история , [4] обработки социальных медиа и клинический анализ текста .
Оценка
Серия задач TempEval устанавливает общую задачу временной аннотации и запускалась в SemEval три раза, привлекая системные записи со всего мира. [5] [6] [7] Первоначально задача заключалась только в определении типов временных отношений. В TempEval-2 и -3 это расширено, чтобы включить аннотацию событий и timex. Кроме того, в 2012 году общая задача клинической оценки i2b2 представляла собой упражнение с временной аннотацией, которое вызвало большой интерес. [8]
Смотрите также
дальнейшее чтение
- Богураев Б. и Андо Р.К. (2005), TimeML-совместимый анализ текста для темпорального мышления . Труды IJCAI.
- Дерчинский, Л. (2013), Определение типов временных отношений в дискурсе , докторская диссертация, Шеффилдский университет .
- Пустеевский и др. (2003), Корпус TimeBank , Труды конференции Corpus Linguistics.
- Пустеевский и др. (2005), Язык спецификации TimeML , в «Язык времени». ISBN 9780199268542 .
- Уззаман, Н. и Аллен, Дж. (2010), Извлечение событий и временных выражений из необработанного текста: первый шаг к системе с учетом времени , Международный журнал семантических вычислений 4 (4).
Рекомендации
- ^ Ферро, Л. (2005). «Стандарт TIDES 2005 для аннотации временных выражений» (PDF) . Технический отчет MITRE Corporation .
- ^ Дерчинский, Л. (2011). «Корпоративное исследование временных сигналов». Труды конференции Corpus Linguistics . arXiv : 1203,5066 .
- ^ Цзи, Хэн (2013). «Решение проблем представления, аннотации и классификации для популяции временной базы знаний». Журнал знаний и информационных систем .
- ^ Цибульская, А (2011). «Извлечение исторического события из текста». Материалы 5-го семинара ACL-HLT по языковым технологиям для культурного наследия, социальных и гуманитарных наук .
- ^ Верхаген, Марк (2007). «Семевал-2007, задание 15: Идентификация темпоральных отношений». Материалы семинара по семантическому оцениванию .
- ^ Верхаген, Марк (2010). «Семевал-2010 задача 13: Темпевал-2». Материалы семинара по семантическому оцениванию .
- ^ УзЗаман, Н (2013). «Семевал-2013, задание 1: Темпевал-3». Материалы семинара по семантическому оцениванию .
- ^ Солнце, Вт (2013). «Оценка временных отношений в клиническом тексте: 2012 i2b2 Challenge» . Журнал Американской ассоциации медицинской информатики . 20 (5): 806–13. DOI : 10.1136 / amiajnl-2013-001628 . PMC 3756273 . PMID 23564629 .
Внешние ссылки
- TimeML.org
- THYME проект
- Pheme проект