Программа DARPA TIDES


Translingual Information Detection, Extraction and Summarization (TIDES) — это программа развития технологий, финансируемая Агентством перспективных исследовательских проектов Министерства обороны США ( DARPA ), ориентированная на автоматизированную обработку и понимание языковых данных. Основная цель программы — дать возможность носителям английского языка быстро и эффективно находить и интерпретировать необходимую информацию независимо от исходного языка.

Инструменты для обнаружения, извлечения и обобщения должны работать внутри языка (одноязычно) и между языками (транслингвально), чтобы их могли использовать люди, говорящие только по-английски. Помимо разработки технологии, TIDES также исследует способы ее быстрой и недорогой адаптации к другим языкам, в том числе к языкам с ограниченными лингвистическими ресурсами. TIDES стремится интегрировать возможности компонентов вместе и с другими технологиями для создания инструментов для реальных приложений.

Хранилище расследовательских данных ФБР содержит библиотеку новостей с открытым исходным кодом, содержащую новости, собранные программой TIDES. Информация собирается с общедоступных веб-сайтов по всему миру, включая « Гаарец » , «Правду» , « Джордан Таймс» , «Жэньминь жибао» , «Вашингтон пост » и других. [1] Он использует систему обработки текста и аудио Mitre ( MiTAP ). [2]