Определение ключевых слов (или, проще говоря, определение слов ) - это проблема, которая исторически впервые была определена в контексте обработки речи . [1] [2] При обработке речи определение ключевых слов связано с идентификацией ключевых слов в высказываниях.
Определение ключевых слов также определяется как отдельная, но связанная проблема в контексте обработки изображений документа. [1] При обработке изображений документа обнаружение ключевых слов - это проблема поиска всех экземпляров слова запроса, которые существуют в отсканированном изображении документа, без его полного распознавания.
В обработке речи
Первые работы по поиску ключевых слов появились в конце 1980-х годов. [2]
Особым случаем определения ключевых слов является обнаружение слова пробуждения (также называемого горячим словом), используемое персональными цифровыми помощниками, такими как Alexa или Siri, для «пробуждения», когда их имя произносится.
В Соединенных Штатах Агентство национальной безопасности использует определение ключевых слов по крайней мере с 2006 года. [3] Эта технология позволяет аналитикам искать в больших объемах записанных разговоров и изолировать упоминания подозрительных ключевых слов. Записи можно индексировать, а аналитики могут выполнять запросы к базе данных, чтобы найти интересующие разговоры. IARPA профинансировало исследование по выявлению ключевых слов в программе Babel .
Некоторые алгоритмы, используемые для этой задачи:
- Раздвижное окно и модель мусора
- K-лучшая гипотеза
- Итеративное декодирование Витерби
- Сверточная нейронная сеть на коэффициентах кепстра Mel-частоты [4]
В обработке изображений документа
Определение ключевых слов при обработке изображений документа можно рассматривать как пример более общей проблемы поиска изображений на основе содержимого (CBIR). По заданному запросу цель состоит в том, чтобы получить наиболее релевантные экземпляры слов в коллекции отсканированных документов. [1] Запрос может быть текстовой строкой (поиск ключевых слов по строкам) или изображением слова (поиск ключевых слов по примеру).
Рекомендации
- ^ a b c Джотис, AP; Sfikas, G .; Gatos, B .; Нику, К. (2017). «Обзор методов определения слов в изображениях документов». Распознавание образов . 68 : 310–332. DOI : 10.1016 / j.patcog.2017.02.023 .
- ^ а б Rohlicek, J .; Russell, W .; Roukos, S .; Гиш, Х. (1989). «Непрерывное скрытое марковское моделирование для распознавания слов независимо от говорящего». Труды 14-й Международной конференции IEEE по акустике, речи и обработке сигналов (ICASSP) . 1 : 627–630.
- ^ Фрумкин, Дан. «КОМПЬЮТЕРЫ СЛУШАЮТ» . Перехват . Проверено 20 июня 2015 года .
- ^ Сайнат, Тара Н и Парада, Каролина (2015). "Сверточные нейронные сети для поиска ключевых слов с малым размером". Шестнадцатая ежегодная конференция Международной ассоциации речевой коммуникации . arXiv : 1711.00333 .CS1 maint: несколько имен: список авторов ( ссылка )