Сеть путаницы


Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

Сеть путаницы (иногда называемая сетью путаницы слов или неофициально известная как колбаса ) — это метод обработки естественного языка , который объединяет выходные данные нескольких систем автоматического распознавания речи или машинного перевода . [1] [2] Сети путаницы представляют собой простые линейные ориентированные ациклические графы.со свойством, что каждый путь от начального узла к конечному узлу проходит через все остальные узлы. Набор слов, представленных ребрами между двумя узлами, называется набором путаницы. В машинном переводе определяющей характеристикой сетей путаницы является то, что они допускают множественные неоднозначные входные данные, откладывая принятие решений о переводе до более поздних этапов обработки. [3] [4] Этот подход используется в программном обеспечении для машинного перевода с открытым исходным кодом Moses [5] и проприетарном API перевода в IBM Bluemix Watson . [6]

Пример сети путаницы

использованная литература

  1. ^ Рости, Антти-Вейкко И.; Чжан, Бинг; Мацукас, Спирос; Шварц, Ричард (2008). «Пошаговое согласование гипотез для построения сетей путаницы с применением комбинации систем машинного перевода» . Материалы третьего семинара по статистическому машинному переводу . СтатМТ '08. Страудсбург, Пенсильвания, США: Ассоциация компьютерной лингвистики: 183–186. ISBN 9781932432091.
  2. ^ Матусов, Евгений; Уэффинг, Никола; Ней, Герман (2006). «Вычисление согласованного перевода из нескольких систем машинного перевода с использованием расширенного выравнивания гипотез». В проц. EACL . CiteSeerX 10.1.1.483.5417 . 
  3. ^ Хоанг, Хиу (2007). «Факторные модели перевода». В материалах совместной конференции 2007 г. по эмпирическим методам обработки естественного языка и компьютерного изучения естественного языка (EMNLP-CoNLL : 868–876. CiteSeerX 10.1.1.80.3572 . 
  4. ^ Коэн, Филипп; Хоанг, Хиу; Береза, Александра; Каллисон-Берч, Крис; Федерико, Марчелло; Бертольди, Никола; Коуэн, Брук; Шен, Уэйд; Моран, Кристин (2007). «Моисей: набор инструментов с открытым исходным кодом для статистического машинного перевода» . Материалы 45-го ежегодного собрания ACL по интерактивным плакатам и демонстрационным сессиям . АКЛ '07. Страудсбург, Пенсильвания, США: Ассоциация компьютерной лингвистики: 177–180. дои : 10.3115/1557769.1557821 . S2CID 794019 . 
  5. ^ "Моисей - Моисей / ConfusionNetworks" . www.statmt.org . Проверено 9 ноября 2017 г. .
  6. ^ «Служба IBM® Speech to Text предоставляет справочник по API | IBM Watson Developer Cloud» . www.ibm.com . Архивировано из оригинала 09.11.2017 . Проверено 9 ноября 2017 г. . Значение достоверности, которое является нижней границей для идентификации гипотезы как возможной альтернативы слову (также известное как «сети путаницы»). Альтернативное слово рассматривается, если его достоверность больше или равна порогу. Укажите вероятность от 0 до 1 включительно. Никакие альтернативные слова не вычисляются, если вы опускаете параметр.


Получено с https://en.wikipedia.org/w/index.php?title=Confusion_network&oldid=1030944106 "