Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Автоматизированы онлайн помощник на сайте - пример , где диалоговые системы являются основными компонентами

Диалог система , или разговорная агент ( СА ), представляет собой компьютерную система , предназначенная для общения с человеком. Диалоговые системы использовали один или несколько из текста, речи, графики, тактильных ощущений, жестов и других режимов для связи как по входному, так и по выходному каналу.

Элементы диалоговой системы не определены, потому что эта идея исследуется [ необходима цитата ] , однако они отличаются от чат-бота . [1] Типичный мастер графического интерфейса задействован в своего рода диалоге, но он включает в себя очень мало общих компонентов диалоговой системы, а состояние диалога тривиально.

Фон [ править ]

После диалоговых систем, основанных только на обработке письменных текстов, начиная с начала шестидесятых годов [2], первая диалоговая система с речью была выпущена проектом DARPA в США в 1977 году. [3] После завершения этого 5-летнего проекта некоторые европейцы проекты выпустили первую диалоговую систему, способную говорить на многих языках (также французском, немецком и итальянском). [4] Эти первые системы использовались в телекоммуникационной отрасли для предоставления различных телефонных услуг в определенных сферах, например, автоматизированного расписания и обслуживания столов для поездов.

Компоненты [ править ]

Какие наборы компонентов включены в диалоговую систему и как эти компоненты распределяют обязанности, различается от системы к системе. Принципиальным в любой диалоговой системе является диспетчер диалогов , который является компонентом, который управляет состоянием диалога и стратегией диалога. Типичный цикл действий в диалоговой системе состоит из следующих этапов: [5]

  1. Пользователь говорит, и ввод преобразуется в обычный текст распознавателем / декодером ввода системы , который может включать:
  2. Текст анализируется блоком понимания естественного языка (NLU), который может включать:
  3. Семантическая информация анализируется диспетчером диалогов , который хранит историю и состояние диалога и управляет общим потоком разговора.
  4. Обычно диспетчер диалогов связывается с одним или несколькими диспетчерами задач , которые знают конкретный домен задачи.
  5. Диспетчер диалогов производит вывод с помощью генератора вывода , который может включать:
  6. Наконец, вывод визуализируется с помощью средства визуализации вывода , которое может включать:

Диалоговые системы, основанные на текстовом интерфейсе (например, текстовый чат), содержат только этапы 2–5.

Типы систем [ править ]

Диалоговые системы делятся на следующие категории, которые перечислены здесь по нескольким параметрам. Многие категории пересекаются, и различия не могут быть четко установлены.

Системы естественного диалога [ править ]

«Естественная диалоговая система - это форма диалоговой системы, которая пытается повысить удобство использования и удовлетворенность пользователей, имитируя человеческое поведение» [6] (Berg, 2014). В нем рассматриваются особенности диалога между людьми (например, субдиалоги и смена темы) и направлена ​​на их интеграцию в диалоговые системы для взаимодействия человека с машиной. Часто (речевые) диалоговые системы требуют, чтобы пользователь адаптировался к системе, потому что система способна понимать только очень ограниченный словарный запас, не может реагировать на изменение темы и не позволяет пользователю влиять на поток диалога. Смешанная инициатива - это способ дать пользователю возможность активно участвовать в диалоге, а не только отвечать на вопросы.. Однако простого существования смешанной инициативы недостаточно для того, чтобы классифицировать ее как систему естественного диалога. Другие важные аспекты включают: [6]

  • Адаптивность системы
  • Поддержка неявного подтверждения
  • Использование проверочных вопросов
  • Возможности исправления уже предоставленной информации
  • Излишняя информативность (дайте больше информации, чем просили)
  • Поддержка отрицания
  • Понять ссылки, анализируя дискурс и анафору
  • Генерация естественного языка для предотвращения однообразных и повторяющихся запросов
  • Адаптивная формулировка с учетом ситуации
  • Социальное поведение (приветствия, такой же уровень формальности, что и пользователь, вежливость)
  • Качество распознавания и синтеза речи

Хотя большинство из этих аспектов являются вопросами многих различных исследовательских проектов, не хватает инструментов, поддерживающих разработку диалоговых систем, решающих эти темы. [7] За исключением VoiceXML, который ориентирован на интерактивные системы голосового ответа и является основой для многих систем голосового диалога в отрасли (приложения поддержки клиентов), и AIML, который известен благодаря чат-боту ALICE , ни один из них не объединяет лингвистические функции, такие как диалоги или язык. поколение. Таким образом, NADIA (исследовательский прототип) дает представление о том, как восполнить этот пробел, и сочетает в себе некоторые из вышеупомянутых аспектов, таких как создание естественного языка, адаптивная формулировка и субдиалоги.

Производительность [ править ]

Некоторые авторы измеряют производительность диалоговой системы с точки зрения процента полностью правильных предложений, сравнивая модель предложений (эта мера называется « Точность концептуальных предложений» [8] или « Понимание предложений» [4] ).

Приложения [ править ]

Диалоговые системы могут поддерживать широкий спектр приложений на предприятиях, в образовании, правительстве, здравоохранении и развлечениях. [9] Например:

  • Ответы на вопросы клиентов о продуктах и ​​услугах через веб-сайт компании или интранет-портал.
  • База знаний агента по обслуживанию клиентов : позволяет агентам вводить вопрос клиента и направлять его с ответом.
  • Управляемые продажи : облегчение транзакций путем предоставления ответов и рекомендаций в процессе продаж, особенно для сложных продуктов, продаваемых начинающим покупателям.
  • Служба поддержки : ответы на внутренние вопросы сотрудников, например, ответы на вопросы отдела кадров.
  • Навигация по веб-сайту: направление клиентов к релевантным частям сложных веб-сайтов - консьерж веб-сайта.
  • Техническая поддержка: реагирование на технические проблемы, например, диагностика проблемы с продуктом или устройством.
  • Персонализированное обслуживание: переговорные агенты могут использовать внутренние и внешние базы данных для персонализации взаимодействий, таких как ответы на вопросы об остатках на счетах, предоставление информации о портфеле, предоставление, например, информации о часто летающих пассажирах или членстве.
  • Обучение или образование: они могут давать советы по решению проблем, пока пользователь учится
  • Простые диалоговые системы широко используются для снижения нагрузки на человека в центрах обработки вызовов . В этом и других приложениях промышленной телефонии функциональные возможности, предоставляемые диалоговыми системами, известны как интерактивный голосовой ответ или IVR.

В некоторых случаях разговорные агенты могут взаимодействовать с пользователями, используя искусственные символы. Затем эти агенты называются воплощенными агентами .

Наборы инструментов и архитектуры [ править ]

Обзор текущих фреймворков, языков и технологий для определения диалоговых систем.

См. Также [ править ]

  • Избегание звонка

Ссылки [ править ]

  1. ^ Klüwer, Тина. «От чат-ботов до диалоговых систем». Разговорные агенты и взаимодействие на естественном языке: методы и эффективные практики. IGI Global, 2011. 1-22.
  2. ^ МакТир, Майкл, Зорайда Каллехас и Дэвид Гриоль, Разговорный интерфейс: разговор со смарт-устройствами , Springer, 2016.
  3. ^ Джанкарло Пирани (редактор), Расширенные алгоритмы и архитектуры для понимания речи , Vol. 1. Springer Science & Business Media, 2013.
  4. ^ a b Альберто Чарамелла, Отчет об оценке работы прототипа , Рабочий пакет солнечных часов 8000 (1993).
  5. ^ Jurafsky & Martin (2009), речь и язык. Pearson International Edition, ISBN  978-0-13-504196-3 , глава 24
  6. ^ a b Берг, Маркус М. (2014), Моделирование естественных диалогов в контексте речевой информации и систем управления , Akademische Verlagsgesellschaft AKA, ISBN 978-3-89838-508-4
  7. ^ Берг, Markus M. (2015), "Nadia: Упрощенный подход к развитию природных систем диалога", Natural Language Processing и информационные системы , Lecture Notes в области компьютерных наук, 9103 , стр 144-150,. DOI : 10.1007 / 978-3-319-19581-0_12 , ISBN 978-3-319-19580-3
  8. Бангалор, Шринивас и Майкл Джонстон. «Устойчивое понимание мультимодальных интерфейсов». Компьютерная лингвистика 35.3 (2009): 345-397.
  9. ^ Лестер, Дж .; Branting, K .; Мотт, Б. (2004), «Разговорные агенты» (PDF) , Практическое руководство по Интернет-вычислениям , Chapman & Hall

Дальнейшее чтение [ править ]

  • Уилл, Томас (2007). Создание динамического речевого диалога . VDM Verlag Dr. Müller . ISBN 978-3-8364-4990-8.