Речевой перевод - это процесс, с помощью которого разговорные разговорные фразы мгновенно переводятся и произносятся вслух на другом языке. Это отличается от перевода фраз , когда система переводит только фиксированный и конечный набор фраз, которые были вручную введены в систему. Технология речевого перевода позволяет общаться носителям разных языков. Таким образом, он имеет огромную ценность для человечества с точки зрения науки, межкультурного обмена и глобального бизнеса.
Как это работает
Система перевода речи обычно объединяет следующие три программные технологии: автоматическое распознавание речи (ASR), машинный перевод (MT) и синтез голоса (TTS).
Человек, говорящий на языке А, говорит в микрофон, и модуль распознавания речи распознает высказывание. Он сравнивает ввод с фонологической моделью, состоящей из большого корпуса речевых данных от нескольких говорящих. Затем ввод преобразуется в строку слов с использованием словаря и грамматики языка A на основе массивного корпуса текста на языке A.
Затем модуль машинного перевода переводит эту строку. Ранние системы заменяли каждое слово соответствующим словом на языке B. Современные системы не используют дословный перевод, а скорее принимают во внимание весь контекст ввода для создания соответствующего перевода. Сгенерированное высказывание перевода отправляется в модуль синтеза речи , который оценивает произношение и интонацию, соответствующие строке слов, на основе корпуса речевых данных на языке B. Формы сигналов, соответствующие тексту, выбираются из этой базы данных, и синтез речи подключается и выводит их. [1]
История
В 1983 году корпорация NEC продемонстрировала перевод речи в качестве концептуальной выставки на выставке ITU Telecom World (Telecom '83). [2]
В 1999 году консорциум C-Star-2 продемонстрировал речевой перевод на 5 языков, включая английский, японский, итальянский, корейский и немецкий. [3] [4]
Функции
Помимо проблем, связанных с переводом текста, он также должен иметь дело с особыми проблемами, возникающими при переводе речи в речь, включая несогласованность разговорного языка, меньшее количество грамматических ограничений разговорного языка, нечеткие границы слов разговорного языка, исправление ошибки распознавания речи и несколько дополнительных входов. Кроме того, преобразование речи в речь также имеет свои преимущества по сравнению с переводом текста, включая менее сложную структуру разговорной речи и меньший словарный запас в разговорной речи. [ необходима цитата ]
Исследования и разработки
Исследования и разработки постепенно перешли от относительно простого перевода к более сложному. Для поддержки развития технологии перевода речи были организованы международные оценочные семинары . Они позволяют исследовательским институтам одновременно сотрудничать и соревноваться друг с другом. Концепция этого семинара - это своего рода конкурс: организаторы предоставляют общий набор данных, а участвующие исследовательские институты создают системы, которые оцениваются. Таким образом продвигаются эффективные исследования.
Я еждународный семинар по разговорному языку перевода ( IWSLT ), организованный C-STAR, международный консорциум для проведения исследований по переводу речи, проводится с 2004 года «Каждый год, число участвующих учреждений возрастает, и он стал одним из ключевых мероприятие по исследованию перевода речи ». [1]
Стандарты
Когда во многих странах начнутся исследования и разработки перевода речи, необходимо будет стандартизировать интерфейсы и форматы данных, чтобы обеспечить взаимную совместимость систем. Международные совместные исследования поддерживаются консорциумами по переводу речи (например, международным консорциумом C-STAR для совместных исследований перевода речи и A-STAR для Азиатско-Тихоокеанского региона). Они были основаны как «международные совместные исследовательские организации для разработки форматов двуязычных корпусов, которые необходимы для продвижения исследований и разработки этой технологии ... и для стандартизации интерфейсов и форматов данных для подключения модуля перевода речи на международном уровне». [1]
Приложения
Сегодня системы перевода речи используются во всем мире. Примеры включают медицинские учреждения, школы, полицию, отели, розничные магазины и фабрики. Эти системы применимы везде, где для общения используется разговорный язык. Популярным приложением является Jibbigo , работающее в автономном режиме.
Проблемы и перспективы на будущее
В настоящее время технология перевода речи доступна в виде продукта, который мгновенно переводит многоязычные разговоры в произвольной форме. Эти системы мгновенно переводят непрерывную речь. Проблемы, связанные с выполнением этого, включают преодоление зависящих от говорящего вариаций стиля речи или произношения - это проблемы, которые необходимо решить, чтобы обеспечить высококачественный перевод для всех пользователей. Более того, системы распознавания речи должны уметь устранять внешние факторы, такие как акустический шум или речь других говорящих при реальном использовании систем перевода речи.
По той причине, что пользователь не понимает целевой язык, когда используется речевой перевод, "должен быть предоставлен метод для пользователя, чтобы проверить правильность перевода, с помощью таких средств, как перевод его обратно на язык пользователя". [1] Чтобы достичь цели по устранению языкового барьера во всем мире, необходимо поддерживать несколько языков. Это требует речевых корпусов, двуязычных корпусов и корпусов текстов для каждого из примерно 6000 языков, которые, как говорят, существуют сегодня на нашей планете.
Поскольку сбор корпусов является чрезвычайно дорогостоящим, сбор данных из Интернета был бы альтернативой обычным методам. «Вторичное использование новостей или других средств массовой информации, опубликованных на нескольких языках, было бы эффективным способом улучшить качество перевода речи». Однако «действующий закон об авторском праве не принимает во внимание вторичное использование, такое как эти типы корпусов», и, следовательно, «его необходимо будет пересмотреть, чтобы сделать его более гибким». [1]
Смотрите также
Рекомендации
- ^ a b c d e «Преодоление языкового барьера с помощью технологии речевого перевода» Сатоши, Накамура в журнале Science & Technology Trends - Ежеквартальный обзор № 31, апрель 2009 г.
- ^ NEC / 021219-1. "NEC Global - Пресс-релиз" . www.nec.co.jp . Проверено 23 сентября 2017 .
- ^ https://www.npr.org/templates/story/story.php?storyId=1054389 Национальное общественное радио
- ^ "Система перевода речи с японского на английский: ATR-MATRIX" Такедзава, Моримото, Сагисака, Кэмпбелл, Иида, Сугая, Йоку, Ямамото в материалах Международной конференции по обработке разговорной речи 1998 г.