Логотип и значок Microsoft Translator, который отображается рядом с заголовком в веб-браузере. | |
Тип сайта | Машинный перевод |
---|---|
Доступно в | 94 языка и языковые разновидности |
Владелец | Microsoft |
URL | www |
Постановка на учет | Необязательный |
Текущее состояние | Активный |
Microsoft Translator - это многоязычная облачная служба машинного перевода, предоставляемая Microsoft . Microsoft Translator интегрирован во множество продуктов для потребителей, разработчиков и предприятий; включая приложения Bing , Microsoft Office , SharePoint , Microsoft Edge , Microsoft Lync , Yammer , Skype Translator , Visual Studio , Internet Explorer и Microsoft Translator для Windows , Windows Phone , iPhone и Apple Watch , а также Androidтелефон и Android Wear .
Microsoft Translator также предлагает перевод текста и речи с помощью облачных сервисов для предприятий. Услуги по переводу текста через API-интерфейс переводчика варьируются от бесплатного уровня, поддерживающего два миллиона символов в месяц, до платных уровней, поддерживающих миллиарды символов в месяц. [1] Перевод речи через службы Microsoft Speech предлагается в зависимости от времени аудиопотока.
По состоянию на февраль 2021 года сервис поддерживает 87 языковых систем [Обновить]. Он также поддерживает 12 систем перевода речи, которые в настоящее время поддерживают функцию живого общения Microsoft Translator, Skype Translator и Skype для рабочего стола Windows, а также приложения Microsoft Translator для iOS и Android. [2]
Развитие [ править ]
История [ править ]
Первая версия системы машинного перевода Microsoft была разработана в период с 1999 по 2000 год в рамках Microsoft Research . Эта система была основана на семантических структурах предикатов-аргументов, известных как логические формы (LF), и была основана на функции исправления грамматики, разработанной для Microsoft Word . Эта система в конечном итоге использовалась для перевода всей базы знаний Microsoft на испанский, французский, немецкий и японский языки. [3]
Подход Microsoft к машинному переводу, как и большинство современных систем машинного перевода, « управляется данными »: [4] вместо того, чтобы полагаться на написание явных правил для перевода естественного языка , алгоритмы обучаются понимать и интерпретировать переведенные параллельные тексты , что позволяет им автоматически научиться переводить новый текст на естественном языке. Опыт Microsoft с системой LF привел непосредственно к системе перевода древовидных схем, которая упростила LF до деревьев зависимостей и, в конечном итоге, до модели шаблона заказа, значительно увеличив скорость и позволив включать новые целевые языки. [ необходима цитата ]
Ориентированный на потребителя сайт переводов, известный как Bing Translator (ранее известный как переводчик Windows Live), был запущен в 2007 году и предоставляет бесплатные переводы текста и веб-сайтов в Интернете. Текст переводится непосредственно на веб-странице Bing Translator, а веб-сайты переводятся с помощью инструментов Bingual Viewer. [ необходима цитата ]
В 2011 году услуга была расширена за счет включения многочисленных продуктов Microsoft Translator через облачный интерфейс программирования приложений , который поддерживает продукты, доступные как для обычных, так и для корпоративных пользователей. Дополнительная возможность перевода речи была представлена в марте 2016 года. [5]
В мае 2018 года было представлено обновление API. Эта новая версия предлагала нейронный машинный перевод в качестве метода перевода по умолчанию. В дополнение к переводу в новой версии есть транслитерация и двуязычный словарь для поиска слов, альтернативных переводов и просмотра примеров в предложениях. [6]
Речевой перевод был интегрирован в службы Microsoft Speech в сентябре 2018 года, обеспечивая непрерывный перевод речи, преобразование речи в текст и преобразование текста в речь. [ необходима цитата ]
Методология перевода и исследования [ править ]
Microsoft Translator использует машинный перевод для мгновенного перевода с одного естественного языка на другой. Эта система основана на четырех различных областях компьютерного обучения, показанных ниже. [4]
Тип обучения | Влияние на перевод |
---|---|
Нейронные сети Нейронный машинный перевод | Нейронные сети пытаются имитировать работу мозга при переводе с одного языка на другой. На высоком уровне перевод нейронной сети работает в два этапа. Во-первых, на первом этапе моделируется слово, которое необходимо перевести, на основе контекста этого слова (и его возможных переводов) в рамках всего предложения. Во-вторых, нейронная сеть переводит эту словесную модель (не само слово, а модель построенных из него нейронных сетей) в контексте предложения на другой язык. [7] Нейронный машинный перевод - это метод перевода по умолчанию для Microsoft Translator API. |
SMT на основе синтаксиса | Синтаксический перевод основан на идее перевода синтаксических единиц, а не слова или строки слов. Microsoft использовала SMT на основе синтаксиса для перевода большей части своих компьютерных текстов с английского на несколько целевых языков. Текущие исследования в этой области позволили улучшить флексию слов и порядок слов. |
SMT на основе фраз | В SMT на основе фраз машина изучает соответствие между языками из параллельного текста без помощи лингвистов. Это обеспечивает лучший перевод за меньшее время, чем другие системы. |
Выравнивание битекстовых слов | Системы SMT полагаются на существующие переведенные данные, чтобы научиться автоматически переводить с одного языка на другой. Для обучения систем решающее значение имеет определение соответствий слов (или выравнивания слов). Microsoft разработала как дискриминационный [8], так и генеративный [9] подходы к выравниванию слов, что привело к более быстрым алгоритмам и более высокому качеству и переводам. |
Языковое моделирование | В языковом моделировании используются модели n-грамм для построения понятных переводов на целевой язык. Это гарантирует, что перевод на выходе будет плавным и читаемым. |
Точность [ править ]
Качество результатов машинного перевода Microsoft Translator оценивается с помощью метода, называемого оценкой BLEU . [10]
BLEU (Bilingual Evaluation Understudy) - это алгоритм оценки качества текста, переведенного с одного естественного языка на другой. Качество считается соответствием продукции машины и продукции человека. BLEU был одним из первых показателей, который достиг высокой корреляции с человеческими оценками качества, и остается одним из самых популярных автоматизированных и недорогих показателей.
Поскольку машинный перевод основан на статистических алгоритмах, а не на людях-переводчиках, автоматические переводы, которые он производит, не всегда полностью точны. Microsoft Translator внедрил в свои продукты различные функции обратной связи, такие как платформа совместных переводов, чтобы пользователи могли предлагать альтернативные переводы. Эти альтернативные переводы затем интегрируются в алгоритмы Microsoft Translator для улучшения будущих переводов.
В ноябре 2016 года Microsoft Translator представила перевод с использованием глубоких нейронных сетей на девяти из наиболее загруженных языков, включая все языки речи и японский. Нейронные сети обеспечивают лучший перевод, чем стандартное статистическое машинное обучение. [11]
Основные продукты [ править ]
Microsoft Translator - это облачный API, интегрированный во многие продукты и услуги Microsoft. [12] API-интерфейс переводчика может использоваться сам по себе и может быть настроен для использования в среде перед публикацией или после публикации. API, доступный по подписке, бесплатен для небольших объемов переводов и взимается в соответствии с многоуровневой системой оплаты за объемы, превышающие два миллиона символов в месяц. [1] Остальные основные продукты доступны бесплатно.
Облачный перевод Microsoft Translator [ править ]
Microsoft Translator - это облачная служба автоматического перевода, которую можно использовать для создания приложений, веб-сайтов и инструментов, требующих многоязыковой поддержки.
- Перевод текста: API текста переводчика Microsoft можно использовать для перевода текста на любой из языков, поддерживаемых службой.
- Перевод речи: Microsoft Translator интегрирован в службы Microsoft Speech, которые представляют собой сквозной API на основе REST, который можно использовать для создания приложений, инструментов или любого решения, требующего многоязычного перевода речи. Перевод речи в речь доступен на любой из языков разговора или с любого из них, а перевод речи в текст доступен с языков разговора на любую из языковых систем, поддерживаемых Microsoft Translator.
Пользовательский переводчик [ править ]
Пользовательский переводчик - это функция служб Microsoft Translator, которая позволяет предприятиям, разработчикам приложений и поставщикам языковых услуг создавать системы нейронного перевода, которые понимают терминологию, используемую в их собственном бизнесе и отрасли. Настроенные переводы затем могут быть доставлены в существующие приложения, рабочие процессы и веб-сайты с помощью обычного вызова Microsoft Translator API. Пользовательский переводчик можно использовать при переводе текста с помощью Microsoft Translator Text API и при переводе речи с помощью служб Microsoft Speech. [13]
Прямая трансляция [ править ]
Персональный универсальный переводчик, который позволяет до 500 человек вести беседы в реальном времени, на нескольких устройствах, на нескольких языках и переводить их лично. [14] Эта функция в настоящее время бесплатна и доступна в приложениях Microsoft Translator (Android, iOS или Windows) и из браузера по адресу: http://translator.microsoft.com .
Центр переводчиков Microsoft [ править ]
Microsoft Translator Hub позволяет предприятиям и поставщикам языковых услуг создавать свои собственные системы перевода, которые понимают терминологию, характерную для бизнеса и отрасли. [15] Hub также можно использовать вместе с CTF, что позволяет администраторам утверждать результаты CTF и добавлять их непосредственно в Hub. Microsoft Translator Hub доступен только для статистического машинного перевода и не может использоваться с новейшей версией Microsoft Translator API.
Hub также использовался для сохранения языка, позволяя сообществам создавать свои собственные системы языкового перевода для сохранения языка и культуры. [16] Hub использовался для создания систем перевода для таких языков, как хмонг, майя, непальский и валлийский.
Набор инструментов для многоязычных приложений (MAT) [ править ]
Набор инструментов для многоязычных приложений (MAT) - это интегрированный инструмент Visual Studio, который позволяет разработчикам оптимизировать рабочие процессы локализации своих приложений для Windows, Windows Phone и настольных компьютеров. [17] MAT улучшает локализацию средств управления файлами, поддержки перевода и редактирования.
Веб-приложение Microsoft Translator [ править ]
Этот раздел необходимо обновить . Февраль 2019 г. ) ( |
Тип сайта | Статистический машинный перевод |
---|---|
Доступно в | см. ниже |
Владелец | Microsoft |
URL | www .bing .com / переводчик / |
Коммерческий | Нет |
Постановка на учет | Необязательный |
Запущен | 3 июня 2009 г . | (как Live Search Translator )
Текущее состояние | Активный |
Microsoft Translator (ранее Live Search Translator , Windows Live Translator и Bing Translator ) [18] - это портал переводов, доступный для пользователей, предоставляемый Microsoft как часть своих служб Bing для перевода текстов или целых веб-страниц на разные языки. Все пары переводов поддерживаются Microsoft Translator, платформой статистического машинного перевода и веб-сервисом, разработанным Microsoft Research в качестве внутреннего программного обеспечения для перевода. Две пары транслитерации (между китайским (упрощенным) и китайским (традиционным))) предоставляются командой Microsoft Windows International. [19]
По состоянию на май 2020 [Обновить]года Bing Translator предлагает переводы в 73 различных языковых системах. [20]
Bing Translator может переводить фразы, введенные пользователем, или получать ссылку на веб-страницу и переводить ее полностью. При переводе всей веб-страницы или когда пользователь выбирает «Перевести эту страницу» в результатах поиска Bing , отображается двуязычная программа просмотра, которая позволяет пользователям просматривать исходный текст веб-страницы и перевод параллельно, поддерживая синхронизацию выделения, прокрутку, и навигация. [21] Доступны четыре раскладки двуязычного средства просмотра: [21]
- Бок о бок
- Верх и низ
- Оригинал с переводом при наведении
- Перевод с наведением оригинала
Bing Translator интегрируется с несколькими другими продуктами Microsoft. Ниже приводится таблица продуктов, в которые Bing Translator интегрирован или может быть интегрирован:
Интегрируется в | Среднее значение интеграции |
---|---|
Мгновенные ответы Bing | Уже интегрировано |
Internet Explorer | Accelerator для Internet Explorer 8 или выше |
Поддерживаемые продукты [ править ]
Предлагая основные продукты, Microsoft Translator поддерживает функции перевода многих продуктов Microsoft на потребительском и корпоративном уровнях. Эти продукты можно разделить на три категории [22]: продукты для связи, Microsoft Office и приложения.
Связь [ править ]
| Microsoft Office [ править ]
| Приложения [ править ]
|
Устаревшие продукты [ править ]
Система совместных переводов (CTF) [ править ]
Платформа совместных переводов (CTF) - это расширение Microsoft Translator API, которое позволяет улучшить переведенный текст после публикации. [23] Используя CTF, читатели имеют возможность предлагать переводы, альтернативные тем, которые предоставляет API, или голосовать за ранее предложенные альтернативы. Затем эта информация передается в API для улучшения будущих переводов.
Веб-виджет переводчика [ править ]
Веб-виджет переводчика - это инструмент перевода, который можно добавить на веб-страницы, вставив на страницу заранее определенный фрагмент кода JavaScript. [24] Веб-виджет предоставляется Microsoft бесплатно и поддерживает как предварительную публикацию настроенных переводов с помощью Translator Hub, так и улучшения после публикации с использованием Collaborative Translations Framework.
Поддерживаемые языки [ править ]
По состоянию на февраль 2021 [Обновить]года Microsoft Translator поддерживает 94 языка и языковые разновидности. [2] Список поддерживаемых языков доступен на веб-сайте Microsoft Translator, а также может быть получен программно через облачные службы. [25]
- африкаанс
- албанский
- Амхарский
- арабский
- Армянский
- Ассамский
- Азербайджанский
- Бенгальский
- Боснийский
- болгарский
- Кантонский
- Каталонский
- Упрощенный китайский)
- Китайский традиционный)
- хорватский
- Чешский
- Датский
- Дари
- нидерландский язык
- английский
- эстонский
- Фиджийский
- Филиппинский
- Финский
- Французский
- Французский (Канада) [26]
- Галицкий
- Грузинский
- Немецкий
- Греческий
- Гуджарати
- Гаитянский креольский
- иврит
- хинди
- Хмонг Доу
- Венгерский
- исландский
- индонезийский
- Инуктитут
- Ирландский
- Итальянский
- Японский
- Каннада
- Кхмерский
- Клингон
- Клингонский (plqaD)
- Корейский
- Курдский (Центральный) (Сорани)
- Курдский (Северный) (Курманджи)
- Лаосский
- Латышский
- Литовский
- Люксембургский
- македонский
- Малагасийский
- малайский
- Малаялам
- Мальтийский
- маори
- Маратхи
- Мьянма
- маори
- Непальский
- норвежский язык
- Одиа
- Пушту
- Персидский
- Польский
- Португальский (Бразилия)
- Португальский (Португалия)
- Панджаби (гурмукхи)
- Керетаро Отоми
- румынский
- русский
- Самоанский
- Сербский (кириллица)
- Сербский (латиница)
- словацкий
- словенский
- испанский
- суахили
- Шведский
- Таитянский
- Тамильский
- телугу
- Тайский
- Тигринья
- Тонга
- турецкий
- украинец
- Урду
- вьетнамский
- валлийский
- Юкатек Майя
Партнеры сообщества [ править ]
Microsoft Translator взаимодействует с партнерами по сообществу, чтобы увеличить количество языков и улучшить общее качество языкового перевода. Ниже приведен список партнеров сообщества, с которыми работал Microsoft Translator. [27]
- Партнеры по языку хмонг
- Университет Джавахарлала Неру
- Национальное собрание Уэльса
- Тильда
- Переводчики без границ
Кроме того, Microsoft объединилась с Институтом клингонского языка , который продвигает искусственно созданный язык, клингонский , который используется в вымышленной вселенной « Звездного пути », созданной Paramount и CBS Studios. Microsoft Translator поддерживает клингонов с мая 2013 года. [28]
См. Также [ править ]
- Apertium
- Babel Fish (прекращено; перенаправляет на основной сайт Yahoo!)
- Bing
- Сравнение приложений машинного перевода
- переводчик Google
- Jollo (снято с производства)
- Список программного обеспечения Microsoft
- Переводчик Skype
- SYSTRAN
- Яндекс переводчик
Ссылки [ править ]
- ^ a b «Azure Data Marketplace - переводчик Microsoft» . Архивировано из оригинала на 2018-02-06 . Проверено 8 декабря 2014 .
- ^ a b «Переводчик Microsoft - языки» .
- ^ "Microsoft Research - Арул Менезес" .
- ^ a b «Исследования Microsoft - Машинный перевод» .
- ^ «Microsoft Translator обеспечивает непрерывный перевод речи для всех с помощью первого в мире API перевода речи» .
- ^ «Microsoft Translator - переводчик текста API» . Архивировано из оригинала на 2019-09-02.
- ^ "Что такое перевод на основе нейронной сети?" .
- ^ «Дискриминационная структура для двуязычного выравнивания слов» (PDF) . Архивировано из оригинального (PDF) 20 июля 2008 года.
- ^ "Использование зависимых от слов переходных моделей в выравнивании слов на основе HMM для статистического машинного перевода" (PDF) .
- ^ «Microsoft Translator Hub: обсуждение оценки BLEU» .
- ^ «Microsoft Translator запускает переводы на основе нейронной сети для всех языков речи» .
- ^ «Microsoft Translator - Продукты» .
- ^ «Переводчик Microsoft - Настройка» .
- ^ «Живая функция Microsoft Translator» .
- ^ «Microsoft Translator-Translator Hub» .
- ^ «Где язык встречается со всем миром: Центр переводчиков Microsoft» .
- ^ «Microsoft Translator - набор инструментов для многоязычных приложений» .
- ^ Антониу, Григорис; Гробельник, Марко; Симперл, Елена; Парсия, Биджан; Плексоусакис, Димитрис; де Линхер, Питер; Пан, Джефф З. (2011). Семантическая сеть: исследования и приложения . Берлин: Springer Science + Business Media . п. 341. ISBN. 9783642210334.
- ^ "Перевод на базе .... Microsoft Translator!" . Официальный блог команды Microsoft Translator (и Bing Translator) . Корпорация Майкрософт. 8 сентября 2008 . Проверено 21 октября 2010 года .
- ^ «Microsoft Translator- FAQ» .
- ^ a b «О переводчике Bing» . Переводчик Bing . Microsoft . Проверено 20 декабря 2014 .
- ^ «Microsoft Translator - Продукты» .
- ^ "Microsoft Translator - платформа совместных переводов" .
- ^ "Microsoft Translator - веб-виджет переводчика" .
- ^ "Коды языков переводчика" .
- ^ https://news.microsoft.com/en-ca/2020/10/20/introduction-canadian-french-to-microsoft-translator/
- ^ «Переводчик Microsoft - Партнеры сообщества» .
- ^ «Новая опция переводчика Bing позволяет переводить ... клингонский» .
Внешние ссылки [ править ]
- «Бесплатный переводчик текста или Интернета» . microsofttranslator .com .( авторское право Microsoft)
- «Использование содержимого, защищенного авторским правом Microsoft» .
- «Переводчик для Bing. Помощь и часто задаваемые вопросы» . Архивировано 12 августа 2018 года . Проверено 12 августа 2018 года .
Разработка ПО [ править ]
- «Блог группы переводчиков Microsoft» .
- «Переводчик Microsoft в сети разработчиков Microsoft» .