Эта статья нуждается в обновлении . Февраль 2020 г. ) ( |
Часть серии по |
Перевод |
---|
Типы |
Теория |
Технологии |
Локализация |
Институциональная |
похожие темы |
|
Google Neural Machine Translation (GNMT) - это система нейронного машинного перевода (NMT), разработанная Google и представленная в ноябре 2016 года, которая использует искусственную нейронную сеть для повышения беглости и точности Google Translate . [1] [2] [3] [4]
GNMT улучшает качество перевода, применяя метод машинного перевода на основе примеров (EBMT), при котором система «учится на миллионах примеров». [2] Предложенная GNMT архитектура системного обучения была сначала протестирована более чем на ста языках, поддерживаемых Google Translate. [2] Благодаря большой сквозной структуре система со временем учится создавать более качественные и естественные переводы. [1] GNMT может переводить целые предложения за раз, а не просто по частям. [1] Сеть GNMT может выполнять межъязыковой машинный перевод , кодируя семантику предложения, а не запоминая перевод фразы-фразы.[2] [5]
История [ править ]
Проект Google Brain был основан в 2011 году в «секретной исследовательской лаборатории Google X» [6] сотрудником Google Джеффом Дином , исследователем Google Грегом Коррадо и профессором компьютерных наук Стэнфордского университета Эндрю Нг . [7] [8] [9] Работа Нг привела к одним из крупнейших достижений в Google и Стэнфорде. [6]
В сентябре 2016 года исследовательская группа Google объявила о разработке системы нейронного машинного перевода Google (GNMT), и к ноябрю Google Translate начал использовать нейронный машинный перевод (NMT) вместо своих предыдущих статистических методов (SMT) [1] [10 ] [11] [12], который использовался с октября 2007 года, с его собственной собственной технологией SMT. [13] [14]
Система NMT Google Translate использует большую искусственную нейронную сеть, способную к глубокому обучению . [1] [2] [3] Используя миллионы примеров, GNMT улучшает качество перевода, [2] используя более широкий контекст для определения наиболее релевантного перевода. Затем результат перестраивается и адаптируется к грамматически основанному человеческому языку. [1] Предложенная GNMT архитектура системного обучения была сначала протестирована более чем на ста языках, поддерживаемых Google Translate. [2] GNMT не создавала своего собственного универсального интерлингва, а скорее была направлена на поиск общности между многими языками с использованием идей психологии и лингвистики. [15]Новый механизм перевода был впервые включен для восьми языков: на английский и французский, немецкий, испанский, португальский, китайский, японский, корейский и турецкий и обратно в 2016 году. [16] В марте 2017 года были включены три дополнительных языка: русский и хинди. и вьетнамский, а также тайский, поддержка которого была добавлена позже. [17] [18] Поддержка иврита и арабского языка была также добавлена с помощью сообщества Google Translate в том же месяце. [19] В середине апреля 2017 года компания Google в Нидерландах объявила о поддержке голландского и других европейских языков, связанных с английским. [20] В конце апреля 2017 года была добавлена дополнительная поддержка для девяти индийских языков: хинди, бенгали, маратхи, гуджарати, пенджаби, тамильского, телугу, малаялам и каннада.[21]
Оценка [ править ]
Говорят, что система GNMT представляет собой усовершенствование по сравнению с прежним переводчиком Google Translate в том смысле, что она сможет обрабатывать «нулевой перевод», то есть напрямую переводить один язык на другой (например, с японского на корейский). [2] Google Translate ранее сначала переводил исходный язык на английский, а затем переводил английский на целевой, а не переводил напрямую с одного языка на другой. [5]
Исследование, проведенное в июле 2019 года, опубликованное в Annals of Internal Medicine, показало, что «Google Translate - жизнеспособный и точный инструмент для перевода испытаний на неанглоязычный язык». Только одно разногласие между рецензентами, читающими испытания с машинным переводом, было связано с ошибкой перевода. Поскольку многие медицинские исследования исключаются из систематических обзоров, поскольку рецензенты не понимают языка, GNMT может снизить систематическую ошибку и повысить точность таких обзоров. [22]
Языки, поддерживаемые GNMT [ править ]
По состоянию на октябрь 2020 года количество языков, поддерживаемых Google Translate, выросло до 109, включая киргизский, белорусский, латинский, мальтийский и суданский.
- африкаанс
- албанский
- Амхарский
- арабский
- Армянский
- Азербайджанский
- Баскский
- Белорусский
- Бенгальский
- Боснийский
- болгарский
- Бирманский
- Каталонский
- Себуано
- Чичева
- Китайский упрощенный)
- Китайский традиционный)
- Корсиканский
- хорватский
- Чешский
- Датский
- нидерландский язык
- английский
- эсперанто
- эстонский
- Филиппинский
- Финский
- французкий язык
- Галицкий
- Грузинский
- Немецкий
- Греческий
- Гуджарати
- Гаитянский креольский
- Хауса
- Гавайский
- иврит
- хинди
- Хмонг
- Венгерский
- исландский
- Игбо
- индонезийский
- Ирландский
- Итальянский
- Японский
- Яванский
- Каннада
- Казахский
- Кхмерский
- Корейский
- Курдский ( курманджи )
- Лаосский
- Латышский
- Литовский язык
- Люксембургский
- македонский
- Малагасийский
- малайский
- Малаялам
- Мальтийский
- маори
- Маратхи
- Монгольский
- Непальский
- Норвежский ( букмол )
- Пушту
- Персидский
- Польский
- португальский
- Пенджаби
- румынский
- русский
- Самоанский
- Шотландский гэльский
- сербский
- Сесото
- Шона
- Синдхи
- Сингальский
- словацкий
- словенский
- Сомалийский
- испанский
- Суданский
- суахили
- Шведский
- Таджикский
- Тамильский
- телугу
- Тайский
- турецкий
- украинец
- Урду
- Узбекский
- вьетнамский
- валлийский
- Западно-фризский
- Коса
- идиш
- Йоруба
- Зулусский
См. Также [ править ]
- Машинный перевод на основе примеров
- Машинный перевод на основе правил
- Сравнение приложений машинного перевода
- Статистический машинный перевод
- Искусственный интеллект
- Модель языка кеширования
- Компьютерная лингвистика
- Компьютерный перевод
- История машинного перевода
- Список новых технологий
- Список исследовательских лабораторий по машинному переводу
- Нейронный машинный перевод
- Машинный перевод
- Универсальный переводчик
Ссылки [ править ]
- ^ a b c d e f Барак Туровский (15 ноября 2016 г.), «Найдено в переводе: Более точные, свободные предложения в Google Translate» , Блог Google , получено 11 января 2017 г.
- ^ a b c d e f g h Майк Шустер, Мелвин Джонсон и Нихил Торат (22 ноября 2016 г.), "Zero-Shot Translation with Google's Multilingual Neural Machine Translation System" , Google Research Blog , получено 11 января 2017 г.CS1 maint: использует параметр авторов ( ссылка )
- ^ a b Гил Фьюстер (5 января 2017 г.), « Потрясающее объявление Google об искусственном интеллекте , которое вы, вероятно, пропустили» , freeCodeCamp , получено 11 января 2017 г.
- ^ Ву, Юнхуэй; Шустер, Майк; Чен, Чжифэн; Le, Quoc V .; Норузи, Мохаммад (2016). «Система нейронного машинного перевода Google: преодоление разрыва между человеческим и машинным переводом». arXiv : 1609.08144 . Bibcode : 2016arXiv160908144W . Цитировать журнал требует
|journal=
( помощь ) - ^ a b Бойте, Кристиан; Бланшон, Эрве; Селигман, Марк; Беллинк, Валери (2010). «MT в Интернете и для Интернета» (PDF) . Проверено 1 декабря 2016 года .
- ^ a b Роберт Д. Хоф (14 августа 2014 г.). «Китайский интернет-гигант начинает мечтать: Baidu - неотъемлемая часть онлайн-жизни Китая, но он хочет стать мировой державой. Может ли один из ведущих мировых исследователей искусственного интеллекта помочь ему бросить вызов крупнейшим компаниям Кремниевой долины?» . Обзор технологий . Проверено 11 января 2017 года .
- ↑ Джефф Дин и Эндрю Нг (26 июня 2012 г.). Официальный блог Google «Использование крупномасштабных симуляций мозга для машинного обучения и искусственного интеллекта» . Проверено 26 января 2015 года .
- ^ "Крупномасштабный проект глубоких нейронных сетей Google" . Проверено 25 октября 2015 года .
- ^ Markoff, Джон (25 июня 2012). «Сколько компьютеров для идентификации кошки? 16 000» . Нью-Йорк Таймс . Проверено 11 февраля 2014 года .
- ^ Катянна Квач (17 ноября 2016 г.), нейронная сеть Google учится переводить языки, на которых она не была обучена: впервые в машинном переводе использовалось истинное трансферное обучение , получено 11 января 2017 г.
- ↑ Льюис-Краус, Гидеон (14 декабря 2016 г.). «Великое пробуждение ИИ» . Нью-Йорк Таймс . Проверено 11 января 2017 года .
- ^ Ле, Куок; Шустер, Майк (27 сентября 2016 г.). «Нейронная сеть для машинного перевода в промышленных масштабах» . Блог Google Research . Проверено 1 декабря 2016 года .
- ^ Google переходит на собственную систему перевода , 22 октября 2007 г.
- ↑ Барри Шварц (23 октября 2007 г.). "Google Translate Drops SYSTRAN для домашнего перевода" . Земля поисковой машины .
- ↑ Крис Макдональд (7 января 2017 г.), Комментируя статью Гила Фьюстера от 5 января в Атлантике , получено 11 января 2017 г.
- ↑ Туровский, Барак (15 ноября 2016 г.). "Найдено в переводе: Более точные, плавные предложения в Google Translate" . Блог Google по ключевым словам . Проверено 1 декабря 2016 года .
- ↑ Перес, Сара (6 марта 2017 г.). «Интеллектуальная система перевода Google на базе искусственного интеллекта расширяется до большего количества языков» . TechCrunch . Oath Inc.
- ↑ Туровский, Барак (6 марта 2017 г.). «Более качественные нейронные переводы для множества других языков» . Блог Google по ключевым словам . Проверено 6 марта 2017 года .
- ^ NOVET, Иордания (30 марта 2017). «Теперь Google предоставляет переводы на арабский и иврит с помощью искусственного интеллекта» . VentureBeat .
- ^ Finge, Рашид (19 апреля 2017). "Grote verbetering voor het Nederlands in Google Translate" [Большое улучшение для голландского языка в Google Translate]. Блог Google в Нидерландах (на голландском языке).
- ↑ Туровский, Барак (25 апреля 2017 г.). «Сделать Интернет в Индии более инклюзивным» . Ключевое слово .
- ^ Джексон, Джеффри L; Курияма, Акира; Антон, Андрея; Цой, апрель; Фурнье, Жан-Паскаль; Гейер, Энн-Катрин; Жакериоз, Фредерик; Коган, Дмитрий; Шолькофф, Сесилия; Вс, Рао (30 июля 2019 г.). «Точность Google Translate для извлечения данных из неанглоязычных испытаний для систематических обзоров». Анналы внутренней медицины . 171 (9): 678. DOI : 10,7326 / M19-0891 . ISSN 0570-183X . PMID 31357212 . S2CID 198980789 .
Внешние ссылки [ править ]
В Викиверситете есть учебные ресурсы по теме: компьютерная лингвистика |
- Система нейронного машинного перевода Google: устранение разрыва между человеческим и машинным переводом
- Преимущества и недостатки машинного перевода
- Статистический машинный перевод
- Международная ассоциация машинного перевода (IAMT)
- Машинный перевод Архив по Джону Хатчинс . Электронное хранилище (и библиография) статей, книг и статей в области машинного перевода и компьютерных технологий перевода.
- Машинный перевод (компьютерный перевод) - Публикации Джона Хатчинса (включая PDF-файлы нескольких книг по машинному переводу)