Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

Google Neural Machine Translation (GNMT) - это система нейронного машинного перевода (NMT), разработанная Google и представленная в ноябре 2016 года, которая использует искусственную нейронную сеть для повышения беглости и точности Google Translate . [1] [2] [3] [4]

GNMT улучшает качество перевода, применяя метод машинного перевода на основе примеров (EBMT), при котором система «учится на миллионах примеров». [2] Предложенная GNMT архитектура системного обучения была сначала протестирована более чем на ста языках, поддерживаемых Google Translate. [2] Благодаря большой сквозной структуре система со временем учится создавать более качественные и естественные переводы. [1] GNMT может переводить целые предложения за раз, а не просто по частям. [1] Сеть GNMT может выполнять межъязыковой машинный перевод , кодируя семантику предложения, а не запоминая перевод фразы-фразы.[2] [5]

История [ править ]

Проект Google Brain был основан в 2011 году в «секретной исследовательской лаборатории Google X» [6] сотрудником Google Джеффом Дином , исследователем Google Грегом Коррадо и профессором компьютерных наук Стэнфордского университета Эндрю Нг . [7] [8] [9] Работа Нг привела к одним из крупнейших достижений в Google и Стэнфорде. [6]

В сентябре 2016 года исследовательская группа Google объявила о разработке системы нейронного машинного перевода Google (GNMT), и к ноябрю Google Translate начал использовать нейронный машинный перевод (NMT) вместо своих предыдущих статистических методов (SMT) [1] [10 ] [11] [12], который использовался с октября 2007 года, с его собственной собственной технологией SMT. [13] [14]

Система NMT Google Translate использует большую искусственную нейронную сеть, способную к глубокому обучению . [1] [2] [3] Используя миллионы примеров, GNMT улучшает качество перевода, [2] используя более широкий контекст для определения наиболее релевантного перевода. Затем результат перестраивается и адаптируется к грамматически основанному человеческому языку. [1] Предложенная GNMT архитектура системного обучения была сначала протестирована более чем на ста языках, поддерживаемых Google Translate. [2] GNMT не создавала своего собственного универсального интерлингва, а скорее была направлена ​​на поиск общности между многими языками с использованием идей психологии и лингвистики. [15]Новый механизм перевода был впервые включен для восьми языков: на английский и французский, немецкий, испанский, португальский, китайский, японский, корейский и турецкий и обратно в 2016 году. [16] В марте 2017 года были включены три дополнительных языка: русский и хинди. и вьетнамский, а также тайский, поддержка которого была добавлена ​​позже. [17] [18] Поддержка иврита и арабского языка была также добавлена ​​с помощью сообщества Google Translate в том же месяце. [19] В середине апреля 2017 года компания Google в Нидерландах объявила о поддержке голландского и других европейских языков, связанных с английским. [20] В конце апреля 2017 года была добавлена ​​дополнительная поддержка для девяти индийских языков: хинди, бенгали, маратхи, гуджарати, пенджаби, тамильского, телугу, малаялам и каннада.[21]

Оценка [ править ]

Говорят, что система GNMT представляет собой усовершенствование по сравнению с прежним переводчиком Google Translate в том смысле, что она сможет обрабатывать «нулевой перевод», то есть напрямую переводить один язык на другой (например, с японского на корейский). [2] Google Translate ранее сначала переводил исходный язык на английский, а затем переводил английский на целевой, а не переводил напрямую с одного языка на другой. [5]

Исследование, проведенное в июле 2019 года, опубликованное в Annals of Internal Medicine, показало, что «Google Translate - жизнеспособный и точный инструмент для перевода испытаний на неанглоязычный язык». Только одно разногласие между рецензентами, читающими испытания с машинным переводом, было связано с ошибкой перевода. Поскольку многие медицинские исследования исключаются из систематических обзоров, поскольку рецензенты не понимают языка, GNMT может снизить систематическую ошибку и повысить точность таких обзоров. [22]

Языки, поддерживаемые GNMT [ править ]

По состоянию на октябрь 2020 года количество языков, поддерживаемых Google Translate, выросло до 109, включая киргизский, белорусский, латинский, мальтийский и суданский.

  1. африкаанс
  2. албанский
  3. Амхарский
  4. арабский
  5. Армянский
  6. Азербайджанский
  7. Баскский
  8. Белорусский
  9. Бенгальский
  10. Боснийский
  11. болгарский
  12. Бирманский
  13. Каталонский
  14. Себуано
  15. Чичева
  16. Китайский упрощенный)
  17. Китайский традиционный)
  18. Корсиканский
  19. хорватский
  20. Чешский
  21. Датский
  22. нидерландский язык
  23. английский
  24. эсперанто
  25. эстонский
  26. Филиппинский
  27. Финский
  28. французкий язык
  29. Галицкий
  30. Грузинский
  31. Немецкий
  32. Греческий
  33. Гуджарати
  34. Гаитянский креольский
  35. Хауса
  36. Гавайский
  37. иврит
  38. хинди
  39. Хмонг
  40. Венгерский
  41. исландский
  42. Игбо
  43. индонезийский
  44. Ирландский
  45. Итальянский
  46. Японский
  47. Яванский
  48. Каннада
  49. Казахский
  50. Кхмерский
  51. Корейский
  52. Курдский ( курманджи )
  53. Лаосский
  54. Латышский
  55. Литовский язык
  56. Люксембургский
  57. македонский
  58. Малагасийский
  59. малайский
  60. Малаялам
  61. Мальтийский
  62. маори
  63. Маратхи
  64. Монгольский
  65. Непальский
  66. Норвежский ( букмол )
  67. Пушту
  68. Персидский
  69. Польский
  70. португальский
  71. Пенджаби
  72. румынский
  73. русский
  74. Самоанский
  75. Шотландский гэльский
  76. сербский
  77. Сесото
  78. Шона
  79. Синдхи
  80. Сингальский
  81. словацкий
  82. словенский
  83. Сомалийский
  84. испанский
  85. Суданский
  86. суахили
  87. Шведский
  88. Таджикский
  89. Тамильский
  90. телугу
  91. Тайский
  92. турецкий
  93. украинец
  94. Урду
  95. Узбекский
  96. вьетнамский
  97. валлийский
  98. Западно-фризский
  99. Коса
  100. идиш
  101. Йоруба
  102. Зулусский

См. Также [ править ]

  • Машинный перевод на основе примеров
  • Машинный перевод на основе правил
  • Сравнение приложений машинного перевода
  • Статистический машинный перевод
  • Искусственный интеллект
  • Модель языка кеширования
  • Компьютерная лингвистика
  • Компьютерный перевод
  • История машинного перевода
  • Список новых технологий
  • Список исследовательских лабораторий по машинному переводу
  • Нейронный машинный перевод
  • Машинный перевод
  • Универсальный переводчик

Ссылки [ править ]

  1. ^ a b c d e f Барак Туровский (15 ноября 2016 г.), «Найдено в переводе: Более точные, свободные предложения в Google Translate» , Блог Google , получено 11 января 2017 г.
  2. ^ a b c d e f g h Майк Шустер, Мелвин Джонсон и Нихил Торат (22 ноября 2016 г.), "Zero-Shot Translation with Google's Multilingual Neural Machine Translation System" , Google Research Blog , получено 11 января 2017 г.CS1 maint: использует параметр авторов ( ссылка )
  3. ^ a b Гил Фьюстер (5 января 2017 г.), « Потрясающее объявление Google об искусственном интеллекте , которое вы, вероятно, пропустили» , freeCodeCamp , получено 11 января 2017 г.
  4. ^ Ву, Юнхуэй; Шустер, Майк; Чен, Чжифэн; Le, Quoc V .; Норузи, Мохаммад (2016). «Система нейронного машинного перевода Google: преодоление разрыва между человеческим и машинным переводом». arXiv : 1609.08144 . Bibcode : 2016arXiv160908144W . Цитировать журнал требует |journal=( помощь )
  5. ^ a b Бойте, Кристиан; Бланшон, Эрве; Селигман, Марк; Беллинк, Валери (2010). «MT в Интернете и для Интернета» (PDF) . Проверено 1 декабря 2016 года .
  6. ^ a b Роберт Д. Хоф (14 августа 2014 г.). «Китайский интернет-гигант начинает мечтать: Baidu - неотъемлемая часть онлайн-жизни Китая, но он хочет стать мировой державой. Может ли один из ведущих мировых исследователей искусственного интеллекта помочь ему бросить вызов крупнейшим компаниям Кремниевой долины?» . Обзор технологий . Проверено 11 января 2017 года .
  7. Джефф Дин и Эндрю Нг (26 июня 2012 г.). Официальный блог Google «Использование крупномасштабных симуляций мозга для машинного обучения и искусственного интеллекта» . Проверено 26 января 2015 года .
  8. ^ "Крупномасштабный проект глубоких нейронных сетей Google" . Проверено 25 октября 2015 года .
  9. ^ Markoff, Джон (25 июня 2012). «Сколько компьютеров для идентификации кошки? 16 000» . Нью-Йорк Таймс . Проверено 11 февраля 2014 года .
  10. ^ Катянна Квач (17 ноября 2016 г.), нейронная сеть Google учится переводить языки, на которых она не была обучена: впервые в машинном переводе использовалось истинное трансферное обучение , получено 11 января 2017 г.
  11. Льюис-Краус, Гидеон (14 декабря 2016 г.). «Великое пробуждение ИИ» . Нью-Йорк Таймс . Проверено 11 января 2017 года .
  12. ^ Ле, Куок; Шустер, Майк (27 сентября 2016 г.). «Нейронная сеть для машинного перевода в промышленных масштабах» . Блог Google Research . Проверено 1 декабря 2016 года .
  13. ^ Google переходит на собственную систему перевода , 22 октября 2007 г.
  14. Барри Шварц (23 октября 2007 г.). "Google Translate Drops SYSTRAN для домашнего перевода" . Земля поисковой машины .
  15. Крис Макдональд (7 января 2017 г.), Комментируя статью Гила Фьюстера от 5 января в Атлантике , получено 11 января 2017 г.
  16. Туровский, Барак (15 ноября 2016 г.). "Найдено в переводе: Более точные, плавные предложения в Google Translate" . Блог Google по ключевым словам . Проверено 1 декабря 2016 года .
  17. Перес, Сара (6 марта 2017 г.). «Интеллектуальная система перевода Google на базе искусственного интеллекта расширяется до большего количества языков» . TechCrunch . Oath Inc.
  18. Туровский, Барак (6 марта 2017 г.). «Более качественные нейронные переводы для множества других языков» . Блог Google по ключевым словам . Проверено 6 марта 2017 года .
  19. ^ NOVET, Иордания (30 марта 2017). «Теперь Google предоставляет переводы на арабский и иврит с помощью искусственного интеллекта» . VentureBeat .
  20. ^ Finge, Рашид (19 апреля 2017). "Grote verbetering voor het Nederlands in Google Translate" [Большое улучшение для голландского языка в Google Translate]. Блог Google в Нидерландах (на голландском языке).
  21. Туровский, Барак (25 апреля 2017 г.). «Сделать Интернет в Индии более инклюзивным» . Ключевое слово .
  22. ^ Джексон, Джеффри L; Курияма, Акира; Антон, Андрея; Цой, апрель; Фурнье, Жан-Паскаль; Гейер, Энн-Катрин; Жакериоз, Фредерик; Коган, Дмитрий; Шолькофф, Сесилия; Вс, Рао (30 июля 2019 г.). «Точность Google Translate для извлечения данных из неанглоязычных испытаний для систематических обзоров». Анналы внутренней медицины . 171 (9): 678. DOI : 10,7326 / M19-0891 . ISSN 0570-183X . PMID 31357212 . S2CID 198980789 .   

Внешние ссылки [ править ]

  • Система нейронного машинного перевода Google: устранение разрыва между человеческим и машинным переводом
  • Преимущества и недостатки машинного перевода
  • Статистический машинный перевод
  • Международная ассоциация машинного перевода (IAMT)
  • Машинный перевод Архив по Джону Хатчинс . Электронное хранилище (и библиография) статей, книг и статей в области машинного перевода и компьютерных технологий перевода.
  • Машинный перевод (компьютерный перевод) - Публикации Джона Хатчинса (включая PDF-файлы нескольких книг по машинному переводу)