Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Мартин Кей - ученый-компьютерщик , родился в 1935 году, особенно известен своими работами в области компьютерной лингвистики .

Он родился и вырос в Соединенном Королевстве. В 1961 году он получил степень магистра в Тринити-колледже в Кембридже. В 1958 году он начал работать в Кембриджском исследовательском отделении языков , одном из первых центров исследований в области компьютерной лингвистики. В 1961 году он перешел в Rand Corporation в Санта-Монике, Калифорния , США, где в конечном итоге стал руководителем отдела исследований в области лингвистики и машинного перевода. Он покинул Rand в 1972 году, чтобы стать заведующим кафедрой компьютерных наук Калифорнийского университета в Ирвине . В 1974 году он перешел в Исследовательский центр Xerox в Пало-Альто.как научный сотрудник. В 1985 году, сохранив свою позицию в Xerox PARC, он присоединился к преподавательскому составу Стэнфордского университета на полставки. В настоящее время он является профессором лингвистики в Стэнфордском университете и почетным профессором компьютерной лингвистики Саарландского университета .

Жизнь [ править ]

Он родился в Эджуэре (Мидлсекс, Великобритания) в 1935 году. Изучал лингвистику и компьютерную лингвистику в Тринити-колледже в Кембридже.

Его основные интересы - перевод, выполняемый людьми и машинами, а также вычислительные лингвистические алгоритмы, особенно в области морфологии и синтаксиса.

Работа [ править ]

Кей начал свою карьеру в Кембриджском отделе языковых исследований в Кембридже, Англия, под руководством Маргарет Мастерман . В 1961 году Дэвид Г. Хейс нанял его работать в RAND Corporation ; Впоследствии он работал в Калифорнийском университете в Ирвине и Xerox PARC . Кей - один из пионеров компьютерной лингвистики и машинного перевода. Он отвечал за введение понятия синтаксического анализа диаграмм в компьютерной лингвистике и понятия унификации в лингвистике в целом.

Вместе с Роном Капланом он был пионером в исследованиях и разработке приложений в области конечной морфологии. Он давний участник и критик работы над машинным переводом. В своей основополагающей статье «Надлежащее место людей и машин в языковом переводе» [1] Кей отстаивал системы машинного перевода, которые были тесно интегрированы в процесс перевода, выполняемого человеком. Он был рецензентом и критиком EUROTRA, Verbmobil и многих других проектов MT.

Кей - бывший председатель Ассоциации компьютерной лингвистики и президент Международного комитета компьютерной лингвистики . До 2002 года он был научным сотрудником Xerox PARC . Он является почетным доктором Гетеборгского университета . Кей получил пожизненную награду Ассоциации компьютерной лингвистики за его постоянную роль интеллектуального лидера исследований НЛП в 2005 году.

Достижения и награды [ править ]

  • Его достижения включают разработку грамматики синтаксического анализа диаграмм и функциональной унификации, а также значительный вклад в применение конечных автоматов в вычислительной фонологии и морфологии. Он также считается ведущим специалистом в области машинного перевода .
  • Его отличием включают почетную степень доктора философии из Гетеборга университета и в 2005 году Ассоциация компьютерной лингвистики " премии за выслугу . Он является бессменным председателем Международного комитета компьютерной лингвистики .

Вклады [ править ]

1. «Правильный» документ Мартина Кея [1]. После отчета ALPAC в 1966 году был сделан вывод: «Не существует непосредственной или предсказуемой перспективы полезного машинного перевода, обеспечивающего полезный перевод общенаучных текстов». [2] И из-за этого в области машинного перевода наступили темные времена. С 1966 по 1976 год, почти десять лет, исследований было проведено мало. Однако в 80-е годы наступил период Возрождения. [3] «Надлежащее место людей и машин в языковом переводе» привлекло больше внимания к машинному переводу. В этой статье были высказаны новые мысли о взаимосвязи между машинным переводом и человеческим переводом. В то время, когда применялись более дешевые компьютеры и широко использовались домены в машинном переводе, высококачественные результаты были крайне необходимы.И теория полностью автоматического высококачественного перевода была просто идеальным уровнем для машинного перевода после критики Бар-Хиллелем в его обзоре прогресса машинного перевода 1960-х годов: «Целью машинного перевода не должно быть полностью автоматического высококачественного перевода (FAHQT), который может заменить переводчиков-людей. Вместо этого МП должна ставить перед собой менее амбициозные цели, например, более экономичное взаимодействие человека и машины, и стремиться к повышению продуктивности перевода человеком ». [4] Польза человеческого перевода была поднята на новый, более высокий уровень. В соответствии с этой мыслью Мартин Кей предложил более практическую идею о взаимоотношениях человека и машины в процессе машинного перевода, названную «переводчик amanuensis».Целью машинного перевода не должно быть полностью автоматического высококачественного перевода (FAHQT), который может заменить переводчиков-людей. Вместо этого МП должна ставить перед собой менее амбициозные цели, например, более рентабельное взаимодействие человека с машиной и стремиться к повышению продуктивности человеческого перевода ». [4] Полезность человеческого перевода была продвинута на новый, более высокий уровень. Согласно этой мысли, Мартин Кей предложил более практическую идею о взаимоотношениях человека и машины в процессе машинного перевода, названную «переводчик amanuensis».Целью машинного перевода не должно быть полностью автоматического высококачественного перевода (FAHQT), который может заменить переводчиков-людей. Вместо этого МП должна ставить перед собой менее амбициозные цели, например более рентабельное взаимодействие человека с машиной, и стремиться к повышению продуктивности человеческого перевода ». [4] Полезность человеческого перевода была продвинута на новый, более высокий уровень. Согласно этой мысли, Мартин Кей предложил более практическую идею о взаимоотношениях человека и машины в процессе машинного перевода, названную «переводчик amanuensis».Мартин Кей предложил более практическую идею о взаимоотношениях человека и машины в процессе машинного перевода, названную «переводчик amanuensis».Мартин Кей предложил более практическую идею о взаимоотношениях человека и машины в процессе машинного перевода, названную «переводчик amanuensis».

1.1. Два аргумента против полезности машинного перевода. Поскольку эта идея включает в себя человека и машину одновременно, и компьютерные ученые, и лингвисты несут ответственность за МП. Но «их никогда не следует просить предоставить инженерное решение проблемы, которую они лишь смутно понимают». Им просто необходимо достичь, «делая только то, что можно сделать с абсолютной уверенностью и надежностью… может быть практически гарантировано всем заинтересованным сторонам». В качестве основных частей перевода есть два связанных аргумента против правдоподобия машинного перевода как промышленного предприятия с точки зрения лингвистики и информатики. Обычно приводятся два аргумента в пользу специальных решений проблем машинного перевода. В первом аргументе "Специальные решения, как правило, основываются на индивидуальном анализе того, что лингвисты называют поверхностными явлениями, по сути, строками слов, а также на реальных или воображаемых статистических свойствах определенных стилей письма и областей дискурса ». Это простое статистическое утверждение. это может быть отклонено. Во втором аргументе, специальные решения только намекают на понимание второго языка путем чтения текста и называются учеником чародея, потому что «такого рода аргументы направлены на то, что своего рода неполная теория, которая лингвисты и компьютерные ученые часто могли предоставить худшую основу для построения практических устройств, чем отсутствие теории вообще, потому что теория не знает, когда остановиться ».« Основная проблема с колдуном ».Аргумент s-apprentice состоит в том, что решение о том, что предложение может быть переведено без анализа, может быть принято только постфактум. Пример предложения показывает, что существует более одной интерпретации предложения на определенном уровне, и дальнейший анализ показывает, что существует единственный перевод, совместимый с каждым из них. Короче говоря, алгоритм, необходимый для решения, когда требуется анализ, должен использовать результаты того самого анализа, которого он призван избежать ».алгоритм, необходимый для решения, когда требуется анализ, должен будет использовать результаты того самого анализа, которого он призван избежать ".алгоритм, необходимый для решения, когда требуется анализ, должен будет использовать результаты того самого анализа, которого он призван избежать ".

1.2. Amanuensis переводчика и память переводов. Это основная часть статьи. Чтобы проиллюстрировать, что такое amanuensis переводчика, автор показал три аспекта: редактирование текста, средства перевода и машинный перевод. "Предположим, что переводчикам предоставляется терминал, состоящий из клавиатуры, экрана и некоторого способа указания отдельных слов и букв. Отображение на экране разделено на два окна. Текст для перевода отображается в верхнем окне и перевод будет составлен в нижнем ". Это форма amanuensis переводчика, которая не является настоящим приемом и никогда не будет. "Оба окна ведут себя одинаково. С помощью указывающего устройства переводчик может выбрать букву, слово, предложение, строку или абзац и, нажав соответствующую клавишу,вызвать некоторую операцию, которая будет посещена на нем ".

Эти два рисунка показывают процесс перевода от начального отображения к выбору. Этот прибор не такой простой, как эти две цифры, с его помощью переводчику можно оказать более особую услугу. В пособиях по переводу автор показал третью цифру:

«Относительно тривиальным дополнением был бы словарь. Переводчик выбирает слово или последовательность слов и дает команду для их поиска… Это новое окно дает эффект наложения некоторой части уже имеющихся окон. В этом случае , новое окно содержит обманчиво простую словарную статью для выбранного слова ". Более того, у устройства есть много других функций. Например, простота словарной статьи, синтаксис слов и семантика будут включены при указании на символы, изменяемые словарные статьи и временные поправки сделают это устройство более практичным. Затем объясните машинный перевод. "Один из вариантов, который следует предложить пользователю гипотетической системы, которую я описывал, на довольно ранней стадии,будет командой, которая направит программу на перевод текущего выбранного модуля. Что произойдет, когда будет дана эта команда, будет по-разному на разных этапах развития системы. Но пользователь системы всегда будет иметь право вмешиваться в процесс перевода в той степени, в которой он сам укажет. Если он решит вообще не вмешиваться, в нижнем окне его экрана будет отображаться текст, предназначенный для перевода текущей единицы. Он сможет редактировать это как угодно, как раньше делали постредакторы. В качестве альтернативы, он может попросить, чтобы с ним проконсультировались всякий раз, когда программа сталкивается с решением определенного типа, когда обнаруживаются определенные виды двусмысленностей или что-то еще. В таких случаях система задает вопрос переводчику-человеку. Он может, например,просить, чтобы с вами проконсультировались по вопросам местоименной ссылки. "В этой части идея памяти переводов была показана как словарная операция". Предположим, например, что слово помещено в местное хранилище - ту часть словаря, которая сохраняется только пока идет работа над этим документом - если это встречается в тексте значительно чаще, чем указывает статистика, хранящаяся в основном словаре. Фраза будет отмечена, если она встречается два или три раза, но не распознается словарем как идиома или заданная фраза. Изучая содержимое этого магазина перед тем, как приступить к переводу, пользователь может надеяться получить предварительное представление о предстоящих трудностях и заранее принять некоторые решения о том, как с ними обращаться. Эти решения, конечно же, будут записаны в самом магазине. В ходе этого или, действительно,по любой причине переводчик может вызвать отображение всех единиц текста, содержащих определенное слово, фразу, строку символов или что-то еще. В конце концов, наиболее важным ориентиром при переводе текста является сам текст. Если фрагмент текста, который будет переведен следующим, не совсем прост, переводчик может начать с выдачи команды, заставляющей систему отображать в хранилище все, что может иметь к нему отношение. Это привлечет его внимание к решениям, которые он принял до начала фактического перевода, статистически значимым словам и фразам, а также записи всего, что привлекало внимание, когда это произошло раньше. Прежде чем продолжить, он может изучить прошлые и будущие фрагменты текста, содержащие аналогичный материал ».переводчик может вызвать отображение всех единиц текста, содержащих определенное слово, фразу, строку символов или что-то еще. В конце концов, наиболее важным ориентиром при переводе текста является сам текст. Если фрагмент текста, который будет переведен следующим, не совсем прост, переводчик может начать с выдачи команды, заставляющей систему отображать в хранилище все, что может иметь к нему отношение. Это привлечет его внимание к решениям, которые он принял до начала фактического перевода, статистически значимым словам и фразам, а также записи всего, что привлекало внимание, когда это произошло раньше. Прежде чем продолжить, он может изучить прошлые и будущие фрагменты текста, содержащие аналогичный материал ».переводчик может вызвать отображение всех единиц текста, содержащих определенное слово, фразу, строку символов или что-то еще. В конце концов, наиболее важным ориентиром при переводе текста является сам текст. Если фрагмент текста, который будет переведен следующим, не совсем прост, переводчик может начать с выдачи команды, заставляющей систему отображать в хранилище все, что может иметь к нему отношение. Это привлечет его внимание к решениям, которые он принял до начала фактического перевода, статистически значимым словам и фразам, а также записи всего, что привлекало внимание, когда это произошло раньше. Прежде чем продолжить, он может изучить прошлые и будущие фрагменты текста, содержащие аналогичный материал ».Самым важным ориентиром при переводе текста является сам текст. Если фрагмент текста, который будет переведен следующим, не совсем прост, переводчик может начать с выдачи команды, заставляющей систему отображать в хранилище все, что может иметь к нему отношение. Это привлечет его внимание к решениям, которые он принял до начала фактического перевода, статистически значимым словам и фразам, а также записи всего, что привлекало внимание, когда это произошло раньше. Прежде чем продолжить, он может изучить прошлые и будущие фрагменты текста, содержащие аналогичный материал ».Самым важным ориентиром при переводе текста является сам текст. Если фрагмент текста, который будет переведен следующим, не совсем прост, переводчик может начать с выдачи команды, заставляющей систему отображать в хранилище все, что может иметь к нему отношение. Это привлечет его внимание к решениям, которые он принял до начала фактического перевода, статистически значимым словам и фразам, а также записи всего, что привлекало внимание, когда это произошло раньше. Прежде чем продолжить, он может изучить прошлые и будущие фрагменты текста, содержащие аналогичный материал ».переводчик может начать с выдачи команды, заставляющей систему отображать в магазине все, что может иметь к ней отношение. Это привлечет его внимание к решениям, которые он принял до начала фактического перевода, статистически значимым словам и фразам, а также записи всего, что привлекало внимание, когда это произошло раньше. Прежде чем продолжить, он может изучить прошлые и будущие фрагменты текста, содержащие аналогичный материал ».переводчик может начать с выдачи команды, заставляющей систему отображать в магазине все, что может иметь к ней отношение. Это привлечет его внимание к решениям, которые он принял до начала фактического перевода, статистически значимым словам и фразам, а также записи всего, что привлекало внимание, когда это произошло раньше. Прежде чем продолжить, он может изучить прошлые и будущие фрагменты текста, содержащие аналогичный материал ».

1.3 Ожидание лучшей производительности переводчика amanuensis В конце статьи Кей упомянул несколько причин, по которым следует ожидать лучшей производительности этого устройства. Во-первых, система в состоянии привлечь внимание своего сотрудника-человека к вопросам, которые, скорее всего, в этом нуждаются, во-вторых, решения, которые должны быть приняты в ходе перевода отрывка, редко бывают независимыми, в-третьих, одним из наиболее важных Средства в системе - это то, что отслеживает слова и фразы, которые каким-то образом используются в текущем тексте.

  • «Жизнь в языке». Речь, озвученная в знак признания Премии за выслугу лет на 43-м ежегодном собрании Ассоциации компьютерной лингвистики, Анн-Арбор, Мичиган, 27 июня 2005 г. http://www.stanford.edu/~mjkay/LifeOfLanguage.pdf
  • Выравнивание строк с помощью деревьев суффиксов. Статья о возможном использовании суффиксных деревьев для выравнивания текстов и их переводов. http://www.stanford.edu/~mjkay/CYCLING.pdf
  • Незавершенные размышления о природе перевода. Вот несколько незаконченных размышлений о природе перевода. http://www.stanford.edu/~mjkay/CurrentState.pdf
  • Некоторые недоработанные мысли о языковых моделях в статистическом НЛП, по которым мне нужна помощь. http://www.stanford.edu/~mjkay/language_models.pdf
  • Его статья 1994 г. " Регулярные модели систем фонологических правил ". Computational Linguistics 20 (3): 331–378 »с Рональдом Капланом. Http://www.stanford.edu/~mjkay/Kaplan%26Kay.pdf

Книги [ править ]

  • Лингвистика и информатика (с Карен Спарк Джонс ), Academic Press , 1973.
  • Естественный язык в информатике (под редакцией Д. Е. Уокера и Ханса Карлгрена), Skriptor, Стокгольм, 1977 г.
  • Verbmobil: Система перевода для личного диалога (с Жаном Марком Гавроном и Питером Норвигом ), CSLI, Стэнфорд, Калифорния, 1994.
  • Введение в машинный перевод . У. Джон Хатчинс и Гарольд Л. Сомерс. Лондон: Academic Press, 1992.
  • Справочник по компьютерной лингвистике . Руслан Митков (ред.). Oxford University Press , 2003. (Введение).

Избранные статьи [ править ]

  • « Правила интерпретации - подход к проблеме вычислений в семантике естественного языка », в материалах Второго Международного конгресса Международной федерации обработки информации, 1962 г.
  • «Процедура анализа» Труды Второго Международного Конгресса Международной Федерации Обработки Информации, 1962 г.
  • «Общая процедура перезаписи строк», доклад, представленный на ежегодном собрании Ассоциации машинного перевода и компьютерной лингвистики, Блумингтон, Индиана, 1964.
  • Логика познания в исторической лингвистике, RM-4224-PR, Санта-Моника, корпорация RAND, июль 1964 г.
  • Программа анализа категориальных грамматик, RM-4283-PR, Санта-Моника, корпорация RAND, август 1964 г.
  • Табличный синтаксический анализатор: программа синтаксического анализа структуры фраз и зависимости, RM-4933-PR, Санта-Моника, корпорация RAND, июль 1966 г.
  • Компьютерная система в помощь полевому лингвисту, P-4095, Санта-Моника, корпорация RAND, май 1969 г.
  • Система MIND: Программа морфологического анализа, RM-6265/2-PR, Санта-Моника, корпорация RAND, апрель 1970 г. (совместно с Гэри Р. Мартинсом).
  • «Автоматический перевод естественных языков» в языке как проблема человека: Дедал, 1973.
  • « Грамматика функционального объединения: формализм для машинного перевода » в материалах Международной конференции по компьютерной лингвистике (COLING 84), Ассоциация компьютерной лингвистики, 1984.
  • «Синтаксический анализ на языках свободного порядка слов» (с Лаури Карттуненом), в Даути, Дэвид Р., Лаури Карттунен и Арнольд М. Цвикки, Анализ естественного языка, Cambridge University Press, 1985.
  • «Унификация в грамматике», В. Даль и П. Сен-Дизье, Понимание естественного языка и логическое программирование, Северная Голландия, 1985.
  • «Теоретические вопросы проектирования рабочего места переводчика», Труды семинара IBM по компьютерам и переводу, Копенгаген.
  • "Регулярные модели систем фонологических правил" (совместно с Р. М. Капланом), Компьютерная лингвистика 20: 3 (сентябрь 1994 г., совместно с Р. М. Капланом).
  • «Выравнивание подстроки с использованием деревьев суффиксов». Вычислительная лингвистика и интеллектуальная обработка текста , Springer, Lecture Notes in Computer Science, 2004.

Чтения курса [ править ]

  • Дизъюнктивное объединение http://www.stanford.edu/~mjkay/DisjunctiveUnification.pdf
  • Функциональная неопределенность http://www.stanford.edu/~mjkay/FunctionalUncertainty.pdf
  • HPSG1 http://www.stanford.edu/~mjkay/pollard-foundations.pdf
  • HPSG2 http://www.stanford.edu/~mjkay/levine03.pdf
  • Генерация HPSG http://www.stanford.edu/~mjkay/Shieber.pdf
  • CCG http://www.stanford.edu/~mjkay/Steedman%26Baldridge.pdf
  • Типизированные функции http://www.stanford.edu/~mjkay/Copestake.pdf
  • Зависимость http://www.stanford.edu/~mjkay/covington.pdf

Награды [ править ]

  • Он является почетным профессором Саарского университета и почетным доктором университетов Гетеборга и Женевы.
  • Он также выиграл 2005 ACL Lifetime Achievement Award. Его благодарственная речь была озаглавлена ​​«Языковая жизнь». [2]

Ссылки [ править ]

  1. ^ Кей, Мартин. « Надлежащее место людей и машин в языковом переводе ». машинный перевод 12.1-2 (1997): 3-23.
  2. ^ "Получатели награды за заслуги перед ACL" . ACL вики . ACL . Проверено 24 августа 2017 года .

Внешние ссылки [ править ]

  • Домашняя страница Стэнфорда
  • Домашняя страница Саарландского университета
  • Цитирование награды ACL Lifetime Achievement Award
  • «Языковая жизнь» - Выступление по вручению награды ACL Lifetime - Мартин Кей, рассказывающий о своей работе в области компьютерной лингвистики (13 страниц)
  • Анонс лекции с биографической справкой
  • Интервью (видео и аудио) с Мартином Каем в Оксфордском институте Интернета, 18 июня 2009 г.