Маргарет Мастерман (4 мая 1910 - 1 апреля 1986) была британским лингвистом и философом , наиболее известным своей новаторской работой в области компьютерной лингвистики и особенно машинного перевода . Она основала Кембриджский отдел языковых исследований.
Маргарет Мастерман | |
---|---|
Родившийся | Лондон , Англия | 4 мая 1910 г.
Умер | 1 апреля 1986 г. Кембридж , Англия | (75 лет)
Национальность | Британский |
Альма-матер | Ньюнхемский колледж, Кембридж |
Известен | Кембриджское языковое исследовательское подразделение |
Супруг (а) | |
Дети | 2 |
Научная карьера | |
Поля | Компьютерная лингвистика |
Учреждения | Колледж Люси Кавендиш, Кембридж |
биография
Маргарет Мастерман родилась в Лондоне 4 мая 1910 года в семье Чарльза Ф. Г. Мастермана , британского радикального политика Либеральной партии и главы Бюро военной пропаганды , и Люси Бланш Литтелтон , политика, поэта и писателя. В 1932 году она вышла замуж за философа Ричарда Бевана Брейтуэйта . У них были сын Льюис Чарльз (род. 1937) и дочь Кэтрин Люси (род. 1940).
Работа
Маргарет Мастерман была одной из шести студенток курса Витгенштейна 1933–1934 годов, чьи заметки были составлены как «Синяя книга» . [1] В 1955 году она основала и возглавила Кембриджское подразделение языковых исследований (CLRU), которое превратилось из неформальной дискуссионной группы в крупный исследовательский центр в области компьютерной лингвистики того времени. Она была студенткой Ньюнхэм-колледжа в Кембридже и изучала современные языки, а затем нравственные науки (так тогда называлась философия). Research Unit Cambridge Язык был основан в небольшом , но красивом здании под названием Музей Ади, который был размещался дальневосточное искусством: небольшие буддийские скульптуры были построены в его стены и резных двери. В течение двадцати лет, начиная с 1953 года, он был источником значительных исследований в области машинного перевода, компьютерной лингвистики и квантовой физики, хотя и не входил в официальные университетские структуры Кембриджа. Он финансировался за счет грантов агентств США (AFOSR, ONR, NSF), правительственных агентств Великобритании (OSTI), а позже - из фондов ЕС в Люксембурге. Его вычислительное оборудование было примитивным - древний компьютер ICL 1202 - и большая часть его более серьезных вычислений выполнялась либо на машине Кембриджского университета в тогдашней математической лаборатории, либо посетителями CLRU на сайтах в США. Одним из показателей его воздействия, а также от сотрудников , которые никогда не превышал десяти человек, было то , что годовой премии Lifetime Achievement от Ассоциации компьютерной лингвистики в США, три были награждены CLRU выпускников: Мартин Кей , Карен Спарк Джонс и Йорика Уилкс .
Маргарет Мастерман опередила свое время примерно на двадцать лет: многие из ее убеждений и предложений по обработке языков с помощью компьютера теперь стали частью общего запаса идей в области искусственного интеллекта (AI) и машинного перевода (MT). Она никогда не могла предъявить к ним адекватные претензии, потому что они были неприемлемыми, когда она их опубликовала, и поэтому, когда они были написаны позже ее учениками или независимо «обнаружены» другими, от нее не было никаких следов, особенно в этих областях. где мало или ничего старше десяти лет когда-либо перечитывается.
Суть ее убеждений относительно языковой обработки заключалась в том, что она должна отражать согласованность языка, его избыточность как сигнал. Эта идея была частичным унаследованием от старого «теоретико-информационного» взгляда на язык: для нее это означало, что процессы, анализирующие язык, должны принимать во внимание его повторяющиеся и повторяющиеся структуры, и что писатель повторяет одно и то же снова и снова на разных языках. способы; только если это делает писатель, можно устранить двусмысленность сигнала. Это иногда приводило к тому, что она переоценивала реальную и явную избыточность, которую она могла бы найти в ритмичных и повторяющихся стихах, и неправдоподобно заявляла, что нормальный английский был именно таким, если бы только мы могли это правильно увидеть.
В последующие годы это привело к ключевой роли, которую она отводила ритму, стрессу, группам дыхания и границам, которые они накладывают на текст и процессы понимания. Грубо говоря, она утверждала, что языки такие, какие они есть, по крайней мере частично, потому что они созданы существами, которые дышат через довольно регулярные промежутки времени. Будет очевидно, почему такие утверждения нельзя было даже принять во внимание, в то время как взгляды Хомского преобладали в языковых исследованиях. Однако она никогда не могла дать систематических поверхностных критериев, по которым группы дыхания и паттерны стресса должны были быть идентифицированы поверхностными сигналами или могли быть сведены к другим критериям, таким как синтаксис или морфология, и при этом она не стала бы участвовать в реальной физике голосовых паттернов.
На ее взгляды на важность семантики в языковой обработке (которую она продолжала отстаивать в годы расцвета синтаксиса Хомского между 1951 и 1966 годами) во многом повлияли взгляды Р. Х. Риченса на классификацию и описание с помощью языка семантических примитивов с собственный синтаксис. Эти, наряду с соответствующими утверждениями о сопоставлении семантических шаблонов с поверхностным текстом, были разработаны в реальных программах, из которых можно было предположить, что она была прямым сторонником существования семантических примитивов в некотором смысле Кациана или Шанкиана. Нет ничего более далекого от истины: она была слишком витгенштейновским скептиком в отношении способности любого ограниченного подъязыка или логики взять на себя роль всего языка. Она всегда утверждала, что семантические примитивы будут иметь смысл только при наличии эмпирических критериев для их открытия и теории, допускающей тот факт, что они тоже будут развивать в точности многозначность любого высшего или естественного языка; и она всегда подчеркивала функциональную роль примитивов, например, в разрешении смысловой двусмысленности и в качестве промежуточного языка для МП.
Она надеялась, что решение проблемы происхождения семантических примитивов будет заключаться либо в эмпирических классификационных процедурах, действующих на реальных текстах (как некоторые сейчас говорят о получении примитивов путем массового коннекционистского обучения), либо в наличии адекватной формальной теории структура тезаурусов, которая, по ее мнению, раскрывает определенные основные структуры семантических отношений в естественном языке: теория, согласно которой «примитивы» естественным образом возникнут как организующая классификация тезаурусов. В течение нескольких лет она и ее коллеги изучали теорию решеток как основную формальную структуру таких тезаурусов.
Две другие проблемы, которые пережила ее интеллектуальная жизнь, во многом связаны с периодом, когда Майкл Халлидей , преподававший китайский язык в Кембридже, был коллегой по CLRU. категории и их фундаментальное определение, или с точки зрения роли синтаксиса как организующего принципа семантической информации. Она была первым исследователем искусственного интеллекта, на которого повлиял Хэллидей, задолго до Терри Винограда . И снова она в течение значительного периода времени была озабочена природой и функцией китайских идеограмм, поскольку чувствовала, что они эмпирическим путем проясняют проблемы, с которыми Витгенштейн боролся в своей так называемой теории-картинке-истине. Это привело ее к преувеличению общности идеограмматических принципов и к убеждению, что английский язык на самом деле был скорее похож на китайский, если только правильно его рассматривать, с его атомами значения, весьма неоднозначными и практически не изменяемыми. Это была точка зрения, которая не находила или почти не сочувствовала господствующим лингвистическим или вычислительным течениям того времени.
Основным ее созданием в 1953 году, которое просуществовало двадцать лет, было Кембриджское подразделение языковых исследований , выросшее из неформальной дискуссионной группы с очень разнородным составом, интересующимся языком с философской и вычислительной точек зрения. Впоследствии отличительной чертой работы Подразделения стала попытка создания программ обработки языков, которые имели бы прочную философскую основу. Такой подход к языковой обработке и конкретная форма, которую он принял при использовании тезауруса в качестве основного средства семантических операций, вероятно, станет основным вкладом Подразделения в эту область в целом, и именно Маргарет в первую очередь отвечает за них. Ее видение языковой обработки и ее возможностей было замечательным в то время, когда компьютеры были очень элементарными: действительно, большая часть работы CLRU приходилась на предшественников компьютеров, а именно на перфокартах Холлерита. Точно так же решимость Маргарет в создании и поддержании Подразделения с огромными усилиями по сбору средств, связанных с этим, была очень поразительной: тот факт, что это могло продолжаться десятилетиями и в периоды, когда общественная поддержка такой работы была труднодостижимой, это дань настойчивости и обаянию Маргарет. Сейчас, в наши дни, когда искусственный интеллект присутствует на обычном рынке и очень мощные персональные компьютеры, нам трудно осознать, насколько сложно было получить финансовые ресурсы, необходимые для исследований в области обработки языков, и технические ресурсы для проведения реальных исследований. эксперименты.
Возможно, лучший комментарий к инициативе Маргарет по изучению языковой обработки и, в частности, к работе с машинным переводом, исходит из несколько неожиданного источника. Машинный перевод, после начального периода больших надежд и некоторых крупных претензий, был брошен во тьму в 1966 году финансирующими агентствами, которые не видели большой отдачи от своих денег. Рассматривая двадцать пять лет исследований в области искусственного интеллекта в своем президентском обращении к Американской ассоциации искусственного интеллекта в 1985 году, Вуди Бледсо, один из давних лидеров в этой области, хотя и в областях, находящихся далеко за пределами языка, сказал о тех, кто пытался использовать машинный перевод. в пятидесятые и шестидесятые годы: «Возможно, они потерпели неудачу, но они были правы, пытаясь; мы многому научились из их попыток сделать что-то столь трудное».
То, что они с CLRU пытались сделать, намного опередило свое время. Были предприняты попытки решить фундаментальные проблемы компьютеров того времени, которые обладали мощностью современных цифровых наручных часов. Несмотря на всевозможные проблемы, Группа выпустила множество публикаций по языку и смежным темам, включая поиск информации и автоматическую классификацию. Более десяти лет присутствие подразделения ощущалось в этой области, всегда с акцентом на основные семантические проблемы понимания языка. У Маргарет не было времени на тех, кто считал, что все, что нужно сделать, это синтаксический синтаксический анализ или что полный синтаксический анализ необходим, прежде чем вы сделаете что-нибудь еще. Теперь, когда семантика языка рассматривается как основная часть его понимания машиной, идеи CLRU кажутся удивительно современными.
Главный вклад Маргарет в жизнь CLRU заключался в постоянном интеллектуальном стимулировании, которое она давала его исследованиям, а через это и более широкому сообществу, занимающемуся обработкой естественного языка: у нее был широкий спектр проблем и сторонние идеи, которые побудили ее, например, предложить тезаурус как средство выполнения множества различных задач языковой обработки, таких как индексация и перевод. Акцент Маргарет на алгоритмах и их тестировании был жизненно важен для развития работы CLRU по обработке языков; но ее идеи были примечательны, особенно для тех, кто работал с ней, не только своими интеллектуальными качествами, но и своей искренней радостью.
Серьезные исследования прекратились в CLRU примерно в 1978 году, и Маргарет попыталась перезапустить CLRU в 1980 году с Уильямом Уильямсом [2] в надежде, что новое поколение микрокомпьютеров можно будет использовать для разработки ее алгоритмов перевода на естественный язык. Маргарет прошла 7 миль от Миллингтон-роуд в Кембридже до Оруэлла и купила два компьютера North Star Horizon у Intelligent Artefacts (см. ST Robotics ). Они были установлены с языком программирования Forth , написанным Дэвидом Сэндсом и использовавшимся различными студентами из Кембриджского университета, которые запрограммировали алгоритмы Маргарет на компьютеры. Подход Маргарет к переводу на естественный язык в то время заключался в разделении предложения на сегменты «группы дыхания». Поскольку каждая группа дыхания имела уникальное значение, ее можно было перевести на целевой язык, а целевое предложение реконструировать с использованием переведенных групп дыхания. Это контрастировало с преобладающими техниками языкового перевода того времени, особенно с Systran, который использовал словарь и систему, основанную на правилах, используемую до сих пор. Когда Маргарет умерла в 1986 году, Уильям Уильямс закрыл CLRU, и его уникальная библиотека ранних документов МП была брошена в мусорное ведро, хотя два университетских органа предложили предоставить ему дом.
Она была одним из соучредителей колледжа Люси Кавендиш и его первым вице-президентом (1965–1975). Она была внучатой племянницей из Люси Кавендиш , после которого колледж имени. Она также была основателем и главным вдохновителем философов Богоявления , группы, которая имела некоторое членство с CLRU и была посвящена изучению взаимосвязи науки и религии и форм религиозной практики.
В 1965 году Маргарет Мастерман прочитала работу «Природа парадигмы» на Четвертом международном коллоквиуме по философии науки в Лондоне. [3] Она провела детальную текстологическую критику книги Томаса С. Куна «Структура научных революций» (1962), охарактеризовав книгу как «одновременно перспективную с научной точки зрения и неясную с философской точки зрения». Мастерман похвалил Куна как «одного из выдающихся философов науки нашего времени» и его концепцию парадигм как «фундаментальную идею и новую в философии науки». Она раскритиковала Томаса Куна за его расплывчатое и непоследовательное использование понятия «парадигма», отметив, что оно используется по крайней мере в 21 разном смысле, которые можно суммировать в три группы: метапарадигмы, социологические парадигмы и парадигмы артефактов или построений. Мастерман предположил, что критики Куна в философии науки имели дело только с метапарадигмами и исследовали идеи и значения различных концепций. Эта критика была принята Томасом Куном и сыграла решающую роль в изменении концепции «парадигмы» на «несоизмеримость». [4]
Заметки
- ^ Амвросий, Алиса; Лазеровтиз, Моррис (2002). Людвиг Витгенштейн: философия и язык . Лондон: Рутледж. п. 16. ISBN 978-0415488440.
- ^ Уильямс, Уильям; Ноулз, Фрэнк (1 января 1987 г.). «Маргарет Мастерман: Памяти». Компьютеры и перевод . 2 (4): 197–203. DOI : 10.1007 / bf01682179 . JSTOR 25469921 . S2CID 10246232 .
- ^ Мастерман, Маргарет (1970) [1965], «Природа парадигмы» , в Lakatos, Imre; Масгрейв, Алан (ред.), Критика и рост знаний , Материалы Международного коллоквиума 1965 года по философии науки, 4 (3-е изд.), Кембридж: Cambridge University Press, стр. 59–90 , ISBN 9780521096232
- ^ Kuhn, TS (1970) [1969], «Размышления о моих критиках» , в Lakatos, Imre; Масгрейв, Алан (ред.), Критика и рост знаний , Материалы Международного коллоквиума 1965 года по философии науки, 4 (3-е изд.), Кембридж: Cambridge University Press, стр. 231–278 , ISBN 9780521096232
Рекомендации
- Уилкс, Йорик (2000). «Маргарет Мастерман». В Хатчинсе, Джон (ред.). Ранние годы машинного перевода: воспоминания и биографии первооткрывателей . ISBN 978-90-272-4586-1.
- Архив колледжа Люси Кавендиш
- Мастерман, Маргарет (2003). Уилкс, Йорик (ред.). Язык, сплоченность и форма: избранные статьи Маргарет Мастерман с комментариями . Издательство Кембриджского университета. ISBN 978-90-272-4586-1.
- Леон, Жаклин (2000). Десмет, Пол (ред.). Автоматический перевод и формализация языка: предварительные исследования Кембриджского отделения языковых исследований (1955–1960) . История языкознания и грамматической практики. Петерс. ISBN 978-90-272-4586-1.
- Уильямс, Уильям (1987). Маргарет Мастерман: In Memoriam . Компьютеры и перевод. Springer. ISBN 978-90-272-4586-1.