Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Кеннет Ноубл Стивенс (24 марта 1924 [1] - 19 августа 2013) был профессором электротехники и информатики Кларенса Дж. ЛеБеля и профессором медицинских наук и технологий в исследовательской лаборатории электроники Массачусетского технологического института . Стивенс возглавлял группу речевой коммуникации [2] в Исследовательской лаборатории электроники Массачусетского технологического института (RLE) и был одним из ведущих мировых ученых в области акустической фонетики .

Он был награжден Национальной медалью науки от президента Билла Клинтона в 1999 году и премией IEEE Джеймса Л. Фланагана за речь и обработку звука в 2004 году.

Он умер в 2013 году от осложнения болезни Альцгеймера . [3]

Образование [ править ]

Раннее образование [ править ]

Кен Стивенс родился в Торонто 23 марта 1924 года. [4] Его старший брат Пит родился в Англии; Кен родился четыре года спустя, вскоре после того, как семья эмигрировала в Канаду. Его детскими амбициями было стать врачом, потому что он восхищался дядей, который был врачом. [5] Он учился в средней школе при Департаменте образования Университета Торонто .

Стивенс учился в колледже Инженерной школы Университета Торонто на полную стипендию. Он жил дома все свои студенческие годы. Хотя сам Стивенс не мог сражаться во Второй мировой войне из-за нарушения зрения, его брат отсутствовал всю войну; его родители каждую ночь следили за новостями BBC. [5] Стивенс специализировался на инженерной физике в университете, [6] охватывая темы от проектирования моторизованных машин до основ физики, которые преподавались на физическом факультете. Летом он работал в оборонной промышленности, в том числе одно лето в компании, которая занималась разработкой радаров. Он получил степени SB и SM в 1945 г. [7]

Стивенс был учителем со студенческих лет, когда читал лекции по экономике дома, которые касались некоторых аспектов физики. [5] После получения степени магистра он остался в Университете Торонто в качестве инструктора, проводя курсы для молодых людей, вернувшихся с войны, включая своего старшего брата. [5] Он был сотрудником Фонда Онтарио с 1945 по 1946 год, затем работал инструктором в Университете Торонто до 1948 года. [7]

Во время магистерской работы Стивенс заинтересовался теорией управления и прошел курсы на факультете прикладной математики, где один из его профессоров рекомендовал ему подать заявление в Массачусетский технологический институт для получения докторской степени.

Докторантура [ править ]

Вскоре после того, как Стивенс был принят в Массачусетский технологический институт, новый профессор по имени Лео Беранек заметил, что Стивенс занимался акустикой. Беранек связался со Стивенсом в Торонто, чтобы узнать, будет ли он ассистентом преподавателя нового курса акустики Беранека, и Стивенс согласился. Вскоре после этого Беранек снова связался со Стивенсом, чтобы предложить ему должность исследователя в новом речевом проекте, который Стивенс также принял. Радиационной лаборатории в Массачусетском технологическом институте (строение 20) превращали после войны, в научно - исследовательской лаборатории электроники (RLE); Среди других лабораторий RLE организовала новую лабораторию акустики Беранека.

В ноябре 1949 года [8] кабинет рядом с офисом Кена был передан докторанту из Швеции по имени Гуннар Фант , с которым он установил дружбу и сотрудничество, которые продлились более полувека. Стивенс сосредоточился на изучении гласных во время своей докторской диссертации; в 1950 году он опубликовал небольшую статью, в которой утверждал, что автокорреляция может использоваться для различения гласных [9], а в его докторской диссертации 1952 года были представлены результаты восприятия гласных, синтезированных с помощью набора электронных резонаторов. [10] Фант убедил Стивенса, что модель речевого тракта с линией передачи была более гибкой, чем модель резонатора, и они вместе опубликовали эту работу в 1953 г. [11]

Кен считает, что Фэнту было тесно в сотрудничестве между отделом лингвистики и исследовательской лабораторией электроники Массачусетского технологического института. [5] Роман Якобсон , фонолог из Гарварда , имел офис в Массачусетском технологическом институте к 1957 году, в то время как Моррис Халле присоединился к отделу лингвистики Массачусетского технологического института и перешел в RLE в 1951 году. Сотрудничество Стивенса с Галле началось с акустики [12], но затем переросло в фокус. о том, как акустика и артикуляция организуют звуковые системы языка. [13] [14] [15]

Стивенс защитил докторскую диссертацию в 1952 году; в его докторский комитет входили его советник Лео Беранек , а также JCR Ликлайдер и Уолтер А. Розенблит . [5] После получения докторской степени Стивенс перешел на работу в компанию Bolt, Beranek and Newman (ныне BBN Technologies ) на Гарвард-сквер. [5] В начале 1950-х Беранек решил уйти с факультета Массачусетского технологического института, чтобы работать в BBN полный рабочий день. Он знал, что Стивенс любит преподавать, поэтому посоветовал Стивенсу подать заявку на должность на факультете Массачусетского технологического института. Стивенс поступил так и поступил на факультет в 1954 году.

Исследования, обучение и обслуживание [ править ]

Научный вклад [ править ]

Стивенс является самым известным за его вклад в области фонологии , восприятие речи и речеобразование . Самая известная книга Стивенса «Акустическая фонетика» [16] организована в соответствии с отличительными чертами фонологической системы Стивенса.

Вклад в фонологию [ править ]

Стивенс, пожалуй, наиболее известен своим предложением теории, которая отвечает на вопрос: почему звуки языков мира (их фонемы или сегменты) так похожи друг на друга? При первом изучении иностранного языка поражаешься замечательным различиям, которые могут существовать между звуковой системой одного языка и звуковой системой любого другого. Стивенс перевернул восприятие студента с ног на голову: вместо того, чтобы спрашивать, почему языки разные, он спросил, если звуковая система каждого языка полностью произвольна, почему языки так похожи? Его ответ - квантовая теория речи . [17] Квантовая теория поддерживается теорией языковых изменений, разработанной в сотрудничестве с Сэмюэлем Джеем Кейзером., который постулирует наличие избыточных или дополнительных функций. [18]

Методика Стивенса в исследовании звуков речи состоит из трех этапов. Первый шаг - использовать физику (в основном модели трубок) для моделирования формы артикуляторов (например, формы передней и задней полости, округления или неокругления губ и т. Д.). На основе моделей шарнирных трубок можно рассчитать резонансные частоты, которые являются формантными частотами. После расчета резонансных частот речевые данные собираются и анализируются для сравнения с теоретическими расчетами. Этот второй этап является в основном экспериментальным, когда интересующие нас токены обычно записываются либо изолированно, либо встраиваются в контролируемую несущую фразу, обычно произносимую несколькими носителями языка как женщинами, так и мужчинами.Ключ к сбору данных - это контроль как можно большего числа факторов, чтобы представляющие интерес акустические свидетельства могли быть исследованы с минимальным количеством артефактов. Последним этапом исследования является сравнение результатов данных с теоретическими предсказаниями и учет возникающих различий. Иногда различия можно объяснить тем фактом, что модели ламп обычно упрощены, чтобы не учитывать потери из-за мягкости стенок голоса (хотя к теоретической модели можно добавить резисторы). Подглоточная система также может влиять на продуктивную систему голосового тракта, когда голосовая щель большая (см. Исследование влияния речи на подсвязочный резонанс). Предсказания теоретической модели могут дать общие прогнозы относительно того, что можно ожидать от реальной речи,и свидетельства из реальной речи также могут помочь уточнить исходную модель и дать лучшее понимание создания звуков речи.

Квантовая теория стремится изящно описать (используя физику) и организовать все акустические характеристики всех возможных звуков в матрицу. (См. Пятую главу книги «Акустическая фонетика»). Конечным ограничением всех звуков речи является сама физическая артикуляционная система, что подтверждает утверждение, что среди языков может быть только конечный набор звуков. Причина того, что набор речевых звуков является конечным, заключается в том, что, хотя движение артикуляторов является непрерывным, только определенные конфигурации имеют тенденцию быть артикуляторно и / или акустически стабильными, что дает возможность фиксировать частоты для формант, которые формируют звуки, которые являются относительно универсальными для всех. языки (т.е. гласные и согласные). Таким образом, каждый акустический звук можно описать с помощью нескольких определяющих характеристик (обычно двоичных). Например, функция округления губ (включена или выключена).Еще одна особенность - высота языка (высокий или низкий). В дополнение к этим определяющим характеристикам, которые служат основным описанием акустических звуков, существуют также улучшающие функции, которые помогают сделать звуки более узнаваемыми. Для каждой из этих функций можно применить методологию Стивенса, чтобы сначала использовать модель трубки для моделирования артикуляторов и прогнозирования резонансных частот, затем собрать данные для изучения акустических свойств этой функции и, наконец, согласовать с теоретической моделью и резюмируйте акустические свойства этой особенности.Методология заключается в том, чтобы сначала использовать модель трубки для моделирования артикуляторов и прогнозирования резонансных частот, затем собрать данные для изучения акустических свойств этого элемента и, наконец, согласовать его с теоретической моделью и обобщить акустические свойства этого элемента.Методология заключается в том, чтобы сначала использовать модель трубки для моделирования артикуляторов и прогнозирования резонансных частот, затем собрать данные для изучения акустических свойств этого элемента и, наконец, согласовать его с теоретической моделью и обобщить акустические свойства этого элемента.

Чтобы познакомиться с миром речевой науки, сначала можно прочитать книгу Денеса П. и Пинсона Э. «Речевая цепочка», в которой дается широкий обзор создания и передачи речи. Один знакомится со спектрограммами и частотами формант , которые являются основным акустическим описанием звуковых сегментов.

голосовая щель [ править ]

Когда голосовые связки вибрируют, потоки воздуха проталкиваются (фильтруются) голосовым трактом, производя звук. Этот источник звука моделируется как источник тока в цепи, моделирующей производство звука. Изменения в голосовом тракте вызовут изменение производимого звука. Частота вибрации женских голосовых связок, как правило, выше, чем у мужских, что дает женским голосам более высокую высоту, чем мужские голоса.

Исследования (Hanson, HM 1997) показали, что существует разница между тем, как мужчины и женщины вибрируют голосовыми связками; женская голосовая щель более распространена, что придает женским голосам более хриплый оттенок, чем мужским.

подсвязочная система [ править ]

Под голосовой системой понимается система, которая находится ниже голосовой щели в организме человека. Он включает трахею , бронхи и легкие . По сути, это фиксированная система, поэтому она не меняется для каждого отдельного динамика. Результаты исследований показали, что во время открытой фазы голосового цикла (когда голосовая щель открыта) за счет подсвязочной системы возникает связь, которая акустически проявляется в виде пар полюс / ноль в частотной области. Предполагается, что эти пары полюс / ноль, введенные соединительной службой, служат в качестве запрещенных или нестабильных областей в спектрах, служа естественными границами для функций гласных, таких как + передний или + задний.

У взрослых мужчин резонансные частоты их подсвязочной системы наблюдались равными 600, 1550 и 2200 Гц. (Акустическая фотоэнтика, стр. 197). Один из неинвазивных способов измерения этих пиков - использование акселерометра, расположенного над вырезом на грудины (Henke), для регистрации ускорения кожи во время фонации. Вибрация улавливает резонансные частоты ниже голосовой щели (подсвязочной системы).

речевой тракт [ править ]

Голосовой тракт относится к проходу над голосовой щелью, вплоть до раскрытия губ. Модель с двумя трубками обычно используется для моделирования речевого тракта, одна из которых отражает размер (площадь поперечного сечения и длину) задней полости, а другая моделирует переднюю полость. Резонансные частоты, рассчитанные по модели трубки, являются частотами формант. Чтобы воспроизвести гласный звук шва / v /, речевой тракт относительно открыт на всем пути от голосовой щели до рта, поэтому модель трубки можно рассматривать как относительно однородную открытую трубку, равномерно разделяющую резонансные частоты (или форманты). . Излучение во рту привело бы к снижению этих резонансных частот примерно на пять процентов. (Acoustics Phonetics, стр. 139) Женские голосовые тракты (в среднем 14,1 см) в среднем короче мужских вокальных трактов (в среднем 17,7 см),таким образом, они имеют более высокие формантные частоты, чем мужчины.

Поскольку стенки речевого тракта мягкие, в речевом тракте теряется энергия, что увеличивает пропускную способность формант.

носовая полость [ править ]

Когда небно-глоточный порт открывается во время воспроизведения определенных звуков, таких как / n / и / m /, возникает связь из-за морской полости, что придает звуку носовой оттенок.

Вклад в восприятие речи [ править ]

Квантовая теория предполагает, что фонологический инвентарь языка определяется в первую очередь акустическими характеристиками каждого сегмента с границами, определяемыми акустико-артикуляторным отображением. Подразумевается, что фонологические сегменты должны иметь какой-то тип акустической инвариантности. [19] Блюмштейн и Стивенс [20] продемонстрировали то, что казалось инвариантным соотношением между акустическим спектром и воспринимаемым звуком: добавляя энергию к спектру всплеска «па» на определенной частоте, можно превратить его в « та "или" ка "соответственно, в зависимости от частоты. Наличие лишней энергии вызывает восприятие языкового согласного; его отсутствие вызывает восприятие губных.

Недавняя работа Стивенса реструктурировала теорию акустической инвариантности в неглубокую иерархическую модель восприятия, модель акустических ориентиров и отличительных черт .

Вклад в производство речи [ править ]

Во время творческого отпуска в KTH в Швеции в 1962 году Стивенс вызвался принять участие в экспериментах по кинорадиографии , проводимых Свеном Оманом. Кинорадиографические фильмы Стивенса - одни из самых распространенных; копии существуют на лазерных дисках, а некоторые доступны в Интернете. [21]

Вернувшись в Массачусетский технологический институт, Стивенс согласился руководить исследованиями студента стоматологии по имени Джозеф С. Перкелл. Знания Перкелла в области анатомии полости рта позволили ему отследить рентгеновские снимки Стивенса на бумаге и опубликовать результаты. [22]

Другие вклады в изучение производства речи включают модель, с помощью которой можно предсказать спектральную форму турбулентного речевого возбуждения (в зависимости от размеров турбулентной струи) и работу, связанную с конфигурациями голосовых складок, которые приводят к различным режимам фонирования. [23]

Стивенс как наставник [ править ]

Стивенс присоединился к Массачусетскому технологическому институту в качестве доцента в 1954 году. [24] Он стал адъюнкт-профессором в 1957 году, полным профессором в 1963 году и был назначен председателем профессора Кларенса Дж. Лебеля в 1977 году. [7] Один из его давних профессоров. сотрудники, Деннис Клатт (который написал DECtalk , работая в лаборатории Стивенса), сказал: «Как руководитель, Кен известен своей преданностью студентам и своей чудесной способностью управлять загруженной лабораторией, при этом, казалось бы, руководствуется принципом доброжелательной анархии. . " [4]

Первой докторской диссертацией, подписанной Стивенсом в Массачусетском технологическом институте, был его сокурсник Джеймс Л. Фланаган в 1955 году. Фланаган поступил в аспирантуру Массачусетского технологического института в том же году, что и Стивенс, но без предшествующей степени магистра; он получил степень магистра в 1950 году под руководством Беранека, затем защитил докторскую диссертацию под руководством Стивенса в 1955 году [25].

По оценке Стивенса в 2001 году, он руководил примерно сорока докторами наук. кандидаты. [5]

По случаю получения им золотой медали Американского акустического общества в 1995 году коллеги написали о Speech Group Стивенса, что «за почти четыре десятилетия своего существования» она «выдалась за поддержку, которую она оказала. женщины-исследователи, многие из которых вошли в высшие эшелоны исследовательских лабораторий по всему миру ». [4] Лаборатория Стивенса была названа коллегами «национальным достоянием» [6]

Профессиональное обслуживание [ править ]

Стивенс был активным членом Акустического общества Америки с тех пор, как был аспирантом. Он был членом исполнительного совета с 1963 по 1966 год, [26] вице-президентом с 1971 по 2002 год и президентом Общества с 1976 по 2007 год. [27] Он является членом ASA. В 1983 году он получил серебряную медаль в области речевой коммуникации, а в 1995 году получил золотую медаль общества. [4]

Стивенс также был активен в IEEE , где он имел звание IEEE Life Fellow. В 2004 году Кен Стивенс и Гуннар Фант стали совместными первыми победителями премии IEEE James L. Flanagan Speech and Audio Processing Award . [28]

Стивенс был членом в Американской академии искусств и наук , член Национальной академии наук , [29] является членом Национальной академии наук , [30] и 1999 получатель США Национальной медалью науки . [6]

Ссылки [ править ]

  1. Согласно документам о натурализации и его словам, он родился 23 марта 1924 года.
  2. ^ "Группа связи речи MIT" .
  3. ^ «Кеннет Стивенс, почетный профессор EECS, умер в возрасте 89 лет» . mit.edu .
  4. ^ a b c d "Золотая медаль Акустического общества Америки, 1995: Кеннет Н. Стивенс" .
  5. ^ a b c d e f g h "Стенограмма устной истории AIP - доктор Кеннет Стивенс" .
  6. ^ a b c «Д. Халбер», профессор RLE Кеннет Стивенс получает Национальную медаль науки «1 января 2000 года» .
  7. ^ a b c "Резюме консалтинга по сенсиметрии, Кеннет Н. Стивенс" .
  8. ^ "Гуннар Фант," Фонетика и фонология за последние 50 лет ", представленный на конференции" От звука к чувству: 50+ лет открытий в речевой коммуникации ", июнь 2004 г. (PDF) .
  9. KN Stevens, Автокорреляционный анализ звуков речи, J. Acoust. Soc. Am. 22: 769–771, 1950 » . Архивировано из оригинала на 2013-07-02.
  10. KN Stevens, «Восприятие звуков, формируемых резонансными контурами», 1952 . OCLC 15508683 . 
  11. ^ "Стивенс, К. Н., Касовски, С. и Фант, Г. (1953) Электрический аналог речевого тракта, Журнал Акустического общества Америки 25, 734–742" . Архивировано из оригинала на 2013-07-02.
  12. ^ Галле, Моррис; Кеннет Н. Стивенс (1959). «Анализ путем синтеза». Proc. Семинар по сжатию и обработке речи. Vol. 2 .
  13. ^ Стивенс, Кеннет Н .; Моррис Халле (1967). «Замечания по синтезу и отличительным признакам». Модели восприятия речи и визуальной формы, стр. 88–102 .
  14. ^ Галле, Моррис; Кеннет Н. Стивенс (2002) [Впервые напечатано в 1971 году]. «Заметка об особенностях гортани», стр. 45–61 . ISBN 9783110171433.
  15. ^ Галле, Моррис; Кеннет Н. Стивенс (1979). «Некоторые размышления о теоретических основах фонетики». Границы исследования речевой коммуникации, стр. 335–349 . ISBN 9780124498501.
  16. Перейти ↑ KN Stevens (2000). «Акустическая фонетика» . MIT Press.
  17. KN Stevens (1968). Квантовый характер речи: доказательства артикуляционно-акустических данных .
  18. ^ KN Стивенс; SJ Keyser (1989). " " Основные функции и их Enhancement согласными,»Язык 65 (1): 81-106" . Язык . 65 (1): 81–106. DOI : 10.2307 / 414843 . JSTOR 414843 . 
  19. ^ С. Е. Блюмштейн; К. Н. Стивенс (1979). " " Акустическая инвариантность в производстве речи: данные измерений спектральных характеристик стоп-согласных ", J. Acoust. Soc. Am. 66 (4): 1001-1017" . Архивировано из оригинала на 2013-07-02.
  20. ^ С. Е. Блюмштейн; К. Н. Стивенс (1980). " " Перцепционная инвариантность и начали спектры для остановки согласных в различных средах гласные» , J. Am Soc Acoust 67 (2):... 648-662" . Архивировано из оригинала на 2013-07-02.
  21. ^ "Рентгеновский снимок Кена Стивенса на YouTube" .
  22. ^ Джозеф С. Перкелл (1969). Физиология производства речи: результаты и последствия количественного кинорадиографического исследования (исследовательская монография) . ISBN 978-0262661706.
  23. ^ Стивенс, Кеннет Н .; 平野 実; Фонд, Голос (1981). Физиология вокальных складок, 1980, Минору Хирано и Кеннет Н. Стивенс, ред . ISBN 978-0860082811.
  24. ^ «От звука к чувству: 50+ лет открытий в речевой коммуникации» . 11 мая 2004 г.
  25. ^ Frederik Nebeker (8 апреля 1997). "Устная история IEEE: Джеймс Л. Фланаган" .
  26. ^ «Прошлые и настоящие должностные лица и члены Исполнительного совета, Акустическое общество Америки» .
  27. ^ "Визуальные архивы Эмилио Сегре, Галерея президентов членских обществ" .
  28. ^ "Сеть глобальной истории IEEE, Кеннет Н. Стивенс" .
  29. ^ "Члены NAE: доктор Кеннет Н. Стивенс" .
  30. ^ «Проблема Альбертса для новых членов NAS» . Ученый . 8 июня 1998 г.

Внешние ссылки [ править ]

  • Биография Стивенса в RLE / MIT