Из Википедии, бесплатной энциклопедии
  (Перенаправлено из Acoustic cues )
Перейти к навигации Перейти к поиску

Восприятие речи - это процесс, с помощью которого звуки языка слышатся, интерпретируются и понимаются. Изучение восприятия речи тесно связано с областями фонологии и фонетики в лингвистике и когнитивной психологии и восприятия в психологии . Исследования восприятия речи направлены на то, чтобы понять, как слушатели распознают звуки речи, и использовать эту информацию для понимания устной речи. Исследование восприятия речи находит применение в создании компьютерных систем, способных распознавать речь.в улучшении распознавания речи для слушателей с нарушениями слуха и языка, а также в обучении иностранным языкам.

Процесс восприятия речи начинается на уровне звукового сигнала и процесса прослушивания. (Полное описание процесса прослушивания см . В разделе « Слух» .) После обработки первоначального слухового сигнала звуки речи подвергаются дальнейшей обработке для извлечения акустических сигналов и фонетической информации. Затем эту речевую информацию можно использовать для языковых процессов более высокого уровня, таких как распознавание слов.

Акустические подсказки [ править ]

Рисунок 1: Спектрограммы слогов «dee» (вверху), «dah» (в центре) и «doo» (внизу), показывающие, как начальные формантные переходы , определяющие перцептивно согласный [d], различаются в зависимости от идентичности следующего гласного. . ( Форманты выделены красными пунктирными линиями; переходы - это изгибные начала траекторий формант.)

Акустические подсказки - это сенсорные подсказки, содержащиеся в речевом звуковом сигнале, которые используются при восприятии речи для различения речевых звуков, принадлежащих к разным фонетическим категориям. Например, одним из наиболее изученных сигналов в речи является время начала голоса или VOT. VOT - это основная реплика, показывающая разницу между звонкими и глухими взрывными звуками, такими как «b» и «p». Другие подсказки различают звуки, которые производятся в разных местах артикуляции или манерах артикуляции . Речевая система также должна комбинировать эти реплики, чтобы определить категорию конкретного речевого звука. Об этом часто думают в терминах абстрактных представлений фонем.. Затем эти представления могут быть объединены для использования в распознавании слов и других языковых процессах.

Непросто определить, к каким акустическим сигналам чувствительны слушатели при восприятии того или иного звука речи:

На первый взгляд решение проблемы восприятия речи кажется обманчиво простым. Если бы можно было идентифицировать отрезки акустической волны, соответствующие единицам восприятия, тогда путь от звука к значению был бы ясен. Однако это соответствие или сопоставление оказалось чрезвычайно трудно найти даже после 45 лет исследований этой проблемы. [1]

Если конкретный аспект акустической волны указывает на одну лингвистическую единицу, серии тестов с использованием синтезаторов речи будет достаточно для определения такой реплики или реплик. Однако есть два существенных препятствия:

  1. Один акустический аспект речевого сигнала может указывать на разные лингвистически значимые измерения. Например, продолжительность гласной в английском языке может указывать на то, является ли гласная ударной или же она находится в слоге, закрытом звонким или глухим согласным, а в некоторых случаях (например, в американском английском / ɛ / и / æ / ) он может различать тождество гласных. [2] Некоторые эксперты даже утверждают, что продолжительность может помочь в различении того, что традиционно называют короткими и долгими гласными в английском языке. [3]
  2. Одна языковая единица может быть запрограммирована несколькими акустическими свойствами. Например, в классическом эксперименте, Элвин Либермана (1957) показали , что начало формант переходов из / д / различаются в зависимости от последующего гласного (см рисунок 1) , но все они интерпретируются как фонема / д / слушателями. [4]

Линейность и проблема сегментации [ редактировать ]

Рисунок 2: Спектрограмма фразы «Я должен тебе». Между звуками речи нет четко различимых границ.

Хотя слушатели воспринимают речь как поток дискретных единиц [ необходима цитата ] ( фонемы , слоги и слова ), эту линейность трудно увидеть в физическом речевом сигнале (см. Пример на Рисунке 2). Звуки речи не следуют друг за другом строго, а скорее накладываются друг на друга. [5] На звук речи влияют предшествующие и последующие звуки. Это влияние может проявляться даже на расстоянии двух или более сегментов (и через границы слогов и слов). [5]

Поскольку речевой сигнал не является линейным, возникает проблема сегментации. Трудно выделить отрезок речевого сигнала как принадлежащий одной единице восприятия. Например, акустические свойства фонемы / d / будут зависеть от образования следующей гласной (из-за сращивания ).

Отсутствие инвариантности [ править ]

Исследование и применение восприятия речи должно иметь дело с несколькими проблемами, возникающими в результате того, что было названо отсутствием инвариантности. Трудно найти надежные постоянные связи между фонемой языка и ее акустическим проявлением в речи. На это есть несколько причин:

Изменения, вызванные контекстом [ править ]

Фонетическая среда влияет на акустические свойства звуков речи. Например, / u / в английском языке начинается с коронных согласных . [6] Или время начала голоса, обозначающее границу между звонкими и глухими взрывчатыми веществами, различно для губных, альвеолярных и велярных взрывных устройств, и они смещаются под действием ударения или в зависимости от положения в слоге. [7]

Вариации из-за различных условий речи [ править ]

Одним из важных факторов, вызывающих вариации, является разная скорость речи. Многие фонематические контрасты состоят из временных характеристик (короткие против долгих гласных или согласных, аффрикаты против фрикативных, взрывные против скользящих, звонкие против глухих и т. Д.), И на них, безусловно, влияют изменения в темпе речи. [1] Другим важным источником вариаций является артикуляционная осторожность и небрежность, которая типична для связной речи (артикуляционный «недокус», очевидно, отражается на акустических свойствах производимых звуков).

Различия из-за разных имен говорящих [ править ]

Результирующая акустическая структура конкретной речевой продукции зависит от физических и психологических свойств отдельных говорящих. Мужчины, женщины и дети обычно издают голоса разной высоты. Поскольку у говорящих есть речевые тракты разного размера (особенно в зависимости от пола и возраста), резонансные частоты ( форманты ), которые важны для распознавания звуков речи, будут различаться по своим абсолютным значениям у разных людей [8] (см. Рисунок 3 для иллюстрации. этого). Исследования показывают, что младенцы в возрасте 7,5 месяцев не могут распознавать информацию, представленную носителями разных полов; однако к 10,5 месяцам они могут обнаружить сходство. [9]Диалект и иностранный акцент также могут вызывать вариации, как и социальные характеристики говорящего и слушателя. [10]

Постоянство восприятия и нормализация [ править ]

Рисунок 3: На левой панели показаны 3 периферийных гласных американского английского / i / , / ɑ / и / u / на стандартном графике F1 на F2 (в Гц). Несоответствие мужских, женских и детских ценностей очевидно. На правой панели формантные расстояния (в Барке ), а не абсолютные значения нанесены с использованием процедуры нормализации, предложенной Сырдалом и Гопалом в 1986 году. [11] Формантные значения взяты из Hillenbrand et al. (1995) [8]

Несмотря на большое разнообразие говорящих и разные условия, слушатели воспринимают гласные и согласные как постоянные категории. Было предложено, что это достигается посредством процесса перцепционной нормализации, в котором слушатели отфильтровывают шум (т. Е. Вариации), чтобы прийти к основной категории. Различия в размерах голосовых трактов приводят к вариациям формантных частот у динамиков; поэтому слушатель должен приспособить свою систему восприятия к акустическим характеристикам конкретного говорящего. Этого можно достичь, рассматривая отношения формант, а не их абсолютные значения. [11] [12] [13]Этот процесс получил название нормализации голосового тракта (см. Пример на Рисунке 3). Точно так же считается, что слушатели корректируют восприятие продолжительности в соответствии с текущим темпом речи, которую они слушают - это называется нормализацией скорости речи.

Происходит ли нормализация на самом деле и какова ее точная природа, является предметом теоретических разногласий (см. Теории ниже). Постоянство восприятия - это явление, характерное не только для восприятия речи; он существует и в других типах восприятия.

Категорическое восприятие [ править ]

Рисунок 4: Пример функций идентификации (красный) и дискриминации (синий)

Категориальное восприятие участвует в процессах дифференциации восприятия. Люди воспринимают звуки речи категорично, то есть они с большей вероятностью заметят различия между категориями (фонемами), чем внутри категорий. Таким образом, пространство восприятия между категориями искажается, центры категорий (или «прототипы») работают как сито [14] или как магниты [15] для входящих звуков речи.

В искусственном континууме между глухим и звонким двугубным взрывом каждый новый шаг отличается от предыдущего количеством VOT . Первый звук - это предварительно озвученный [b] , т. Е. Он имеет отрицательный VOT. Затем, увеличивая VOT, он достигает нуля, т. Е. Взрывное устройство представляет собой простой бездыхательный безмолвный звук [p] . Постепенно, добавляя такое же количество VOT за раз, взрывное вещество в конечном итоге становится глухим двухгубным с сильным придыханием [pʰ] . (Такой континуум был использован в эксперименте Лискера и Абрамсона в 1970 году. [16] Звуки, которые они использовали, доступны в Интернете..) В этом континууме, например, из семи звуков, слушатели-носители английского языка будут идентифицировать первые три звука как / b / и последние три звука как / p / с четкой границей между двумя категориями. [16] Тест на двухальтернативную идентификацию (или категоризацию) приведет к прерывистой функции категоризации (см. Красную кривую на рисунке 4).

В тестах на способность различать два звука с различными значениями VOT, но имеющими постоянное расстояние VOT друг от друга (например, 20 мс), слушатели, вероятно, будут выступать на случайном уровне, если оба звука попадают в одну категорию и почти на 100 %, если каждый звук попадает в другую категорию (см. синюю кривую дискриминации на рисунке 4).

Вывод, который следует сделать из теста на идентификацию и дискриминацию, заключается в том, что слушатели будут иметь разную чувствительность к одному и тому же относительному увеличению VOT в зависимости от того, была ли пересечена граница между категориями. Подобная перцепционная корректировка подтверждается и для других акустических сигналов.

Влияния сверху вниз [ править ]

В классическом эксперименте Ричард М. Уоррен (1970) заменил одну фонему слова на звук, напоминающий кашель. В восприятии испытуемые без труда восстанавливали отсутствующий звук речи и не могли точно определить, какая фонема была нарушена [17]. Это явление известно как эффект восстановления фонемы . Следовательно, процесс восприятия речи не обязательно является однонаправленным.

В другом базовом эксперименте сравнивали распознавание естественно произносимых слов во фразе с теми же словами по отдельности, обнаружив, что точность восприятия обычно падает в последнем случае. Чтобы исследовать влияние семантических знаний на восприятие, Гарнс и Бонд (1976) аналогичным образом использовали предложения-носители, в которых целевые слова отличались только одной фонемой (например, залив / день / гей), качество которой изменялось в зависимости от континуума. Когда они складываются в разные предложения, каждое из которых естественным образом приводит к одной интерпретации, слушатели склонны судить о двусмысленных словах согласно значению всего предложения [18] . [19] То есть языковые процессы более высокого уровня, связанные с морфологией , синтаксисом или семантикой. может взаимодействовать с основными процессами восприятия речи, помогая распознавать звуки речи.

Может случиться так, что для слушателя нет необходимости, а может быть, даже невозможно распознавать фонемы перед распознаванием более высоких единиц, например слов. Получив по крайней мере фундаментальную информацию о фонематической структуре воспринимаемого объекта из акустического сигнала, слушатели могут компенсировать отсутствующие или замаскированные шумом фонемы, используя свои знания разговорного языка. Компенсационные механизмы могут даже работать на уровне предложения, например, в выученных песнях, фразах и стихах, эффект, подкрепленный паттернами нейронного кодирования , совместимыми с пропущенными фрагментами непрерывной речи [20], несмотря на отсутствие всей соответствующей восходящей сенсорной информации. .

Приобретенные языковые нарушения [ править ]

Первая в истории гипотеза о восприятии речи использовалась с пациентами, у которых развился дефицит слухового восприятия, также известный как рецептивная афазия . С тех пор было классифицировано множество нарушений, что привело к истинному определению «восприятия речи». [21]Термин «восприятие речи» описывает интересующий процесс, который использует сублексические контексты для процесса проверки. Он состоит из множества различных языковых и грамматических функций, таких как: особенности, сегменты (фонемы), слоговая структура (единица произношения), фонологические словоформы (то, как звуки группируются вместе), грамматические особенности, морфема (префиксы и суффиксы) и смысловая информация (значение слов). В первые годы их больше интересовала акустика речи. Например, они изучали различия между / ba / или / da /, но теперь исследования были направлены на реакцию мозга на стимулы. В последние годы была разработана модель, позволяющая понять, как работает восприятие речи; эта модель известна как модель двойного потока.Эта модель радикально изменилась по сравнению с тем, как психологи смотрят на восприятие. Первая часть модели двойного потока - это вентральный путь. Этот путь включает среднюю височную извилину, нижнюю височную борозду и, возможно,нижняя височная извилина . Вентральный путь показывает фонологические представления лексическим или концептуальным представлениям, что является значением слов. Вторая часть модели двойного потока - дорсальный путь. Этот путь включает сильвиевую теменно-височную, нижнюю лобную извилину, переднюю островковую долю и премоторную кору. Его основная функция - принимать сенсорные или фонологические стимулы и переводить их в артикуляционно-моторное представление (формирование речи). [22]

Афазия [ править ]

Афазия - это нарушение обработки речи, вызванное повреждением головного мозга. Различные части речевой обработки подвержены влиянию в зависимости от области мозга, которая повреждена, и афазия дополнительно классифицируется в зависимости от места травмы или совокупности симптомов. Повреждение области мозга Брока часто приводит к экспрессивной афазии, которая проявляется в нарушении речевой деятельности. Повреждение области Вернике часто приводит к рецептивной афазии, при которой нарушается обработка речи. [23]

Афазия с нарушением восприятия речи обычно показывает поражения или повреждения, расположенные в левой височной или теменной доле . Лексические и семантические трудности являются обычными, и понимание может быть нарушено. [23]

Агнозия [ править ]

Агнозия - это «потеря или уменьшение способности распознавать знакомые объекты или стимулы, обычно в результате повреждения мозга». [24] Существует несколько различных видов агнозии, которые влияют на все наши чувства, но два наиболее распространенных вида агнозии связаны с речью - это речевая агнозия и фонагнозия .

Речевая агнозия : чистая словесная глухота или речевая агнозия - это нарушение, при котором человек сохраняет способность слышать, воспроизводить речь и даже читать речь, но не может понимать или правильно воспринимать речь. Эти пациенты, по-видимому, обладают всеми навыками, необходимыми для правильной обработки речи, но, похоже, у них нет опыта, связанного с речевыми стимулами. Пациенты сообщали: «Я слышу, как вы говорите, но не могу перевести». [25]Даже если они физически получают и обрабатывают речевые стимулы, не имея возможности определять значение речи, они, по сути, вообще не могут воспринимать речь. Нет известных методов лечения, которые были найдены, но из тематических исследований и экспериментов известно, что речевая агнозия связана с поражениями в левом полушарии или с обоими, особенно с дисфункцией правой височно-теменной области. [26]

Фонагнозия : Фонагнозия связана с неспособностью узнавать какие-либо знакомые голоса. В этих случаях речевые стимулы можно услышать и даже понять, но связь речи с определенным голосом теряется. Это может быть связано с «ненормальной обработкой сложных вокальных свойств (тембр, артикуляция и просодия - элементы, которые отличают индивидуальный голос»). [27] Нет никакого известного лечения; тем не менее, есть отчет о женщине, страдающей эпилепсией, которая начала чтобы испытать фонагнозию наряду с другими нарушениями. Ее результаты ЭЭГ и МРТ показали «правое кортикальное теменное Т2-гиперинтенсивное поражение без усиления гадолиния и с дискретным нарушением диффузии молекул воды» [27]. Таким образом, хотя лечение не найдено, фонагнозия может быть связана с постиктальной дисфункцией теменной коры.

Восприятие речи у младенцев [ править ]

Младенцы начинают процесс овладения языком , будучи способными обнаруживать очень небольшие различия между звуками речи. Они умеют различать все возможные речевые контрасты (фонемы). Постепенно, когда они знакомятся со своим родным языком, их восприятие становится специфичным для языка, то есть они учатся игнорировать различия в фонематических категориях языка (различия, которые могут быть контрастными в других языках - например, английский различает два голоса. категории взрывчатых веществ , тогда как тайский имеет три категории; младенцы должны знать, какие различия характерны для их родного языка, а какие нет). По мере того как младенцы учатся сортировать входящие звуки речи по категориям, игнорируя несущественные различия и усиливая контрастные, их восприятие становится категоричным . Младенцы учатся противопоставлять разные гласные фонемы своего родного языка примерно к 6-месячному возрасту. Родные согласные контрасты приобретаются к 11–12-месячному возрасту. [28] Некоторые исследователи предположили, что младенцы могут изучать звуковые категории своего родного языка посредством пассивного слушания, используя процесс, называемый статистическим обучением.. Другие даже утверждают, что определенные звуковые категории являются врожденными, то есть они генетически определены (см. Обсуждение врожденной и приобретенной категориальной отличимости ).

Если однодневным детям предъявляется нормальный, ненормальный (монотонный) голос матери и чужой голос, они реагируют только на нормальный голос матери. Когда воспроизводятся человеческие и нечеловеческие звуки, младенцы поворачивают голову только к источнику человеческого звука. Было высказано предположение, что слуховое обучение начинается уже во внутриутробном периоде. [29]

Одним из методов, используемых для изучения того, как младенцы воспринимают речь, помимо упомянутой выше процедуры поворота головы, является измерение скорости их сосания. В таком эксперименте ребенок сосет специальный сосок, когда ему предъявляют звуки. Сначала устанавливается нормальная скорость сосания ребенка. Затем стимул воспроизводится повторно. Когда ребенок впервые слышит стимул, скорость сосания увеличивается, но по мере того, как ребенок привыкает к стимуляции, скорость сосания уменьшается и выравнивается. Затем ребенку дается новый стимул. Если ребенок воспринимает вновь введенный стимул как отличный от фонового, скорость сосания возрастет. [29]Скорость сосания и метод поворота головы - одни из наиболее традиционных поведенческих методов изучения восприятия речи. Среди новых методов (см. « Методы исследования» ниже), которые помогают нам изучать восприятие речи, у младенцев широко используется ближняя инфракрасная спектроскопия . [28]

Также было обнаружено, что даже если способность младенцев различать различные фонетические свойства разных языков начинает снижаться примерно в возрасте девяти месяцев, этот процесс можно обратить вспять, достаточно познакомив их с новым языком. В ходе исследования, проведенного Патрисией К. Куль, Фэн-Мин Цао и Хуэй-Мэй Лю, было обнаружено, что если с младенцами разговаривают и с ними общаются носители китайского мандаринского языка, их фактически можно научить сохранять свои способности. различать звуки речи в мандаринском диалекте, которые сильно отличаются от звуков речи в английском языке. Таким образом, доказывая, что при правильных условиях можно предотвратить потерю младенцами способности различать звуки речи на языках, отличных от тех, которые имеются в родном языке.[30]

Межъязычный и второй язык [ править ]

Большое количество исследований изучали , как пользователи языка воспринимают иностранную речь (именуемую межъязыкового восприятия речи) или второго языка- речи (второй язык восприятия речи). Последний относится к сфере овладения вторым языком .

Языки различаются по своему фонематическому инвентарю. Естественно, это создает трудности при знакомстве с иностранным языком. Например, если два звука иностранного языка отнесены к одной категории родного языка, разница между ними будет очень трудно различить. Классическим примером такой ситуации является наблюдение, что японские изучающие английский язык будут иметь проблемы с идентификацией или различением английских жидких согласных / l / и / r / (см. Восприятие английского языка / r / и / l / носителями японского языка ). [31]

Бест (1995) предложил модель перцептивной ассимиляции, которая описывает возможные модели межъязыковой ассимиляции категорий и предсказывает их последствия. [32] Флеге (1995) сформулировал модель обучения речи, которая объединяет несколько гипотез о приобретении речи на втором языке (L2) и предсказывает простыми словами, что звук L2 не слишком похож на звук на родном языке (L1). звук будет легче усвоить, чем звук L2, который относительно похож на звук L1 (потому что он будет восприниматься учащимся как более явно «другой»). [33]

С нарушением языка или слуха [ править ]

Исследование того, как люди с нарушением речи или слуха воспринимают речь, предназначено не только для выявления возможных методов лечения. Он может дать представление о принципах, лежащих в основе нормального восприятия речи. [34] Примером могут служить два направления исследований:

Слушатели с афазией [ править ]

Афазия влияет как на выражение, так и на восприятие языка. Оба наиболее распространенных типа - экспрессивная афазия и рецептивная афазия - в той или иной степени влияют на восприятие речи. Выразительная афазия вызывает умеренные трудности в понимании языка. Воздействие рецептивной афазии на понимание гораздо более сурово. Принято считать, что афазики страдают дефицитом восприятия. Обычно они не могут полностью различить место артикуляции и озвучивания. [35] Что касается других функций, трудности варьируются. Еще не доказано, влияют ли навыки восприятия речи на низком уровне у лиц, страдающих афазией, или же их трудности вызваны только нарушением более высокого уровня. [35]

Слушатели с кохлеарными имплантатами [ править ]

Кохлеарная имплантация восстанавливает доступ к акустическому сигналу у людей с нейросенсорной тугоухостью. Акустической информации, передаваемой имплантатом, обычно достаточно для пользователей имплантата, чтобы правильно распознавать речь людей, которых они знают, даже без визуальных подсказок. [36] Пользователям кохлеарных имплантатов труднее понимать неизвестные динамики и звуки. Восприятие детей, которым имплантировали после двухлетнего возраста, значительно лучше, чем у детей, которым имплантировали в зрелом возрасте. Было показано, что ряд факторов влияет на характеристики восприятия, в частности: продолжительность глухоты до имплантации, возраст начала глухоты, возраст на момент имплантации (такие возрастные эффекты могут быть связаны с гипотезой критического периода.) и продолжительность использования имплантата. Есть различия между детьми с врожденной и приобретенной глухотой. Постлингвально глухие дети имеют лучшие результаты, чем доязычные глухие, и быстрее адаптируются к кохлеарному имплантату. [36] Как у детей с кохлеарными имплантатами и нормальным слухом, гласные и время начала голоса становятся преобладающими в развитии до способности различать место артикуляции. Через несколько месяцев после имплантации дети с кохлеарными имплантатами могут нормализовать восприятие речи.

Шум [ править ]

Одна из фундаментальных проблем в изучении речи - как бороться с шумом. Об этом свидетельствует сложность распознавания человеческой речи в компьютерных системах распознавания. Хотя они могут хорошо распознавать речь, если обучены голосу конкретного говорящего и в тихих условиях, эти системы часто плохо справляются с более реалистичными ситуациями слушания, когда люди понимают речь без относительных трудностей. Для имитации шаблонов обработки, которые будут храниться в мозгу при нормальных условиях, предварительные знания являются ключевым нейронным фактором, поскольку надежная история обучения может до некоторой степени преодолевать экстремальные эффекты маскировки, связанные с полным отсутствием непрерывных речевых сигналов. [20]

Связь музыки и языка [ править ]

Исследование взаимосвязи между музыкой и познанием - это новая область, связанная с изучением восприятия речи. Первоначально предполагалось, что нейронные сигналы для музыки обрабатываются в специализированном «модуле» в правом полушарии мозга. И наоборот, нейронные сигналы для речи должны были обрабатываться аналогичным «модулем» в левом полушарии. [37] Однако с использованием таких технологий, как аппараты фМРТ, исследования показали, что две области мозга, традиционно считающиеся исключительно для обработки речи, области Брока и Вернике, также становятся активными во время музыкальной деятельности, такой как прослушивание последовательности музыкальных аккордов. [37]Другие исследования, например, проведенное Marques et al. в 2006 году показали, что 8-летние дети, которым было предоставлено шесть месяцев музыкального обучения, показали улучшение как в их способности определять высоту звука, так и в их электрофизиологических показателях, когда их заставляли слушать неизвестный иностранный язык. [38]

И наоборот, некоторые исследования показали, что вместо музыки, влияющей на наше восприятие речи, наша родная речь может влиять на наше восприятие музыки. Одним из примеров является парадокс тритона . Парадокс тритона заключается в том, что слушателю представлены два генерируемых компьютером тона (например, C и F-Sharp), которые находятся на расстоянии половины октавы (или тритона), и затем его просят определить, является ли высота тона последовательности нисходящей или Восходящий. Одно из таких исследований, проведенное г-жой Дайаной Дойч, показало, что интерпретация слушателем восходящей или нисходящей высоты тона зависела от языка или диалекта слушателя, показывая различия между теми, кто вырос на юге Англии, и теми, кто в Калифорнии, или теми, кто во Вьетнаме и те в Калифорнии, чьим родным языком был английский. [37]Второе исследование, проведенное в 2006 году на группе англоговорящих и трех группах студентов из Восточной Азии в Университете Южной Калифорнии, обнаружило, что у носителей английского языка, которые начали музыкальное обучение в возрасте 5 лет или раньше, вероятность иметь совершенный слух составляла 8%. [37]

Речевая феноменология [ править ]

Опыт речи [ править ]

Кейси О'Каллаган в своей статье « Опыт речи» анализирует, «отличается ли восприятие от слушания речи феноменальным характером» [39] в отношении понимания слышимого языка. Он утверждает, что опыт человека при слушании языка, который он понимает, в отличие от опыта, полученного им при слушании языка, которого он не знает, демонстрирует различие в феноменальных характеристиках, которые он определяет как «аспекты того, на что похож опыт» [39]. для физического лица.

Если субъекту, который является моноязычным носителем английского языка, представлен речевой стимул на немецком языке, последовательность фонем будет выглядеть как простые звуки и вызовет совершенно другой опыт, чем если бы точно такой же стимул был представлен субъекту, говорящему по-немецки. .

Он также исследует, как меняется восприятие речи при изучении языка. Если субъекту, не знающему японского языка, был предъявлен стимул японской речи, а затем он получил те же самые стимулы после обучения японскому языку , у этого же человека был бы совершенно другой опыт.

Методы исследования [ править ]

Методы, используемые в исследовании восприятия речи, можно условно разделить на три группы: поведенческие, вычислительные и, в последнее время, нейрофизиологические методы.

Поведенческие методы [ править ]

Поведенческие эксперименты основаны на активной роли участника, т.е. испытуемым предъявляются стимулы и просят принять в отношении них осознанное решение. Это может быть идентификационный тест, тест на различение , рейтинг сходства и т. Д. Эти типы экспериментов помогают дать базовое описание того, как слушатели воспринимают и классифицируют звуки речи.

Sinewave Speech [ править ]

Восприятие речи также было проанализировано с помощью синусоидальной речи, формы синтетической речи, в которой человеческий голос заменен синусоидальными волнами, имитирующими частоты и амплитуды, присутствующие в исходной речи. Когда испытуемым впервые представлена ​​эта речь, синусоидальная речь интерпретируется как случайные шумы. Но когда испытуемых информируют, что стимулы на самом деле являются речью, и им рассказывают, что они говорят, «характерный, почти мгновенный сдвиг происходит» [39] в том, как воспринимается синусоидальная речь.

Вычислительные методы [ править ]

Вычислительное моделирование также использовалось для моделирования того, как мозг может обрабатывать речь для создания наблюдаемого поведения. Компьютерные модели использовались для решения нескольких вопросов восприятия речи, в том числе того, как обрабатывается сам звуковой сигнал для извлечения акустических сигналов, используемых в речи, и как речевая информация используется для процессов более высокого уровня, таких как распознавание слов. [40]

Нейрофизиологические методы [ править ]

Нейрофизиологические методы основаны на использовании информации, полученной в результате более прямых и необязательно сознательных (предварительных) процессов. Испытуемым предъявляются речевые стимулы в различных типах задач, и измеряется реакция мозга. Сам мозг может быть более чувствительным, чем кажется, благодаря поведенческим реакциям. Например, субъект может не проявлять чувствительность к разнице между двумя звуками речи в тесте на различение, но реакции мозга могут выявить чувствительность к этим различиям. [28] Методы, используемые для измерения нейронных реакций на речь, включают связанные с событием потенциалы , магнитоэнцефалографию и ближнюю инфракрасную спектроскопию . Один важный ответ, используемый сСвязанные с событием потенциалы - это негативность несоответствия , которая возникает, когда речевые стимулы акустически отличаются от стимула, который субъект слышал ранее.

Нейрофизиологические методы были внедрены в исследование восприятия речи по нескольким причинам:

Поведенческие реакции могут отражать поздние сознательные процессы и зависеть от других систем, таких как орфография, и, таким образом, они могут маскировать способность говорящего распознавать звуки на основе акустических распределений более низкого уровня. [41]

Без необходимости принимать активное участие в тестировании, даже младенцы могут пройти тестирование; эта функция имеет решающее значение при исследовании процессов приобретения. Возможность наблюдать низкоуровневые слуховые процессы независимо от высокоуровневых позволяет решать давние теоретические вопросы, например, есть ли у людей специализированный модуль для восприятия речи [42] [43] или есть ли какие-либо сложная акустическая инвариантность (см. отсутствие инвариантности выше) лежит в основе распознавания звука речи. [44]

Теории [ править ]

Теория мотора [ править ]

Некоторые из самых ранних работ по изучению того, как люди воспринимают звуки речи, были проведены Элвином Либерманом и его коллегами из Haskins Laboratories . [45] Используя синтезатор речи, они построили звуки речи, которые изменялись в месте артикуляции по континууму от / bɑ / до / dɑ / до / ɡɑ / . Слушателей попросили определить, какой звук они слышали, и различить два разных звука. Результаты эксперимента показали, что слушатели сгруппировали звуки по дискретным категориям, хотя звуки, которые они слышали, постоянно менялись. На основе этих результатов они предложили понятие категориального восприятия. как механизм, с помощью которого люди могут распознавать звуки речи.

Более поздние исследования с использованием различных задач и методов показывают, что слушатели очень чувствительны к акустическим различиям в пределах одной фонетической категории, в отличие от строгого категориального подхода к восприятию речи.

Для теоретического рассмотрения данных категориального восприятия Либерман и его коллеги [46] разработали моторную теорию восприятия речи, в которой «сложное артикуляционное кодирование, как предполагалось, декодируется в восприятии речи теми же процессами, которые участвуют в нем. производство » [1] (это называется« анализ путем синтеза »). Например, английский согласный / d / может различаться по своим акустическим характеристикам в разных фонетических контекстах (см. Выше ), но все / d /в восприятии слушателя попадают в одну категорию (звонкие альвеолярные взрывные), и это потому, что «языковые представления являются абстрактными, каноническими, фонетическими сегментами или жестами, лежащими в основе этих сегментов». [1] При описании единиц восприятия Либерман позже отказался от артикуляционных движений и перешел к нейронным командам артикуляторам [47] и даже позже к намеченным артикуляционным жестам [48], таким образом, «нейронное представление высказывания, которое определяет продукцию говорящего. это дальний объект, который воспринимает слушатель ". [48] Теория тесно связана с модульностью гипотеза, которая предполагает существование модуля специального назначения, который должен быть врожденным и, вероятно, специфичным для человека.

Теорию критиковали за то, что она не могла «предоставить отчет о том, как акустические сигналы переводятся слушателями в намеченные жесты» [49] . Кроме того, неясно, как индексированная информация (например, идентичность говорящего) кодируется / декодируется вместе с лингвистически релевантной информацией.

Образцовая теория [ править ]

Образцовые модели восприятия речи отличаются от четырех упомянутых выше теорий, которые предполагают, что нет связи между распознаванием слова и говорящего и что различия между говорящими - это «шум», который необходимо отфильтровать.

Подходы, основанные на образцах, требуют, чтобы слушатели сохраняли информацию как для распознавания слов, так и для распознавания говорящего. Согласно этой теории, отдельные экземпляры звуков речи сохраняются в памяти слушателя. В процессе восприятия речи запомненные экземпляры, например, слога, хранящиеся в памяти слушателя, сравниваются с входящим стимулом, чтобы стимулы можно было классифицировать. Точно так же при распознавании говорящего активируются все следы в памяти высказываний, произведенных этим говорящим, и определяется личность говорящего. Эту теорию подтверждают несколько экспериментов, описанных Джонсоном [13].которые предполагают, что наша идентификация сигнала более точна, когда мы знакомы с говорящим или когда у нас есть визуальное представление пола говорящего. Когда говорящий непредсказуем или неверно определен пол, частота ошибок при распознавании слов намного выше.

Образцы моделей сталкиваются с рядом возражений, два из которых: (1) недостаточный объем памяти для хранения каждого когда-либо услышанного высказывания и (2) в отношении способности воспроизводить то, что было услышано, (2) сохраняются или вычисляются также собственные артикуляционные жесты говорящего. при произнесении высказываний, которые звучали бы как слуховые воспоминания. [13] [49]

Акустические ориентиры и отличительные особенности [ править ]

Кеннет Н. Стивенс предложил акустические ориентиры и отличительные особенности как связь между фонологическими характеристиками и слуховыми свойствами. Согласно этой точке зрения, слушатели проверяют входящий сигнал на предмет так называемых акустических ориентиров, которые представляют собой определенные события в спектре, несущие информацию о жестах, которые их производили. Поскольку эти жесты ограничены возможностями артикуляторов человека, а слушатели чувствительны к их слуховым коррелятам, отсутствие инвариантности просто не существует в этой модели. Акустические свойства ориентиров составляют основу для установления отличительных черт. Их связки однозначно определяют фонетические сегменты (фонемы, слоги, слова). [50]

В этой модели считается, что входящий акустический сигнал сначала обрабатывается для определения так называемых ориентиров, которые являются особыми спектральными событиями в сигнале; например, гласные обычно обозначаются более высокой частотой первой форманты, согласные могут быть указаны как разрывы в сигнале и имеют более низкие амплитуды в нижней и средней областях спектра. Эти акустические особенности являются результатом артикуляции. Фактически, вторичные артикуляционные движения могут использоваться, когда требуется улучшение ориентиров из-за внешних условий, таких как шум. Стивенс утверждает, что коартикуляция вызывает только ограниченное и, более того, систематическое и, следовательно, предсказуемое изменение сигнала, с которым может иметь дело слушатель. Таким образом, в рамках этой модели то, что называетсяпросто утверждается, что отсутствие инвариантности не существует.

Ориентиры анализируются для определения определенных артикуляционных событий (жестов), которые с ними связаны. На следующем этапе акустические подсказки извлекаются из сигнала вблизи ориентиров посредством мысленного измерения определенных параметров, таких как частоты спектральных пиков, амплитуды в низкочастотной области или время.

Следующий этап обработки - закрепление акустических сигналов и выделение отличительных признаков. Это бинарные категории, относящиеся к артикуляции (например, [+/- высокий], [+/- назад], [+/- круглые губы] для гласных; [+/- сонорный], [+/- латеральный] или [ +/- назальный] для согласных.

Связки этих функций однозначно идентифицируют речевые сегменты (фонемы, слоги, слова). Эти сегменты являются частью лексики, хранящейся в памяти слушателя. Его единицы активируются в процессе лексического доступа и отображаются на исходном сигнале, чтобы узнать, совпадают ли они. Если нет, делается еще одна попытка с другим подходящим шаблоном. Таким итеративным способом слушатели реконструируют артикуляционные события, необходимые для создания воспринимаемого речевого сигнала. Поэтому это можно охарактеризовать как анализ путем синтеза.

Таким образом, эта теория утверждает, что дистальным объектом восприятия речи являются артикуляционные жесты, лежащие в основе речи. Слушатели понимают речевой сигнал, обращаясь к ним. Модель относится к так называемым «анализ путем синтеза».

Нечеткая логическая модель [ править ]

Нечеткая логическая теория восприятия речи, разработанная Домиником Массаро [51], предполагает, что люди запоминают звуки речи вероятностным или градуированным способом. Это предполагает, что люди запоминают описания единиц восприятия языка, называемых прототипами. В каждом прототипе могут сочетаться различные функции. Однако функции бывают не просто двоичными (истинными или ложными), существует нечеткаязначение, соответствующее тому, насколько вероятно, что звук принадлежит к определенной речевой категории. Таким образом, при восприятии речевого сигнала наше решение о том, что мы на самом деле слышим, основано на относительной степени соответствия между информацией стимула и значениями конкретных прототипов. Окончательное решение основывается на нескольких характеристиках или источниках информации, даже на визуальной информации (это объясняет эффект Мак-Герка ). [49] Компьютерные модели теории нечеткой логики использовались, чтобы продемонстрировать, что предсказания теории о том, как классифицируются звуки речи, соответствуют поведению слушателей-людей. [52]

Гипотеза речевого режима [ править ]

Гипотеза речевого режима - это идея о том, что восприятие речи требует использования специальной умственной обработки. [53] [54] Гипотеза речевого режима является ответвлением теории модульности Фодора (см. Модульность разума ). Он использует механизм вертикальной обработки, при котором ограниченные стимулы обрабатываются специальными областями мозга, которые являются специфическими для стимулов. [54]

Две версии гипотезы речевого режима: [53]

  • Слабая версия - прослушивание речи требует предыдущего знания языка.
  • Сильная версия - слушание речи задействует специализированные речевые механизмы для восприятия речи.

В поисках доказательств гипотезы речевого режима возникли три важные экспериментальные парадигмы. Это дихотическое слушание , категориальное восприятие и дуплексное восприятие . [53] Благодаря исследованиям в этих категориях было обнаружено, что может быть не конкретный речевой режим, а режим для слуховых кодов, требующий сложной слуховой обработки. Также кажется, что модульность изучается в системах восприятия. [53] Несмотря на это, доказательства и контрдоказательства в пользу гипотезы речевого режима все еще неясны и нуждаются в дальнейших исследованиях.

Теория прямого реализма [ править ]

Прямая реалистическая теория восприятия речи ( в основном , связанное с Кэролом Fowler ) является частью более общей теории прямого реализма , который предполагает , что восприятие позволяет нам иметь непосредственное понимание мира , потому что она включает в себя прямое восстановление дистального источника из событие, которое воспринимается. Что касается восприятия речи, теория утверждает, что объекты восприятия являются действительными движениями или жестами голосового тракта, а не абстрактными фонемами или (как в моторной теории) событиями, которые причинно предшествуют этим движениям, то есть предполагаемым жестам. Слушатели воспринимают жесты не с помощью специального декодера (как в теории мотора), а потому, что информация в акустическом сигнале определяет жесты, которые его формируют.[55] Утверждая, что собственно артикуляционные жесты, производящие различные звуки речи, сами являются единицами восприятия речи, теория обходит проблему отсутствия инвариантности .

См. Также [ править ]

  • Относится к тематическому исследованию Джини (одичалый ребенок)
  • Нейрокомпьютерная обработка речи
  • Мультисенсорная интеграция
  • Происхождение речи
  • Патология речи и языка
  • Моторная теория восприятия речи

Ссылки [ править ]

  1. ^ a b c d Nygaard, LC, Pisoni, DB (1995). «Восприятие речи: новые направления в исследованиях и теории». В JL Miller; PD Eimas (ред.). Справочник восприятия и познания: речь, язык и общение . Сан-Диего: Academic Press.CS1 maint: несколько имен: список авторов ( ссылка )
  2. Перейти ↑ Klatt, DH (1976). «Лингвистическое использование сегментарной продолжительности в английском языке: акустические и перцептивные доказательства». Журнал Акустического общества Америки . 59 (5): 1208–1221. Bibcode : 1976ASAJ ... 59.1208K . DOI : 10.1121 / 1.380986 . PMID 956516 . 
  3. ^ Halle, М., Mohanan, КП (1985). «Сегментарная фонология современного английского языка». Лингвистический запрос . 16 (1): 57–116.CS1 maint: несколько имен: список авторов ( ссылка )
  4. ^ Либермана, А. М. (1957). «Некоторые результаты исследования восприятия речи» (PDF) . Журнал Акустического общества Америки . 29 (1): 117–123. Bibcode : 1957ASAJ ... 29..117L . DOI : 10.1121 / 1.1908635 . Проверено 17 мая 2007 .
  5. ^ а б Фаулер, Калифорния (1995). «Речевая продукция». В JL Miller; PD Eimas (ред.). Справочник восприятия и познания: речь, язык и общение . Сан-Диего: Academic Press.
  6. ^ Hillenbrand, JM, Кларк, MJ, Nearey, TM (2001). «Влияние окружения согласных на образные формы гласных» . Журнал Акустического общества Америки . 109 (2): 748–763. Bibcode : 2001ASAJ..109..748H . DOI : 10.1121 / 1.1337959 . PMID 11248979 . CS1 maint: несколько имен: список авторов ( ссылка )
  7. ^ Лискер, Л., Абрамсон, А.С. (1967). «Некоторые эффекты контекста на время начала голоса в английских взрывных звуках» (PDF) . Язык и речь . 10 (1): 1-28. DOI : 10.1177 / 002383096701000101 . PMID 6044530 . Проверено 17 мая 2007 .  CS1 maint: несколько имен: список авторов ( ссылка )
  8. ^ a b Хилленбранд, Дж., Гетти, Лос-Анджелес, Кларк, MJ, Уиллер, К. (1995). «Акустические характеристики гласных американского английского» . Журнал Акустического общества Америки . 97 (5 Pt 1): 3099–3111. Bibcode : 1995ASAJ ... 97.3099H . DOI : 10.1121 / 1.411872 . PMID 7759650 . CS1 maint: несколько имен: список авторов ( ссылка )
  9. ^ Хьюстон, Дерек М .; Juscyk, Питер В. (октябрь 2000 г.). «Роль информации о говорящем в сегментации слов младенцами» (PDF) . Журнал экспериментальной психологии: человеческое восприятие и производительность . 26 (5): 1570–1582. DOI : 10.1037 / 0096-1523.26.5.1570 . Архивировано из оригинального (PDF) 30 апреля 2014 года . Проверено 1 марта 2012 года .
  10. ^ Хэй, Дженнифер; Драгер, Кэти (2010). «Мягкие игрушки и восприятие речи». Лингвистика . 48 (4): 865–892. DOI : 10,1515 / LING.2010.027 .
  11. ^ а б Сырдал, АК ; Гопал, HS (1986). «Модель восприятия распознавания гласных, основанная на слуховом представлении гласных американского английского». Журнал Акустического общества Америки . 79 (4): 1086–1100. Bibcode : 1986ASAJ ... 79.1086S . DOI : 10.1121 / 1.393381 . PMID 3700864 . 
  12. ^ Стрэндж, W. (1999). «Восприятие гласных: динамическое постоянство». В Дж. М. Пикетте (ред.). Акустика речевого общения: основы, теория восприятия речи и технологии . Нидхэм-Хайтс (Массачусетс): Аллин и Бэкон.
  13. ^ a b c Джонсон, К. (2005). «Нормализация говорящего в восприятии речи» (PDF) . В Пизони, DB; Ремез Р. (ред.). Справочник по восприятию речи . Оксфорд: Blackwell Publishers . Проверено 17 мая 2007 .
  14. ^ Трубецкой, Николай С. (1969). Принципы фонологии . Беркли и Лос-Анджелес: Калифорнийский университет Press. ISBN 978-0-520-01535-7.
  15. Перейти ↑ Iverson, P., Kuhl, PK (1995). «Отображение перцептивного магнитного эффекта для речи с использованием теории обнаружения сигналов и многомерного масштабирования». Журнал Акустического общества Америки . 97 (1): 553–562. Bibcode : 1995ASAJ ... 97..553I . DOI : 10.1121 / 1.412280 . PMID 7860832 . CS1 maint: несколько имен: список авторов ( ссылка )
  16. ^ a b Лискер, Л., Абрамсон, А.С. (1970). «Голосовое измерение: некоторые эксперименты в сравнительной фонетике» (PDF) . Proc. 6-й Международный конгресс фонетических наук . Прага: Academia. С. 563–567 . Проверено 17 мая 2007 . CS1 maint: несколько имен: список авторов ( ссылка )
  17. ^ Уоррен, RM (1970). «Восстановление утраченных звуков речи». Наука . 167 (3917): 392–393. Bibcode : 1970Sci ... 167..392W . DOI : 10.1126 / science.167.3917.392 . PMID 5409744 . 
  18. ^ Garnes, S., Bond, ZS (1976). «Взаимосвязь между акустической информацией и семантическим ожиданием». Phonologica 1976 . Инсбрук. С. 285–293.CS1 maint: несколько имен: список авторов ( ссылка )
  19. ^ Jongman А, Ван У, Ким BH (декабрь 2003). «Вклад семантической и лицевой информации в восприятие несибиляторных фрикативов» (PDF) . J. Speech Lang. Слышать. Res . 46 (6): 1367–77. DOI : 10,1044 / 1092-4388 (2003/106) . hdl : 1808/13411 . PMID 14700361 . Архивировано из оригинального (PDF) 14 июня 2013 года . Проверено 14 сентября 2017 .  
  20. ^ а б Сервантес Константино, F; Саймон, JZ (2018). «Восстановлению и эффективности нейронной обработки непрерывной речи способствуют предварительные знания» . Границы системной нейробиологии . 12 (56): 56. DOI : 10,3389 / fnsys.2018.00056 . PMC 6220042 . PMID 30429778 .  
  21. ^ Поппель, Дэвид; Монахан, Филип Дж. (2008). «Восприятие речи: когнитивные основы и корковая реализация» . Современные направления психологической науки . 17 (2): 80–85. DOI : 10.1111 / j.1467-8721.2008.00553.x . ISSN 0963-7214 . 
  22. ^ Hickok G, Poeppel D (май 2007). «Корковая организация обработки речи». Nat. Rev. Neurosci . 8 (5): 393–402. DOI : 10.1038 / nrn2113 . PMID 17431404 . 
  23. ^ а б Хесслер, Дорте; Йонкерс, Бастиаансе (декабрь 2010 г.). «Влияние фонетических размерностей на афазическое восприятие речи» . Клиническая лингвистика и фонетика . 12. 24 (12): 980–996. DOI : 10.3109 / 02699206.2010.507297 . PMID 20887215 . 
  24. ^ "Определение АГНОЗИИ" . www.merriam-webster.com . Проверено 15 декабря 2017 .
  25. ^ Ховард, Гарри (2017). «Добро пожаловать в мозг и язык» . Добро пожаловать в Brain and Language .
  26. Перейти ↑ Lambert, J. (1999). «Слуховая агнозия с относительной щадью восприятия речи». Нейроказ . 5 (5): 71–82. DOI : 10.1093 / neucas / 5.5.394 . PMID 2707006 . 
  27. ^ a b Роча, София; Аморим, Хосе Мануэль; Мачадо, Альваро Александр; Феррейра, Карла Мария (01.04.2015). «Фонагнозия и неспособность воспринимать ход времени при правой теменной эпилепсии». Журнал нейропсихиатрии и клинической неврологии . 27 (2): e154 – e155. DOI : 10,1176 / appi.neuropsych.14040073 . ISSN 0895-0172 . PMID 25923865 .  
  28. ^ a b c Минагава-Кавай, Ю., Мори, К., Наои, Н., Кодзима, С. (2006). «Процессы нейронной настройки у младенцев во время приобретения языкового фонематического контраста» . Журнал неврологии . 27 (2): 315–321. DOI : 10.1523 / JNEUROSCI.1984-06.2007 . PMC 6672067 . PMID 17215392 .  CS1 maint: несколько имен: список авторов ( ссылка )
  29. ^ a b Кристалл, Дэвид (2005). Кембриджская энциклопедия языка . Кембридж: КУБОК. ISBN 978-0-521-55967-6.
  30. ^ Kuhl, Patricia K .; Фэн-Мин Цао; Хуэй-Мэй Лю (июль 2003 г.). «Опыт иностранного языка в младенчестве: влияние кратковременного воздействия и социального взаимодействия на фонетическое обучение» . Труды Национальной академии наук . 100 (15): 9096–9101. Bibcode : 2003PNAS..100.9096K . DOI : 10.1073 / pnas.1532872100 . PMC 166444 . PMID 12861072 .  
  31. ^ Айверсон, П., Кулы, ПК, Акахан-Ямад, Р., Diesh Е., Thokura Ю., Kettermann, А., Зиберт, С. (2003). «Восприятие интерференции с учетом трудностей усвоения неродных фонем». Познание . 89 (1): B47 – B57. DOI : 10.1016 / S0010-0277 (02) 00198-1 . PMID 12499111 . CS1 maint: несколько имен: список авторов ( ссылка )
  32. Best, CT (1995). «Прямой реалистический взгляд на восприятие межъязыковой речи: новые направления в исследованиях и теории». В Уинифред Стрэндж (ред.). Восприятие речи и лингвистический опыт: теоретические и методологические вопросы . Балтимор: York Press. С. 171–204.
  33. ^ Flege, J. (1995). «Изучение речи на втором языке: теория, выводы и проблемы». В Уинифред Стрэндж (ред.). Восприятие речи и лингвистический опыт: теоретические и методологические вопросы . Балтимор: York Press. С. 233–277.
  34. ^ Юлер; Ёсинага-Итано; Габбард; Ротплетц; Дженкинс (март 2011 г.). «Восприятие младенческой речи у юных пользователей кохлеарных имплантатов». Журнал Американской академии аудиологии . 22 (3): 129–142. DOI : 10.3766 / jaaa.22.3.2 . PMID 21545766 . 
  35. ^ a b Csépe, V .; Osman-Sagi, J .; Молнар, М .; Гози, М. (2001). «Нарушение восприятия речи у пациентов с афазией: событийный потенциал и нейропсихологическая оценка». Нейропсихология . 39 (11): 1194–1208. DOI : 10.1016 / S0028-3932 (01) 00052-5 . PMID 11527557 . 
  36. ^ a b Лойзу, П. (1998). «Введение в кохлеарные имплантаты». Журнал обработки сигналов IEEE . 39 (11): 101–130. DOI : 10.1109 / 79.708543 .
  37. ^ a b c d Дойч, Диана; Хенторн, Тревор; Долсон, Марк (весна 2004 г.). «Речевые модели, услышанные в раннем возрасте, влияют на более позднее восприятие тритонового парадокса» (PDF) . Восприятие музыки . 21 (3): 357–72. DOI : 10.1525 / mp.2004.21.3.357 . Проверено 29 апреля 2014 года .
  38. ^ Marques, C et al. (2007). Музыканты обнаруживают нарушение высоты звука на иностранном языке лучше, чем музыканты, не являющиеся музыкантами: поведенческие и электрофизиологические доказательства. «Журнал когнитивной неврологии, 19», 1453–1463.
  39. ^ a b c О'Каллаган, Кейси (2010). «Переживание речи» . Философские вопросы . 20 : 305–327. DOI : 10.1111 / j.1533-6077.2010.00186.x .
  40. Перейти ↑ McClelland, JL & Elman, JL (1986). «Модель восприятия речи TRACE» (PDF) . Когнитивная психология . 18 (1): 1–86. DOI : 10.1016 / 0010-0285 (86) 90015-0 . PMID 3753912 . Архивировано из оригинального (PDF) 21 апреля 2007 года . Проверено 19 мая 2007 .  
  41. ^ Казанина Н., Филлипс С., Idsardi, W. (2006). «Влияние значения на восприятие звуков речи» (PDF) . PNAS . 30 . С. 11381–11386 . Проверено 19 мая 2007 . CS1 maint: несколько имен: список авторов ( ссылка )[ постоянная мертвая ссылка ]
  42. ^ Gocken, JM & Fox RA (2001). «Неврологические доказательства в поддержку специализированного модуля фонетической обработки» . Мозг и язык . 78 (2): 241–253. DOI : 10,1006 / brln.2001.2467 . PMID 11500073 . 
  43. ^ Деан-Ламбертз, Г., Pallier, К., Serniclaes, В., Спренгер-Charolles, Л., Jobert, А., и Деан, С. (2005). «Нейронные корреляты переключения от слухового восприятия к речевому» (PDF) . NeuroImage . 24 (1): 21–33. DOI : 10.1016 / j.neuroimage.2004.09.039 . PMID 15588593 . Проверено 4 июля 2007 .  CS1 maint: несколько имен: список авторов ( ссылка )
  44. ^ Näätänen, R. (2001). «Восприятие звуков речи человеческим мозгом, отраженное негативностью несоответствия (MMN) и его магнитным эквивалентом (MMNm)» . Психофизиология . 38 (1): 1-21. DOI : 10.1111 / 1469-8986.3810001 . PMID 11321610 . 
  45. ^ Либермана, М. Харрис, KS, Hoffman, HS, Griffith, BC (1957). «Различение звуков речи внутри и вне границ фонем» (PDF) . Журнал экспериментальной психологии . 54 (5): 358–368. DOI : 10.1037 / h0044417 . PMID 13481283 . Проверено 18 мая 2007 .  CS1 maint: несколько имен: список авторов ( ссылка )
  46. ^ Либерман, М., Купер, FS, Shankweiler, ДП, и Studdert-Кеннеди, М. (1967). «Восприятие речевого кода» (PDF) . Психологический обзор . 74 (6): 431–461. DOI : 10.1037 / h0020279 . PMID 4170865 . Проверено 19 мая 2007 .  CS1 maint: несколько имен: список авторов ( ссылка )
  47. ^ Либермана, AM (1970). «Грамматики речи и языка» (PDF) . Когнитивная психология . 1 (4): 301–323. DOI : 10.1016 / 0010-0285 (70) 90018-6 . Проверено 19 июля 2007 .
  48. ^ a b Либерман, AM & Mattingly, IG (1985). «Двигательная теория восприятия речи в редакции» (PDF) . Познание . 21 (1): 1–36. CiteSeerX 10.1.1.330.220 . DOI : 10.1016 / 0010-0277 (85) 90021-6 . PMID 4075760 . Проверено 19 июля 2007 .   
  49. ^ a b c Хейворд, Катрина (2000). Экспериментальная фонетика: введение . Харлоу: Лонгман.
  50. Перейти ↑ Stevens, KN ​​(2002). «К модели лексического доступа, основанной на акустических ориентирах и отличительных признаках» (PDF) . Журнал Акустического общества Америки . 111 (4): 1872–1891. Bibcode : 2002ASAJ..111.1872S . DOI : 10.1121 / 1.1458026 . PMID 12002871 . Архивировано из оригинального (PDF) 09.06.2007 . Проверено 17 мая 2007 .  
  51. Перейти ↑ Massaro, DW (1989). «Тестирование между моделью TRACE и нечеткой логической моделью восприятия речи». Когнитивная психология . 21 (3): 398–421. DOI : 10.1016 / 0010-0285 (89) 90014-5 . PMID 2758786 . 
  52. Перейти ↑ Oden, GC, Massaro, DW (1978). «Интеграция естественной информации в восприятие речи». Психологический обзор . 85 (3): 172–191. DOI : 10.1037 / 0033-295X.85.3.172 . PMID 663005 . CS1 maint: несколько имен: список авторов ( ссылка )
  53. ^ a b c d Ингрэм, Джон. CL (2007). Нейролингвистика: Введение в обработку разговорной речи и ее расстройства . Кембридж: Издательство Кембриджского университета. стр.  113 -127.
  54. ^ a b Паркер, Эллен М .; Р.Л. Диль; KR Kluender (1986). «Торговые отношения в речи и без речи» . Внимание, восприятие и психофизика . 39 (2): 129–142. DOI : 10.3758 / bf03211495 . PMID 3725537 . 
  55. ^ Рэнди Л. Дил; Эндрю Дж. Лотто; Лори Л. Холт (2004). «Восприятие речи» . Ежегодный обзор психологии . 55 (1): 149–179. DOI : 10.1146 / annurev.psych.55.090902.142028 . PMID 14744213 . 

Внешние ссылки [ править ]

  • Специальный выпуск Philosophical Transactions B о восприятии речи. Некоторые статьи находятся в свободном доступе.