Из Википедии, бесплатной энциклопедии
  (Перенаправлено из модели Рескорла-Вагнера )
Перейти к навигации Перейти к поиску

Модель Рескорла – ВагнераRW ») - это модель классической обусловленности., в котором обучение концептуализируется в терминах ассоциаций между условными (CS) и безусловными (US) стимулами. Сильная ассоциация CS-США, по сути, означает, что CS сигнализирует или предсказывает США. Можно сказать, что до кондиционирования субъект удивлен США, но после кондиционирования субъект больше не удивляется, потому что CS предсказывает приход США. Модель разбивает процессы кондиционирования на дискретные испытания, во время которых стимулы могут либо присутствовать, либо отсутствовать. Сила предсказания УЗИ на испытании может быть представлена ​​как сумма ассоциативных сил всех КС, присутствующих во время испытания. Эта особенность модели представляла собой серьезный прогресс по сравнению с предыдущими моделями, и она позволила напрямую объяснить важные экспериментальные явления, в первую очередьблокирующий эффект . Неудачи модели привели к модификациям, альтернативным моделям и многим дополнительным выводам. Модель оказала некоторое влияние на нейронику в последние годы, поскольку исследования показали, что фазовая активность дофаминовых нейронов в мезостриатальных проекциях DA в среднем мозге кодирует тип ошибки прогнозирования, подробно описанный в модели. [1]

Модель Рескорла – Вагнера была создана психологами Йельского университета Робертом А. Рескорла и Алланом Р. Вагнером в 1972 году.

Основные предположения модели [ править ]

  1. Изменение ассоциации между CS и US, которое происходит, когда они объединяются, зависит от того, насколько сильно США прогнозируются в этом испытании - то есть, неофициально, насколько "удивлен" организм США. Величина этого «сюрприза» зависит от суммарной ассоциативной силы всех сигналов, присутствующих во время этого испытания. Напротив, в предыдущих моделях изменение ассоциативной силы основывалось только на текущем значении CS.
  2. Ассоциативная сила CS представлена ​​одним числом. Ассоциация возбуждающая, если число положительное, и тормозящая, если оно отрицательное.
  3. Ассоциативная сила стимула напрямую выражается поведением, которое он вызывает / подавляет.
  4. Выпуклость из CS (альфа в уравнении) и сила США (бета) являются постоянными и не изменяются в процессе обучения.
  5. Только текущая ассоциативная сила сигнала определяет его влияние на поведение и объем обучения, который он поддерживает. Неважно, как было получено это значение прочности, будь то простое кондиционирование, восстановление или иное.

Первые два предположения были новыми в модели Рескорла – Вагнера. Последние три предположения присутствовали в предыдущих моделях и менее важны для новых прогнозов модели RW.

Уравнение [ править ]

а также

где

  • представляет собой изменение силы связи между CS, обозначенным «X», и США в одном испытании.
  • - заметность X (ограниченная 0 и 1)
  • - параметр скорости для США (ограниченный 0 и 1), иногда называемый его значением ассоциации.
  • это максимально возможное кондиционирование для США
  • - текущая ассоциативная сила X
  • это общая ассоциативная сила всех имеющихся стимулов, то есть X плюс любые другие

[2]

Пересмотренная модель RW Ван Хамма и Вассермана (1994) [ править ]

Ван Хамм и Вассерман расширили исходную модель Рескорла – Вагнера (RW) и в 1994 году ввели новый фактор в свою пересмотренную модель RW: [3]Они предположили, что не только условные стимулы, физически присутствующие в данном испытании, могут претерпевать изменения в своей ассоциативной силе, ассоциативная ценность CS также может быть изменена за счет внутрисоставной ассоциации с CS, присутствующим в этом испытании. Взаимосвязь внутри соединения устанавливается, если две CS представлены вместе во время тренировки (сложный стимул). Если одна из двух компонентных CS впоследствии будет представлена ​​отдельно, то предполагается, что активируется также представление другой (ранее спаренной) CS. Ван Хамм и Вассерман предполагают, что стимулы, косвенно активируемые через внутрисоставные ассоциации, имеют отрицательный параметр обучения - таким образом можно объяснить феномен ретроспективной переоценки.

Рассмотрим следующий пример, экспериментальную парадигму под названием «обратная блокировка», указывающая на ретроспективную переоценку, где AB - сложный стимул A + B:

  • Этап 1: AB – США
  • Этап 2: Австралия – США

Тестовые испытания: Группа 1, которая получала испытания как фазы 1, так и фазы 2, вызывает более слабый условный ответ (CR) на B по сравнению с контрольной группой, которая получала только испытания фазы 1.

Исходная модель RW не может учесть этот эффект. Но пересмотренная модель может: На Фазе 2 стимул B косвенно активируется через внутрисоставную ассоциацию с A. Но вместо положительного параметра обучения (обычно называемого альфа), когда он физически присутствует, во время Фазы 2 стимул B имеет отрицательный параметр обучения. . Таким образом, во время второй фазы ассоциативная сила B снижается, тогда как значение A увеличивается из-за его положительного параметра обучения.

Таким образом, пересмотренная модель RW может объяснить, почему CR, вызванный B после тренировки с обратной блокировкой, слабее по сравнению с кондиционированием только AB.

Некоторые провалы модели RW [ править ]

Спонтанное восстановление после исчезновения и восстановление после исчезновения, вызванное обработкой напоминанием (восстановление)
Хорошо установлено наблюдение, что интервал тайм-аута после завершения вымирания приводит к частичному восстановлению после вымирания, т. Е. Ранее угашенная реакция или ответ повторяются - но обычно на более низком уровне, чем до обучения вымиранию. Восстановление относится к феномену, когда воздействие США только после обучения после завершения вымирания приводит к частичному восстановлению после исчезновения. Модель RW не может объяснить эти явления.
Прекращение действия ранее кондиционированного ингибитора
Модель RW предсказывает, что повторное предъявление одного только условного ингибитора (CS с отрицательной ассоциативной силой) приводит к исчезновению этого стимула (снижению его отрицательной ассоциативной ценности). Это ложное предсказание. Напротив, эксперименты показывают, что повторное введение одного только условного ингибитора даже увеличивает его ингибирующий потенциал.
Облегченное повторное приобретение после исчезновения
Одно из допущений модели состоит в том, что история обусловливания CS не оказывает никакого влияния на его текущий статус - важна только его текущая ассоциативная ценность. Вопреки этому предположению, многие эксперименты [4] показывают, что стимулы, которые сначала были обусловлены, а затем погашены, легче восстановить (т. Е. Требуется меньше испытаний).
Исключительность возбуждения и торможения
Модель RW также предполагает, что возбуждение и торможение являются чертами противника. Стимул может иметь либо возбуждающий потенциал (положительная ассоциативная сила), либо тормозной потенциал (отрицательная ассоциативная сила), но не то и другое вместе. Напротив, иногда наблюдается, что стимулы могут иметь оба качества. Один из примеров - обратное возбуждающее кондиционирование.в котором CS имеет обратную пару с US (US – CS вместо CS – US). Обычно это заставляет CS стать условным возбудителем. Стимул также имеет тормозящие свойства, что может быть доказано тестом на задержку усвоения. Этот тест используется для оценки ингибирующего потенциала стимула, поскольку наблюдается замедление возбуждающего кондиционирования с помощью ранее кондиционированного ингибитора. Обратно обусловленный раздражитель проходит этот тест и, следовательно, имеет как возбуждающие, так и тормозящие свойства.
Сочетание нового стимула с условным ингибитором
Предполагается, что условный ингибитор имеет отрицательную ассоциативную ценность. Представляя ингибитору новый стимул (т. Е. Его ассоциативная сила равна нулю), модель предсказывает, что новый сигнал должен стать условным возбудителем. В экспериментальных ситуациях дело обстоит иначе. Прогнозы модели основаны на ее основном термине (лямбда-V). Так как суммарная ассоциативная сила всех стимулов (V), присутствующих в испытании, отрицательна (ноль + ингибирующий потенциал), а лямбда равна нулю (нет US), результирующее изменение ассоциативной силы будет положительным, что делает новый сигнал условным. возбудитель.
CS-предэкспозиционный эффект
Эффект предэкспозиции CS (также называемый латентным торможением ) - это хорошо установленное наблюдение, согласно которому кондиционирование после воздействия стимула, позже используемого в качестве CS в кондиционировании, замедляется. Модель RW не предсказывает никакого эффекта от представления нового стимула без США.
Кондиционирование высшего порядка
В кондиционировании более высокого порядка ранее кондиционированный CS соединяется с новым сигналом (т.е. сначала CS1 – US, затем CS2 – CS1). Обычно это заставляет новую реплику CS2 вызывать схожие реакции с CS1. Модель не может объяснить это явление, поскольку во время испытаний CS2 – CS1 УЗИ отсутствует. Но позволяя CS1 действовать аналогично США, можно согласовать модель с этим эффектом.
Сенсорная предварительная подготовка
Сенсорное прекондиционирование относится к сначала объединению двух новых сигналов (CS1 – CS2), а затем объединению одного из них с US (CS2 – US). Это превращает CS1 и CS2 в условные возбудители. Модель RW не может объяснить это, поскольку во время фазы CS1 – CS2 оба стимула имеют ассоциативное значение, равное нулю, и лямбда также равна нулю (отсутствие УЗИ), что не приводит к изменению ассоциативной силы стимулов.

Успех и популярность [ править ]

Модель Рескорла – Вагнера своим успехом обязана нескольким факторам, в том числе [2]

  • у него относительно мало свободных параметров и независимых переменных
  • он может генерировать четкие и порядковые прогнозы
  • он сделал ряд успешных прогнозов
  • используя такие термины, как «предсказание» и «неожиданность», модель имеет интуитивно понятную привлекательность.
  • он породил множество исследований, в том числе множество новых открытий и альтернативных теорий.

Ссылки [ править ]

  1. ^ Hazy, Thomas E .; Франк, Майкл Дж .; О'Рейли, Рэндалл К. (01.04.2010). «Нейронные механизмы, поддерживающие приобретенные фазовые дофаминовые реакции в обучении: интегративный синтез» . Неврология и биоповеденческие обзоры . 34 (5): 701–720. DOI : 10.1016 / j.neubiorev.2009.11.019 . ISSN  0149-7634 . PMC  2839018 . PMID  19944716 .
  2. ^ a b Миллер, Ральф Р .; Барнет, Роберт С .; Грэхем, Николас Дж. (1995). «Оценка модели Рескорла-Вагнера» (PDF) . Психологический бюллетень . Американская психологическая ассоциация. 117 (3): 363–386. DOI : 10.1037 / 0033-2909.117.3.363 . PMID 7777644 .  
  3. ^ Ван Хамм, LJ; Вассерман, EA (1994). «Соревнование реплик в суждениях о причинно-следственной связи: роль непрезентации сложных элементов стимула» (PDF) . Обучение и мотивация . 25 : 127–151. Архивировано из оригинального (PDF) 07.04.2014. CS1 maint: обескураженный параметр ( ссылка )
  4. ^ Napier, RM; Macrae, M .; Кехо, EJ (1992). «Быстрое повторное приобретение в кондиционировании реакции мигательной мембраны кролика». Журнал экспериментальной психологии: процессы поведения животных (18): 182–192.
  • Рескорла, Р.А. и Вагнер, А.Р. (1972) Теория Павловского кондиционирования: вариации в эффективности подкрепления и отсутствия подкрепления , Classical Conditioning II, AH Black & WF Prokasy, Eds., Стр. 64–99. Appleton-Century-Crofts.

Внешние ссылки [ править ]

  • Scholarpedia Модель Рескорла – Вагнера
  • RW Simulator Симулятор модели Рескорла-Вагнера