Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

Оперантное обусловливание (также называемое инструментальным условием ) - это тип процесса ассоциативного обучения, посредством которого сила поведения изменяется путем подкрепления или наказания. Это также процедура, которая используется для такого обучения.

Хотя как оперантное, так и классическое обусловливание связаны с поведением, контролируемым стимулами окружающей среды, они различаются по своей природе. При оперантном обусловливании стимулы возникают, когда поведение, которое поощряется или наказывается, контролирует это поведение. Например, ребенок может научиться открывать коробку, чтобы положить внутрь сладости, или научиться не прикасаться к горячей плите; с оперантной точки зрения ящик и печь являются «различительными раздражителями». Оперантное поведение называется «добровольным». Ответы находятся под контролем организма и являются операторами. Например, ребенок может оказаться перед выбором: открыть коробку или погладить щенка.

Напротив, классическая обусловленность включает непроизвольное поведение, основанное на сочетании стимулов с биологически значимыми событиями. Ответы находятся под контролем некоторых стимулов, потому что они являются рефлексами, автоматически вызываемыми соответствующими стимулами. Например, вид сладостей может вызвать у ребенка слюноотделение, или звук хлопка двери может сигнализировать рассерженному родителю, заставляя ребенка дрожать. Слюноотделение и дрожь не действуют; они не подкрепляются своими последствиями, и они не «выбираются» добровольно.

Однако оба вида обучения могут влиять на поведение. Классически обусловленные стимулы - например, изображение конфет на коробке - могут усилить оперантную обусловленность, побуждая ребенка подойти и открыть коробку. Исследования показали, что это полезное явление в тех случаях, когда оперантное поведение подвержено ошибкам. [1]

В исследовании обучения животных в 20-м веке доминировал анализ этих двух видов обучения [2], и они до сих пор лежат в основе анализа поведения. Они также применялись для изучения социальной психологии , помогая прояснить определенные явления, такие как эффект ложного консенсуса . [1]

Историческая справка [ править ]

Эдвард Ли Торндайк в 1912 году

Закон Торндайка [ править ]

Оперантное обусловливание, иногда называемое инструментальным обучением , впервые было тщательно изучено Эдвардом Л. Торндайком (1874–1949), который наблюдал за поведением кошек, пытающихся вырваться из самодельных коробок-головоломок. [3] Кошка могла выбраться из ящика, просто потянув за шнур или толкнув шест, но когда ее сначала сдерживали, кошкам требовалось много времени, чтобы выбраться. При повторных испытаниях неэффективные ответы возникали реже, а успешные - чаще, поэтому кошки убегали все быстрее и быстрее. [3] Торндайк обобщил это открытие в своем законе действия., в котором говорится, что поведение, за которым следуют удовлетворительные последствия, как правило, повторяется, а те, которые приводят к неприятным последствиям, с меньшей вероятностью будут повторяться. Короче говоря, некоторые последствия усиливают поведение, а некоторые - ослабляют . Построив график зависимости времени побега от номера испытания, Торндайк с помощью этой процедуры получил первые известные кривые обучения животных . [4]

Похоже, что люди учатся многим простым образцам поведения посредством процесса, изученного Торндайком, который теперь называется оперантным обусловливанием. То есть ответы сохраняются, когда они приводят к успешному результату, и отбрасываются, когда они этого не делают, или когда они вызывают отвращение. Обычно это происходит без планирования какого-либо «учителя», но оперантное обусловливание использовалось родителями в обучении своих детей на протяжении тысяч лет. [5]

Б.Ф. Скиннер [ править ]

Б. Ф. Скиннер на факультете психологии Гарварда, около 1950 г.

Б. Ф. Скиннера (1904–1990) называют отцом оперантного обусловливания, и его работы часто цитируются в связи с этой темой. Его книга 1938 года «Поведение организмов: экспериментальный анализ» [6] положила начало его пожизненному исследованию оперантного обусловливания и его применению к поведению человека и животных. Следуя идеям Эрнста Маха , Скиннер отверг ссылку Торндайка на ненаблюдаемые психические состояния, такие как удовлетворение, построив свой анализ на наблюдаемом поведении и его столь же наблюдаемых последствиях. [7]

Скиннер считал, что классическая обусловленность была слишком упрощенной, чтобы ее можно было использовать для описания чего-то столь сложного, как человеческое поведение. По его мнению, оперантное кондиционирование лучше описывает человеческое поведение, поскольку оно исследует причины и следствия намеренного поведения.

Чтобы реализовать свой эмпирический подход, Скиннер изобрел камеру оперантного кондиционирования , или « ящик Скиннера », в котором такие предметы, как голуби и крысы, были изолированы и могли подвергаться тщательно контролируемым раздражителям. В отличие от коробки-головоломки Торндайка, такая компоновка позволяла испытуемому дать один или два простых повторяемых ответа, и частота таких ответов стала основным поведенческим критерием Скиннера. [8] Другое изобретение, накопительный регистратор, создавало графическую запись, по которой можно было оценить эти показатели отклика. Эти записи были первичными данными, которые Скиннер и его коллеги использовали для изучения влияния различных схем подкрепления на скорость реакции. [9]График подкрепления можно определить как «любую процедуру, доставляющую подкрепление организму в соответствии с четко определенным правилом». [10] Эффекты расписания стали, в свою очередь, основными выводами, на основе которых Скиннер разработал свою концепцию оперантного обусловливания. Он также опирался на многие менее формальные наблюдения за поведением людей и животных. [11]

Многие работы Скиннера посвящены применению оперантной обусловленности к человеческому поведению. [12] В 1948 году он опубликовал « Уолден-Два» , вымышленный рассказ о мирном, счастливом, продуктивном сообществе, организованном вокруг его принципов кондиционирования. [13] В 1957 году Скиннер опубликовал « Вербальное поведение» , [14]который распространил принципы оперантного обусловливания на язык, форму человеческого поведения, которая ранее совершенно иначе анализировалась лингвистами и другими. Скиннер определил новые функциональные отношения, такие как «мандаты» и «такты», чтобы уловить некоторые основы языка, но он не ввел никаких новых принципов, рассматривая вербальное поведение, как любое другое поведение, контролируемое его последствиями, включая реакции аудитории говорящего.

Концепции и процедуры [ править ]

Истоки оперантного поведения: оперантная изменчивость [ править ]

Говорят, что оперантное поведение «испускается»; то есть изначально он не вызывается каким-либо конкретным стимулом. Таким образом, можно спросить, почему это вообще происходит. Ответ на этот вопрос подобен ответу Дарвина на вопрос о происхождении «новой» телесной структуры, а именно вариации и отбора. Точно так же поведение человека меняется от момента к моменту, в таких аспектах, как конкретные участвующие движения, величина приложенной силы или время реакции. Вариации, которые приводят к подкреплению, усиливаются, и если подкрепление является постоянным, поведение, как правило, остается стабильным. Однако изменчивость поведения сама по себе может быть изменена путем манипулирования определенными переменными. [15]

Изменение оперантного поведения: подкрепление и наказание [ править ]

Подкрепление и наказание - это основные инструменты, с помощью которых модифицируется оперантное поведение. Эти термины определяются по их влиянию на поведение. Либо может быть положительным, либо отрицательным.

  • Положительное подкрепление и отрицательное подкрепление увеличивают вероятность поведения, которому они следуют, в то время как положительное наказание и отрицательное наказание снижают вероятность поведения, которому они следуют.

Еще одна процедура называется «угасание».

  • Исчезновение происходит, когда ранее подкрепленное поведение больше не подкрепляется ни положительным, ни отрицательным подкреплением. Во время вымирания такое поведение становится менее вероятным. Случайное подкрепление может привести к еще более длительной задержке до угасания поведения из-за фактора обучения, состоящего в том, что для получения подкрепления становится необходим фактор повторения, по сравнению с подкреплением, предоставляемым при каждой возможности перед исчезновением. [16]

Всего существует пять последствий.

  1. Положительное подкрепление происходит тогдакогда поведение (ответ) является полезным или поведение следует другой стимулкоторый является полезным, увеличивая частоту этого поведения. [17] Например, если крыса в ящике Скиннера получает пищу, когда она нажимает на рычаг, скорость ее нажатия возрастает. Эту процедуру обычно называют просто армированием .
  2. Отрицательное подкрепление (также известное как побег) возникает, когда за поведением (реакцией) следует устранение отвращающего стимула, тем самым увеличивая частоту исходного поведения. В эксперименте с ящиком Скиннера неприятным стимулом мог быть непрерывный громкий шум внутри ящика; отрицательное подкрепление произойдет, когда крыса нажмет на рычаг, чтобы выключить шум.
  3. Позитивное наказание (также называемое «наказанием условной стимуляцией») происходит, когда за поведением (реакцией) следует отталкивающий стимул. Пример: боль от порки , которая часто приводит к снижению этого поведения. Положительное наказание - термин, сбивающий с толку, поэтому процедуру обычно называют «наказанием».
  4. Отрицательное наказание (штраф) (также называемое «наказанием условным отказом») возникает, когда за поведением (реакцией) следует устранение стимула. Пример: забрать игрушку у ребенка из-за нежелательного поведения ребенка, что приведет к уменьшению нежелательного поведения.
  5. Вымирание происходит, когда ранее подкрепленное поведение (реакция) больше не действует. Пример: крысе сначала дают еду много раз за нажатие на рычаг, пока экспериментатор не перестанет выдавать еду в качестве награды. Крыса обычно нажимала на рычаг реже, а затем останавливалась. В этом случае нажатие на рычаг будет «погашено».

Важно отметить, что об акторах (например, о крысе) не говорят как о подкреплении, наказании или подавлении; это действия , которые подкрепляются, наказываются или исключаются. Подкрепление, наказание и исчезновение - это не термины, использование которых ограничено лабораторией. Естественно возникающие последствия также могут усиливать, наказывать или подавлять поведение, и не всегда планируются или реализуются намеренно.

Графики армирования [ править ]

Графики армирования - это правила, которые контролируют доставку арматуры. Правила определяют либо время, когда подкрепление должно быть доступно, или количество ответов, которые необходимо сделать, либо и то, и другое. Возможно множество правил, но следующие являются наиболее основными и часто используемыми [18] [9]

  • График с фиксированным интервалом: подкрепление происходит после первого ответа по истечении фиксированного времени после предыдущего подкрепления. Этот график дает образец ответа «остановка и бег»; то есть после тренировки по этому графику организм обычно делает паузу после подкрепления, а затем начинает быстро реагировать по мере приближения времени для следующего подкрепления.
  • График с переменным интервалом: подкрепление происходит после первого ответа по истечении переменного времени с момента предыдущего подкрепления. Этот график обычно дает относительно стабильную скорость реакции, которая зависит от среднего времени между подкреплениями.
  • График с фиксированным соотношением: подкрепление происходит после того, как с момента предыдущего подкрепления было отправлено фиксированное количество ответов. Организм, тренированный по этому графику, обычно делает паузу на некоторое время после подкрепления, а затем реагирует с высокой скоростью. Если требование ответа низкое, паузы может не быть; если потребность в реакции высока, организм может вообще перестать отвечать.
  • График с переменным соотношением: подкрепление происходит после того, как с момента предыдущего подкрепления было отправлено переменное количество ответов. Этот график обычно дает очень высокую и постоянную скорость ответа.
  • Непрерывное подкрепление: подкрепление происходит после каждого ответа. Организмы обычно реагируют настолько быстро, насколько могут, учитывая время, необходимое для получения и потребления подкрепления, до тех пор, пока они не насытятся.

Факторы, влияющие на эффективность подкрепления и наказания [ править ]

Эффективность подкрепления и наказания можно изменить.

  1. Насыщение / депривация : эффективность положительного или «аппетитного» стимула будет снижена, если человек получил достаточно этого стимула, чтобы удовлетворить свой аппетит. Противоположный эффект произойдет, если индивид лишится этого стимула: тогда эффективность последствий возрастет. Человек с полным желудком не будет чувствовать себя таким мотивированным, как голодный. [19]
  2. Непосредственность : Непосредственное следствие является более эффективным , чем замедленным один. Если дать собаке лакомство для сидения в течение пяти секунд, собака научится быстрее, чем если бы лакомство было дано через тридцать секунд. [20]
  3. Непредвиденные обстоятельства : для максимальной эффективности подкрепление должно происходить последовательно после ответов, а не в другое время. Обучение может быть медленнее, если подкрепление носит прерывистый характер, то есть следует только за некоторыми экземплярами одного и того же ответа. Периодически подкрепляемые ответы обычно гаснут медленнее, чем ответы, которые всегда подкреплялись. [19]
  4. Размер : размер или количество стимула часто влияет на его силу в качестве подкрепления. Люди и животные занимаются анализом затрат и выгод. Если рычажный пресс приносит десять пищевых гранул, нажатию рычага можно научиться быстрее, чем если пресс дает только одну гранулу. Куча четвертей из игрового автомата может заставить игрока тянуть за рычаг дольше одной четверти.

Большинство этих факторов выполняют биологические функции. Например, процесс насыщения помогает организму поддерживать стабильную внутреннюю среду ( гомеостаз ). Например, когда организм лишен сахара, вкус сахара является эффективным усилителем. Когда уровень сахара в крови в организме достигает или превышает оптимальный уровень, вкус сахара становится менее эффективным или даже неприятным.

Формирование [ править ]

Формирование - это метод кондиционирования, который часто используется при дрессировке животных и в обучении невербальных людей. Это зависит от оперантной изменчивости и подкрепления, как описано выше. Тренер начинает с определения желаемого конечного (или «целевого») поведения. Затем дрессировщик выбирает поведение, которое животное или человек уже издает с некоторой вероятностью. Затем форма этого поведения постепенно изменяется в ходе последовательных испытаний за счет усиления поведения, которое все больше и больше приближается к целевому поведению. Когда целевое поведение, наконец, проявляется, оно может быть усилено и поддержано с помощью графика подкрепления.

Безусловное подкрепление [ править ]

Неконтролируемое подкрепление - это доставка подкрепляющих стимулов независимо от поведения организма. Неконтролируемое подкрепление может использоваться в попытке уменьшить нежелательное целевое поведение путем усиления множества альтернативных ответов при одновременном подавлении целевого ответа. [21] Поскольку никакое измеряемое поведение не идентифицируется как усиливающееся, существуют разногласия по поводу использования термина «неконтролируемое подкрепление». [22]

Стимул-контроль оперантного поведения [ править ]

Хотя изначально оперантное поведение излучается без идентифицированной ссылки на конкретный стимул, во время оперантного обусловливания операнты попадают под контроль стимулов, которые присутствуют, когда поведение подкрепляется. Такие стимулы называются «различительными стимулами». Результатом является так называемая « трехчленная непредвиденная ситуация ». То есть различающие стимулы создают повод для реакций, которые производят вознаграждение или наказание. Пример: крысу можно обучить нажимать на рычаг, только когда загорается свет; собака устремляется на кухню, когда слышит, как ее мешок с едой дребезжит; ребенок тянется за конфетой, когда видит ее на столе.

Дискриминация, обобщение и контекст [ править ]

Большая часть поведения находится под контролем стимулов. Можно выделить несколько аспектов этого:

  • Дискриминация обычно возникает, когда реакция усиливается только при наличии определенного стимула. Например, голубя можно кормить за то, что он клюет на красный свет, а не на зеленый; как следствие, он клюет красный и перестает клевать зеленый. Было изучено множество сложных комбинаций раздражителей и других условий; например, организм может быть усилен по интервальному графику при наличии одного стимула и по графику соотношения при наличии другого.
  • Обобщение - это тенденция реагировать на раздражители, похожие на ранее обученный различительный раздражитель. Например, обученный клевать «красный» голубь может также клевать «розовый», хотя обычно менее сильно.
  • Контекст относится к стимулам, которые постоянно присутствуют в ситуации, например, к стенам, столам, стульям и т. Д. В комнате или внутри камеры оперантного кондиционирования. Контекстные стимулы могут управлять поведением так же, как и дискриминационные стимулы, хотя обычно они более слабые. Поведение, усвоенное в одном контексте, может отсутствовать или изменяться в другом. Это может вызвать трудности для поведенческой терапии, поскольку поведение, усвоенное в терапевтических условиях, может не проявиться в других ситуациях.

Поведенческие последовательности: условное подкрепление и цепочка [ править ]

Большую часть поведения нелегко описать в терминах индивидуальных реакций, подкрепляемых один за другим. Объем оперантного анализа расширен за счет идеи поведенческих цепочек, которые представляют собой последовательности ответов, связанных вместе трехчленными условными обстоятельствами, определенными выше. Цепочка основана на экспериментально продемонстрированном факте, что различительный стимул не только создает повод для последующего поведения, но также может усилить поведение, которое ему предшествует. То есть различающий раздражитель также является «условным подкреплением». Например, свет, который задает повод для нажатия рычага, может использоваться для усиления «поворота» в присутствии шума. В результате получается последовательность «шум - разворот - свет - нажатие рычага - еда». Можно построить гораздо более длинные цепочки, добавив больше стимулов и ответов.

Побег и уклонение [ править ]

При обучении избеганию поведение прекращает действие (отталкивающего) стимула. Например, защита глаз от солнечного света прекращает (отталкивающую) стимуляцию яркого света в глазах. (Это пример негативного подкрепления, определенного выше.) Поведение, которое поддерживается за счет предотвращения стимула, называется «избеганием», как, например, надевание солнцезащитных очков перед выходом на улицу. Поведение избегания порождает так называемый «парадокс избегания», поскольку можно спросить, как отсутствие стимула может служить подкреплением? Этот вопрос решается несколькими теориями избегания (см. Ниже).

Обычно используются два типа экспериментальных настроек: дискриминированное обучение и обучение с избеганием свободных оперантов.

Дискриминационное обучение избеганию [ править ]

Эксперимент дискриминированного избегания включает в себя серию испытаний, в которых за нейтральным стимулом, таким как свет, следует отталкивающий стимул, такой как шок. После появления нейтрального стимула оперантный ответ, такой как нажатие на рычаг, предотвращает или прекращает действие отвращающего стимула. В ранних испытаниях субъект не реагирует до тех пор, пока не сработает отталкивающий стимул, поэтому эти ранние испытания называются испытаниями «бегства». По мере обучения субъект начинает реагировать на нейтральный стимул и, таким образом, предотвращает возникновение отталкивающего стимула. Такие испытания называются «испытаниями избегания». Говорят, что этот эксперимент включает классическое обусловливание, потому что нейтральный CS (условный стимул) сочетается с отталкивающим US (безусловный стимул);эта идея лежит в основе двухфакторной теории обучения избеганию, описанной ниже.

Обучение избеганию свободных оперантов [ править ]

При свободном оперантном избегании субъект периодически получает отвращающий стимул (часто электрический шок), если не происходит оперантный ответ; ответ задерживает начало шока. В этой ситуации, в отличие от дискриминированного избегания, никакой предшествующий стимул не сигнализирует о шоке. Два важных временных интервала определяют скорость обучения избеганию. Это первый интервал SS (шок-шок). Это время между последовательными ударами при отсутствии реакции. Второй интервал - это интервал RS (ответ-шок). Это определяет время, на которое оперантный ответ задерживает начало следующего разряда. Обратите внимание, что каждый раз, когда субъект выполняет оперантный ответ, интервал RS без шока начинается заново.

Двухпроцессная теория избегания [ править ]

Эта теория была первоначально предложена для объяснения различенного обучения избеганию, при котором организм учится избегать отталкивающего стимула, уклоняясь от сигнала для этого стимула. Здесь задействованы два процесса: классическое кондиционирование сигнала с последующим оперантным условием реакции выхода:

а) Классическая обусловленность страха. Первоначально организм испытывает сочетание CS с аверсивным УЗИ. Теория предполагает, что эта пара создает ассоциацию между CS и США посредством классической обусловленности, и из-за отталкивающей природы США CS вызывает условную эмоциональную реакцию (CER) - «страх». б) Усиление оперантной реакции уменьшением страха.В результате первого процесса CS теперь сигнализирует о страхе; эта неприятная эмоциональная реакция служит для мотивации оперантных ответов, а ответы, завершающие CS, подкрепляются прекращением страха. Обратите внимание, что в теории не говорится, что организм «избегает» США в смысле его ожидания, а скорее, что организм «избегает» отвращающего внутреннего состояния, вызванного CS. Некоторые экспериментальные данные, похоже, противоречат теории двух факторов. Например, поведение избегания часто гаснет очень медленно, даже если первоначальное соединение CS-US больше не повторяется, поэтому можно ожидать, что реакция страха исчезнет (см. Классическое обусловливание.). Кроме того, животные, которые научились избегать, часто демонстрируют мало признаков страха, предполагая, что бегство от страха не является необходимым для сохранения поведения избегания. [23]

Оперантная или "однофакторная" теория [ править ]

Некоторые теоретики предполагают, что поведение избегания может быть просто особым случаем оперантного поведения, поддерживаемого его последствиями. С этой точки зрения идея «последствий» расширена и включает чувствительность к структуре событий. Таким образом, при избегании следствием реакции является снижение скорости аверсивной стимуляции. Действительно, экспериментальные данные свидетельствуют о том, что «пропущенный шок» воспринимается как стимул и может действовать как подкрепление. Когнитивные теории избегания продвигают эту идею на шаг вперед. Например, крыса начинает «ожидать» шока, если она не нажимает на рычаг, и «не ожидать шока», если нажимает на него, и поведение избегания усиливается, если эти ожидания подтверждаются. [23]

Накопление оперантов [ править ]

Оперантное накопление относится к наблюдению, что крысы, подкрепленные определенным образом, могут позволить пищевым гранулам накапливаться в пищевом лотке вместо того, чтобы извлекать эти гранулы. В этой процедуре извлечение гранул всегда предусматривало одноминутный период исчезновения, в течение которого не было дополнительных пищевых гранул, но те, которые были накоплены ранее, могли быть потреблены. Это открытие, по-видимому, противоречит обычному выводу о том, что крысы ведут себя импульсивно в ситуациях, когда есть выбор между меньшим пищевым объектом сразу и большим пищевым объектом после некоторой задержки. Смотрите графики армирования . [24]

Нейробиологические корреляты [ править ]

Первые научные исследования по выявлению нейронов, которые реагировали таким образом, что предполагалось, что они кодируют условные стимулы, были получены в работах Махлона деЛонга [25] [26] и Р.Т. Ричардсона. [26] Они показали, что нейроны базального ядра , которые выделяют ацетилхолин во всей коре головного мозга , активируются вскоре после условного стимула или после первичного вознаграждения, если условного стимула нет. Эти нейроны одинаково активны в отношении положительных и отрицательных подкреплений, и было показано, что они связаны с нейропластичностью во многих областях коры . [27] Также существуют доказательства того, чтодофамин активируется в одно и то же время. Существует множество доказательств того, что дофамин участвует как в подкрепляющем, так и в аверсивном обучении. [28] Дофаминовые пути гораздо более плотно проецируются на лобные области коры головного мозга . Холинергические проекции, напротив, плотны даже в задних отделах коры, таких как первичная зрительная кора . Исследование пациентов с болезнью Паркинсона , состоянием, приписываемым недостаточному действию дофамина, дополнительно иллюстрирует роль дофамина в положительном подкреплении. [29]Исследование показало, что пациенты, не принимавшие лекарства, с большей готовностью учились с неприятными последствиями, чем с положительным подкреплением. Пациенты, которые принимали лекарства, показали обратное: положительное подкрепление оказалось более эффективной формой обучения при высокой активности дофамина.

Предполагается, что в основе подкрепления лежит нейрохимический процесс с участием дофамина. Когда организм испытывает усиливающий стимул, активируются дофаминовые пути в мозге. Эта сеть путей «высвобождает короткий импульс дофамина на многие дендриты , тем самым передавая глобальный сигнал подкрепления постсинаптическим нейронам ». [30]Это позволяет недавно активированным синапсам увеличивать свою чувствительность к эфферентным (проводящим наружу) сигналам, тем самым увеличивая вероятность появления недавних реакций, предшествовавших подкреплению. Эти реакции статистически наиболее вероятно были поведением, ответственным за успешное достижение подкрепления. Но когда применение подкрепления либо менее немедленное, либо менее случайное (менее последовательное), способность дофамина воздействовать на соответствующие синапсы снижается.

Вопросы о законе действия [ править ]

Ряд наблюдений, кажется, показывает, что оперантное поведение может быть установлено без подкрепления в смысле, определенном выше. Чаще всего упоминается феномен автоформирования (иногда называемый «отслеживанием знаков»), при котором за стимулом постоянно следует подкрепление, и, как следствие, животное начинает реагировать на стимул. Например, загорается клавиша ответа, а затем предлагается еда. Когда это повторяется несколько раз, голубь начинает клевать ключ, даже если еда приходит независимо от того, клюет птица или нет. Точно так же крысы начинают брать в руки небольшие предметы, например рычаг, когда пища оказывается поблизости. [31] [32] Поразительно, но голуби и крысы сохраняют такое поведение, даже когда клевание клавиши или нажатие на рычаг приводит к уменьшению количества еды (тренировка бездействия).[33] [34] Еще одно очевидное оперантное поведение, которое проявляется без подкрепления, - это контрасгрузка .

Эти и другие наблюдения, по-видимому, противоречат закону эффекта , и они побудили некоторых исследователей предложить новые концепции оперантного подкрепления (например, [35] [36] [37] ). Более общая точка зрения состоит в том, что автоформирование является примером классического обусловливания. ; Фактически процедура автоформирования стала одним из наиболее распространенных способов измерения классической обусловленности. С этой точки зрения, на многие виды поведения могут влиять как классические случайности (стимул-реакция), так и оперантные случайности (реакция-подкрепление), и задача экспериментатора состоит в том, чтобы выяснить, как они взаимодействуют. [38]

Приложения [ править ]

Подкрепление и наказание повсеместно используются в человеческих социальных взаимодействиях, и было предложено и реализовано очень много приложений оперантных принципов. Ниже приведены некоторые примеры.

Зависимость и зависимость [ править ]

Положительное и отрицательное подкрепление играют центральную роль в развитии и сохранении зависимости и наркотической зависимости . Наркотик, вызывающий привыкание, по своей сути полезен ; то есть он действует как основной положительный стимул к употреблению наркотиков. Система вознаграждения мозга придает ему значимость стимула (т.е. он «желателен» или «желателен») [39] [40] [41], так что по мере развития зависимости лишение наркотика приводит к влечению. Кроме того, стимулы, связанные с употреблением наркотиков - например, вид шприца и место использования - становятся связанными с интенсивным подкреплением, вызываемым наркотиком. [39] [40] [41]Эти ранее нейтральные стимулы приобретают несколько свойств: их появление может вызывать тягу и может стать условным положительным подкреплением при продолжении употребления. [39] [40] [41] Таким образом, если зависимый человек сталкивается с одним из этих наркотических сигналов, тяга к связанному с ним наркотику может появиться снова. Например, агентства по борьбе с наркотиками ранее использовали плакаты с изображениями принадлежностей для наркотиков как попытку показать опасность употребления наркотиков. Однако такие плакаты больше не используются из-за эффекта значимости стимулов, вызывающего рецидив при виде стимулов, изображенных на плакатах.

У наркозависимых лиц отрицательное подкрепление возникает, когда препарат вводится самостоятельно , чтобы облегчить или «избежать» симптомов физической зависимости (например, тремора и потоотделения) и / или психологической зависимости (например, ангедонии , беспокойства, раздражительности и тревога), возникающие во время отмены препарата . [39]

Дрессировка животных [ править ]

Дрессировщики и владельцы домашних животных применяли принципы и практики оперантного кондиционирования задолго до того, как эти идеи были названы и изучены, и дрессировка животных по-прежнему является одним из самых ярких и убедительных примеров оперантного контроля. Из концепций и процедур, описанных в этой статье, наиболее заметными являются следующие: (а) наличие первичного подкрепления (например, мешок собачьих вкусняшек); (б) использование вторичного подкрепления (например, щелчок кликера сразу после желаемого ответа, а затем вкуснятина); (c) случайность, гарантирующая, что подкрепление (например, кликер) следует желаемому поведению, а не чему-то еще; (г) формирование, как в постепенном приучении собаки прыгать все выше и выше; (д) периодическое усиление,как в постепенном снижении частоты подкрепления, чтобы вызвать стойкое поведение без насыщения; (е) цепочка, когда сложное поведение постепенно строится из более мелких единиц.[42]

Пример дрессировки животных из Seaworld, связанный с оперантной обусловленностью [43]

Дрессировка животных влияет на положительное и отрицательное подкрепление. График подкреплений может сыграть большую роль в дрессировке животных.

Прикладной анализ поведения [ править ]

Прикладной анализ поведения - это дисциплина, инициированная Б. Ф. Скиннером, которая применяет принципы обусловливания к модификации социально значимого человеческого поведения. В нем используются основные концепции теории обусловливания, включая условный стимул (S C ), различительный стимул (S d ), ответ (R) и подкрепляющий стимул (S rein или S r для подкрепляющих, иногда S ave для отталкивающих стимулов). [23]Условный стимул контролирует поведение, развиваемое респондентом (классическое), например, эмоциональные реакции. Три других термина вместе образуют «трехчленную случайность» Скиннера: различительный стимул дает повод для реакций, которые приводят к подкреплению. Исследователи обнаружили, что следующий протокол является эффективным, когда они используют инструменты оперантного обусловливания для изменения человеческого поведения: [ необходима цитата ]

  1. Государственная цель Уточните, какие именно изменения должны быть осуществлены. Например, «снизить вес на 30 фунтов».
  2. Наблюдение за поведением Следите за поведением, чтобы можно было видеть, возникают ли желаемые эффекты. Например, ведите таблицу ежедневных весов.
  3. Подкрепляйте желаемое поведение Например, поздравьте человека с потерей веса. У людей запись поведения может служить подкреплением. Например, когда участник видит закономерность потери веса, это может усилить продолжение поведенческой программы похудания. Однако люди могут воспринимать подкрепление, которое должно быть положительным, как отрицательное и наоборот. Например, запись о потере веса может действовать как отрицательное подкрепление, если она напоминает человеку, насколько он на самом деле тяжел. Лексема экономика , является обмен системой , в которой жетоны приведены в качестве награды за желаемое поведение. Позже токены можно обменять на желаемый приз или награды, такие как власть, престиж, товары или услуги.
  4. Уменьшите стимулы к нежелательному поведению. Например, уберите с кухонных полок конфеты и жирные закуски.

Практики прикладного анализа поведения (ABA) используют эти процедуры, а также их множество вариаций и усовершенствований для решения различных социально значимых форм поведения и проблем. Во многих случаях практикующие врачи используют оперантные методы для выработки конструктивного, социально приемлемого поведения, которое заменяет аберрантное поведение. Методы ABA были эффективно применены к таким вещам, как ранние интенсивные поведенческие вмешательства для детей с расстройствами аутистического спектра (РАС) [44], исследования принципов, влияющих на преступное поведение , профилактика ВИЧ, [45] сохранение природных ресурсов, [ 46] образование, [47] геронтология ,[48] здоровье и физические упражнения , [49] промышленная безопасность , [50] овладение языком , [51] мусор, [52] медицинские процедуры , [53] воспитание детей, [54] психотерапия , [ необходима ссылка ] использование ремней безопасности, [55] тяжелые психические расстройства , [56] спорт, [57] злоупотребление психоактивными веществами , фобии , педиатрические нарушения питания, а также управление зоопарком и уход за животными . [58] Некоторые из этих приложений описаны ниже.

Поведение детей - обучение родителей [ править ]

Обеспечение положительного подкрепления правильного поведения ребенка является одним из основных направлений обучения родителей управлению. Как правило, родители учатся вознаграждать за соответствующее поведение социальными поощрениями (такими как похвала, улыбки и объятия), а также конкретными наградами (например, наклейками или указаниями на более крупное вознаграждение в рамках системы стимулов, созданной совместно с ребенком). [59] Кроме того, родители учатся выбирать простое поведение в качестве начального фокуса и вознаграждают за каждый из маленьких шагов, которые их ребенок делает для достижения большей цели (эта концепция называется «последовательные приближения»). [59] [60]

Экономика [ править ]

И психологи, и экономисты заинтересовались применением оперантных концепций и открытий к поведению людей на рынке. Примером может служить анализ потребительского спроса, индексированного по количеству приобретенного товара. В экономике степень влияния цены на потребление называется «эластичностью спроса по цене». Некоторые товары более эластичны, чем другие; например, изменение цен на определенные продукты питания может иметь большое влияние на покупаемое количество, в то время как на бензин и другие повседневные предметы потребления изменения цен могут в меньшей степени повлиять. С точки зрения оперантного анализа, такие эффекты могут быть интерпретированы с точки зрения мотивации потребителей и относительной ценности товаров как подкрепляющих факторов. [61]

Азартные игры - расписание с переменным соотношением [ править ]

Как говорилось ранее в этой статье, график с переменным соотношением дает подкрепление после выдачи непредсказуемого числа ответов. Этот график обычно обеспечивает быструю и настойчивую реакцию. Игровые автоматы окупаются по графике соотношения переменного, и они производят именно такого рода упорного рычага таскания поведения игроков. Выплаты с переменным соотношением от игровых автоматов и других форм азартных игр часто упоминались как фактор, лежащий в основе игровой зависимости. [62]

Военная психология [ править ]

У людей есть врожденное сопротивление убийству, и они не хотят действовать прямым агрессивным образом по отношению к представителям своего собственного вида, даже ради спасения жизни. Это сопротивление убийству сделало пехоту чрезвычайно неэффективной на протяжении всей истории военных действий. [63]

Этот феномен не был понят до тех пор, пока SLA Marshall (бригадный генерал и военный историк) не провела интервью с пехотой Второй мировой войны сразу после боевого столкновения. В известной и противоречивой книге Маршалла «Люди против огня» говорится, что только 15% солдат стреляли из винтовок с целью убить в бою. [64] После принятия исследований Маршалла в армию США в 1946 году Отдел исследований кадровых ресурсов армии США начал внедрять новые протоколы обучения, которые напоминают методы оперантного кондиционирования. Последующее применение таких методов увеличило процент солдат, способных убивать, примерно до 50% в Корее и более 90% во Вьетнаме. [63] Революции в обучении включали замену традиционных всплывающих стрельбищ трехмерными всплывающими целями в форме человека, которые разрушались при попадании. Это обеспечило немедленную обратную связь и послужило положительным подкреплением для поведения солдата. [65] Другие улучшения методов военной подготовки включали курс стрельбы по времени; более реалистичное обучение; частые повторы; похвала начальства; награды за меткую стрельбу; и групповое признание. Отрицательное подкрепление включает подотчетность сверстников или требование пересдать курсы. Современная военная подготовка создает условия для реакции среднего мозга на боевое давление, тщательно моделируя реальный бой, используя в основном павловские классические кондиционеры и Скиннера.оперантное обусловливание (обе формы бихевиоризма ). [63]

Современное обучение меткой стрельбе является таким прекрасным примером бихевиоризма, что оно годами использовалось во вводном курсе психологии, преподаваемом всем курсантам в Военной академии США в Вест-Пойнте, как классический пример оперантной обусловленности. В 1980-х годах во время визита в Вест-Пойнт Б. Ф. Скиннер определил современную военную стрельбу как почти идеальное применение оперантной обусловленности. [65]

Подполковник Дэйв Гроссман заявляет об оперирующей физической подготовке и военной подготовке в США, что:

Вполне возможно, что никто намеренно не использовал методы оперантного кондиционирования или модификации поведения для обучения солдат в этой области ... Но с точки зрения психолога, который также является историком и кадровым военным, для меня становится все более очевидным, что это именно то, что было достигнуто. [63]

Теория подталкивания [ править ]

Теория подталкивания (или подталкивания) - это концепция в бихевиористской науке , политической теории и экономике, которая утверждает, что косвенные предложения, направленные на достижение ненасильственного соблюдения, могут влиять на мотивы, стимулы и принятие решений группами и отдельными лицами, по крайней мере, столь же эффективно, не более эффективно - чем прямое указание, законодательство или правоприменение.

Хвала [ править ]

Концепция похвалы как средства поведенческого подкрепления уходит корнями в модель оперантного обусловливания Б. Ф. Скиннера. Через эту призму похвала рассматривается как средство положительного подкрепления, при котором наблюдаемое поведение повышается за счет случайной похвалы за такое поведение. [66] Сотни исследований продемонстрировали эффективность похвалы в поощрении позитивного поведения, в частности, в исследовании того, как учителя и родители используют похвалу в отношении ребенка для улучшения поведения и успеваемости, [67] [68] но также и в исследовании производительность труда. [69]Также было продемонстрировано, что похвала усиливает позитивное поведение у соседних людей, которых не хвалят (например, у одноклассника получателя похвалы) через косвенное подкрепление. [70] Похвала может быть более или менее эффективной в изменении поведения в зависимости от ее формы, содержания и подачи. Для того, чтобы похвала повлияла на положительное изменение поведения, она должна зависеть от положительного поведения (т. Е. Вводиться только после того, как целевое поведение реализовано), должна указывать особенности поведения, которое должно быть усилено, и должна быть искренне и искренне выражена. достоверно. [71]

Признавая эффект похвалы как позитивной стратегии подкрепления, многочисленные поведенческие и когнитивные поведенческие вмешательства включали использование похвалы в свои протоколы. [72] [73] Стратегическое использование похвалы признано научно обоснованной практикой как в управлении классом [72], так и в программах обучения родителей, [68] хотя похвалы часто относят к более широкой категории положительного подкрепления в исследованиях вмешательства. который включает в себя такие стратегии, как стратегическое внимание и поведенческие вознаграждения.

Было проведено несколько исследований влияния когнитивно-поведенческой терапии и оперантно-поведенческой терапии на различные медицинские состояния. Когда пациенты разработали когнитивные и поведенческие методы, которые изменили их поведение, отношения и эмоции; тяжесть их боли уменьшилась. Результаты этих исследований показали влияние когнитивных функций на восприятие боли, а представленное воздействие объяснило общую эффективность когнитивно-поведенческой терапии (КПТ) и оперантно-поведенческой терапии (ОБТ).

Психологические манипуляции [ править ]

Брайкер выделил следующие способы, которыми манипуляторы управляют своими жертвами: [74]

  • Положительное подкрепление : включает похвалу, поверхностное обаяние , поверхностное сочувствие ( крокодиловы слезы ), чрезмерные извинения, деньги, одобрение, подарки, внимание, выражения лица, такие как принудительный смех или улыбка , и публичное признание.
  • Отрицательное подкрепление : может включать устранение одного из отрицательных ситуаций.
  • Прерывистое или частичное подкрепление : частичное или периодическое отрицательное подкрепление может создать эффективную атмосферу страха и сомнения. Частичное или периодическое положительное подкрепление может побудить жертву упорствовать - например, в большинстве форм азартных игр игрок, скорее всего, будет выигрывать время от времени, но в целом все равно теряет деньги.
  • Наказание : включает ворчание , крик, молчаливое обращение , запугивание , угрозы, ругань , эмоциональный шантаж , чувство вины , дуться, плакать и изображать жертву .
  • Травмирующее однократное обучение: использование словесных оскорблений , взрывного гнева или другого устрашающего поведения для установления доминирования или превосходства; даже один случай такого поведения может обусловить или научить жертву избегать расстраивания, противостояния или противоречий манипулятору.

Травматическая связь [ править ]

Травматическая связь возникает в результате продолжающихся циклов жестокого обращения, в которых периодическое усиление вознаграждения и наказания создает сильные эмоциональные связи, устойчивые к изменениям. [75] [76]

Другой источник указал, что [77]«Необходимые условия для травмирующей связи заключаются в том, что один человек должен доминировать над другим, и что уровень жестокого обращения постоянно возрастает, а затем спадает. Отношения характеризуются периодами снисходительного, сострадательного и даже ласкового поведения со стороны доминирующего человека, перемежающихся периодическими эпизодами жестокого обращения. Чтобы сохранить преимущество, обидчик манипулирует поведением жертвы и ограничивает возможности жертвы, чтобы сохранить дисбаланс сил. Любая угроза равновесию доминирования и подчинения может быть встречена нарастающим циклом наказания, варьирующимся от бурного запугивания до яростных вспышек насилия. Жертва также изолирует жертву от других источников поддержки, что снижает вероятность обнаружения и вмешательства, ухудшает положение жертвы ».способность получать уравновешивающую обратную связь с самореферентом и усиливает чувство односторонней зависимости ... Травматические последствия этих оскорбительных отношений могут включать снижение способности жертвы к точной самооценке, что приводит к чувству личной неадекватности и подчиненное чувство зависимости от доминирующего человека. Жертвы также могут столкнуться с различными неприятными социальными и правовыми последствиями своей эмоциональной и поведенческой связи с кем-то, кто совершил агрессивные действия, даже если они сами были реципиентами агрессии. '.приводящее к чувству личной неполноценности и подчиненному чувству зависимости от доминирующего человека. Жертвы также могут столкнуться с различными неприятными социальными и правовыми последствиями своей эмоциональной и поведенческой связи с кем-то, кто совершил агрессивные действия, даже если они сами были реципиентами агрессии. '.приводящее к чувству личной неполноценности и подчиненному чувству зависимости от доминирующего человека. Жертвы также могут столкнуться с различными неприятными социальными и правовыми последствиями своей эмоциональной и поведенческой связи с кем-то, кто совершил агрессивные действия, даже если они сами были реципиентами агрессии. '.

Видеоигры [ править ]

Большинство [ править ] из видеоигр разработаны вокруг петли навязчивой , добавив тип положительного подкрепления через график с переменной скоростью , чтобы держать игрок играть. Это может привести к патологии зависимости от видеоигр . [78]

В рамках тенденции в монетизации видеоигр во время 2010s, некоторые игры предложили лут коробку в качестве награды или предметы , которые можно приобрести на реальных средства. Ящики содержат случайный набор игровых предметов. Эта практика была привязана к тем же методам, которые используются в игровых автоматах и ​​других игровых устройствах для выплаты вознаграждений, поскольку она следует графику с переменной ставкой. Хотя в целом считается, что лутбоксы являются формой азартных игр, такая практика классифицируется как таковая только в нескольких странах. Однако методы использования этих предметов в качестве виртуальной валюты для азартных онлайн-игр или торговли за реальные деньги привели к созданию рынка азартных игр со скинами, который проходит юридическую оценку. [79]

Культура страха на рабочем месте [ править ]

Эшфорт обсудил потенциально деструктивные стороны лидерства и определил то, что он называл мелкими тиранами : лидеры, которые придерживаются тиранического стиля управления, что создает атмосферу страха на рабочем месте. [80] Частичное или периодическое негативное подкрепление может создать эффективную атмосферу страха и сомнения . [74] Когда сотрудники понимают, что к хулиганам относятся терпимо, в результате может возникнуть атмосфера страха. [81]

Индивидуальные различия в чувствительности к вознаграждению , наказанию и мотивации изучались в рамках теории чувствительности к подкреплению, а также применялись к производительности на рабочем месте .

Одна из многих причин высоких затрат, связанных с здравоохранением, - это практика защитной медицины. Прабху рассматривает статью Коула и обсуждает, как реакции двух групп нейрохирургов являются классическим оперантным поведением. Одна группа практикует в штате с ограничениями по медицинским искам, а другая группа без ограничений. Группа нейрохирургов была анонимно опрошена об их образцах практики. Врачи изменили свою практику в ответ на отрицательный отзыв (страх перед судебным процессом) в группе, которая практиковала в штате без ограничений на медицинские иски. [82]

См. Также [ править ]

  • Злоупотребление властью и контролем
  • Тестирование животных
  • Поведенческий контраст
  • Бихевиоризм (раздел психологии, относящийся к методологическому и радикальному бихевиоризму)
  • Модификация поведения (старое выражение для ABA; изменяет поведение либо за счет последствий без включения контроля стимулов, либо включает использование затопления - также называемое терапией длительного воздействия )
  • Морковь и палка
  • Уход за детьми
  • Когнитивизм (психология) (теория внутренних механизмов без ссылки на поведение)
  • Тесты потребительского спроса (животные)
  • Образовательная психология
  • Образовательные технологии
  • Экспериментальный анализ поведения ( принципы экспериментального исследования оперантного и респондентного обусловливания)
  • Экспозиционная терапия (также называемая десенсибилизацией)
  • Ступенчатая экспозиционная терапия (также называемая систематической десенсибилизацией )
  • Привыкание
  • Ежи Конорски
  • Выученное трудолюбие
  • Закон соответствия
  • Отрицательный (положительный) контрастный эффект
  • Радикальный бихевиоризм (концептуальная теория анализа поведения, которая расширяет бихевиоризм, чтобы также охватить частные события (мысли и чувства) как формы поведения)
  • Армирование
  • Павловско-инструментальный перевод
  • Тесты предпочтений (животные)
  • Принцип Премака
  • Сенсибилизация
  • Социальная обусловленность
  • Общество количественного анализа поведения
  • Самопроизвольное выздоровление

Ссылки [ править ]

  1. ^ a b Тарантола, Тор; Кумаран, Дхаршан; Даян, Питерс; Де Мартино, Бенедетто (10 октября 2017 г.). «Предыдущие предпочтения благотворно влияют на социальное и несоциальное обучение» . Nature Communications . 8 (1): 817. DOI : 10.1038 / s41467-017-00826-8 . ISSN  2041-1723 . PMC  5635122 . PMID  29018195 .
  2. ^ Дженкинс, HM "Обучение животных и теория поведения" гл. 5 в Hearst, E. "Первый век экспериментальной психологии" Hillsdale NJ, Earlbaum, 1979
  3. ^ a b Торндайк, EL (1901). «Разум животных: экспериментальное исследование ассоциативных процессов у животных». Приложение к психологическому обзору . 2 : 1–109.
  4. ^ Мильтенбергер, Р.Г. «Поведенческая модификация: принципы и процедуры». Томсон / Уодсворт , 2008. стр. 9.
  5. Перейти ↑ Miltenberger, RG, & Crosland, KA (2014). Воспитание. Руководство Wiley Blackwell по оперантной и классической обусловленности. (стр. 509–531) Wiley-Blackwell. DOI : 10.1002 / 9781118468135.ch20
  6. ^ Скиннер, Б.Ф. «Поведение организмов: экспериментальный анализ», 1938 г. Нью-Йорк: Appleton-Century-Crofts
  7. ^ Скиннер, Б.Ф. (1950). «Нужны ли теории обучения?». Психологический обзор . 57 (4): 193–216. DOI : 10.1037 / h0054367 . PMID 15440996 . S2CID 17811847 .  
  8. ^ Шактер, Дэниел Л., Дэниел Т. Гилберт и Дэниел М. Вегнер. «Б.Ф. Скиннер: роль подкрепления и наказания», подраздел в: Психология; Второе издание. Нью-Йорк: Worth, Incorporated, 2011, 278–288.
  9. ^ a b Ферстер, CB и Скиннер, Б.Ф. «Графики подкрепления», 1957 г. Нью-Йорк: Appleton-Century-Crofts
  10. ^ Staddon, JE R; Д. Т. Черутти (февраль 2003 г.). «Оперантное кондиционирование» . Ежегодный обзор психологии . 54 (1): 115–144. DOI : 10.1146 / annurev.psych.54.101601.145124 . PMC 1473025 . PMID 12415075 .  
  11. ^ Мекка Кьеза (2004) Радикальный бихевиоризм: философия и наука
  12. ^ Скиннер, Б.Ф. "Наука и поведение человека", 1953. Нью-Йорк: MacMillan
  13. ^ Скиннер, Б.Ф. (1948). Уолден Два. Индианаполис: Хакетт
  14. ^ Скиннер, Б.Ф. «Вербальное поведение», 1957. Нью-Йорк: Appleton-Century-Crofts
  15. ^ Neuringer, A (2002). «Оперантная изменчивость: доказательства, функции и теория» . Психономический бюллетень и обзор . 9 (4): 672–705. DOI : 10.3758 / bf03196324 . PMID 12613672 . 
  16. Перейти ↑ Skinner, BF (2014). Наука и поведение человека (PDF) . Кембридж, Массачусетс: Фонд Б.Ф. Скиннера. п. 70 . Проверено 13 марта 2019 .
  17. Перейти ↑ Schultz W (2015). «Нейронное вознаграждение и сигналы принятия решений: от теорий к данным» . Физиологические обзоры . 95 (3): 853–951. DOI : 10.1152 / Physrev.00023.2014 . PMC 4491543 . PMID 26109341 .  Вознаграждение в оперантной обусловленности - это положительное подкрепление. ... Оперантное поведение дает хорошее определение вознаграждения. Все, что заставляет человека возвращаться за большим, является положительным подкреплением и, следовательно, наградой. Хотя это дает хорошее определение, позитивное подкрепление - это лишь одна из нескольких функций вознаграждения. ... Награды привлекательны. Они мотивируют и заставляют прилагать усилия. ... Вознаграждение побуждает подходящее поведение, также называемое аппетитным или подготовительным поведением, и завершающееся поведение. ... Таким образом, любой стимул, объект, событие, действие или ситуация, которые могут заставить нас приблизиться и поглотить их, по определению являются наградой.
  18. ^ Schacter et al., 2011 Психология, 2-е изд. стр.280–284 Ссылка на весь раздел Принципы, версия 130317
  19. ^ a b Мильтенбергер, Р.Г. «Поведенческая модификация: принципы и процедуры». Томсон / Уодсворт , 2008. стр. 84.
  20. ^ Мильтенбергер, Р.Г. «Поведенческая модификация: принципы и процедуры». Томсон / Уодсворт , 2008. стр. 86.
  21. ^ Tucker, M .; Sigafoos, J .; Бушелл, Х. (1998). «Использование неконтролируемого подкрепления в лечении вызывающего поведения». Модификация поведения . 22 (4): 529–547. DOI : 10.1177 / 01454455980224005 . PMID 9755650 . S2CID 21542125 .  
  22. ^ Poling, A .; Норманд, М. (1999). «Неконтролируемое подкрепление: неподходящее описание расписаний, основанных на времени, которые снижают поведение» . Журнал прикладного анализа поведения . 32 (2): 237–238. DOI : 10,1901 / jaba.1999.32-237 . PMC 1284187 . 
  23. ^ a b c Пирс и Чейни (2004) Анализ поведения и обучение
  24. ^ Коул, MR (1990). «Оперантное накопление: новая парадигма для изучения самоконтроля» . Журнал экспериментального анализа поведения . 53 (2): 247–262. DOI : 10.1901 / jeab.1990.53-247 . PMC 1323010 . PMID 2324665 .  
  25. ^ "Активность паллидных нейронов во время движения" , MR DeLong, J. Neurophysiol. , 34: 414–27, 1971
  26. ^ a b Ричардсон Р.Т., Делонг М.Р. (1991): Электрофизиологические исследования функции базального ядра у приматов. В Napier TC, Kalivas P, Hamin I (eds), The Basal Forebrain: Anatomy to Function ( Advances in Experimental Medicine and Biology ), vol. 295. New York, Plenum, стр. 232–252.
  27. ^ PNAS 93: 11219-24 1996, Наука 279: 1714-8 1998
  28. Neuron 63: 244–253, 2009, Frontiers in Behavioral Neuroscience, 3: Статья 13, 2009
  29. ^ Майкл Дж. Франк, Лорен С. Сибергер и Рэндалл С. О'Рейли (2004) «Кэррот или палкой: когнитивное обучение с подкреплением при паркинсонизме», Science 4, ноябрь 2004 г.
  30. ^ Шульц, Вольфрам (1998). «Прогнозирующий сигнал вознаграждения дофаминовых нейронов». Журнал нейрофизиологии . 80 (1): 1-27. DOI : 10.1152 / jn.1998.80.1.1 . PMID 9658025 . 
  31. Перейти ↑ Timberlake, W (1983). «Реакция крыс на движущийся объект, связанный с едой или водой: анализ систем поведения» . Обучение и поведение животных . 11 (3): 309–320. DOI : 10.3758 / bf03199781 .
  32. ^ Neuringer, AJ (1969). «Животные отзываются о еде при наличии бесплатной еды». Наука . 166 (3903): 399–401. Bibcode : 1969Sci ... 166..399N . DOI : 10.1126 / science.166.3903.399 . PMID 5812041 . S2CID 35969740 .  
  33. ^ Уильямс, Д.Р .; Уильямс, Х. (1969). «Автоматическое обслуживание голубя: продолжительное клевание, несмотря на случайное отсутствие подкрепления» . Журнал экспериментального анализа поведения . 12 (4): 511–520. DOI : 10.1901 / jeab.1969.12-511 . PMC 1338642 . PMID 16811370 .  
  34. ^ Peden, BF; Браун, депутат; Херст, Э. (1977). «Настойчивые подходы к сигналу о еде, несмотря на отсутствие еды для приближения». Журнал экспериментальной психологии: процессы поведения животных . 3 (4): 377–399. DOI : 10.1037 / 0097-7403.3.4.377 .
  35. ^ Гарднер, РА; Гарднер, Б.Т. (1988). «Прямая связь против обратной связи: этологическая альтернатива закону эффекта». Поведенческие науки и науки о мозге . 11 (3): 429–447. DOI : 10.1017 / s0140525x00058258 .
  36. ^ Гарднер, Р. А. и Гарднер Б. Т. (1998) Структура обучения от жестовых стимулов к жестовому языку. Махва, штат Нью-Джерси: Лоуренс Эрлбаум Ассошиэйтс.
  37. Перейти ↑ Baum, WM (2012). «Переосмысление подкрепления: распределение, индукция и непредвиденные обстоятельства» . Журнал экспериментального анализа поведения . 97 (1): 101–124. DOI : 10.1901 / jeab.2012.97-101 . PMC 3266735 . PMID 22287807 .  
  38. ^ Locurto, CM, Терраса, HS, и Гиббон, J. (1981) Autoshaping и теория кондиционирования. Нью-Йорк: Academic Press.
  39. ^ а б в г Эдвардс S (2016). «Принципы усиления наркологической медицины; от употребления наркотиков до психических расстройств». Неврология в медицине зависимости: от профилактики до реабилитации - конструкции и лекарства . Прог. Brain Res . Прогресс в исследованиях мозга. 223 . С. 63–76. DOI : 10.1016 / bs.pbr.2015.07.005 . ISBN 9780444635457. PMID  26806771 . Вещества, которыми злоупотребляют (от алкоголя до психостимуляторов), сначала попадают в организм регулярно в соответствии с их положительными укрепляющими свойствами. Важно отметить, что повторяющееся воздействие полезных веществ запускает цепочку вторичных подкрепляющих событий, в результате чего сигналы и контексты, связанные с употреблением наркотиков, сами могут стать подкрепляющими и тем самым способствовать продолжающемуся употреблению и возможному злоупотреблению выбранными веществами. ...
    Важным аспектом подкрепления, имеющим непосредственное отношение к процессу зависимости (и особенно рецидива), является вторичное подкрепление (Stewart, 1992). Вторичные подкрепления (во многих случаях также рассматриваемые как условные подкрепления), вероятно, управляют большинством процессов подкрепления у людей. В конкретном случае наркомании [наркомании] сигналы и контексты, которые тесно и неоднократно связаны с употреблением наркотиков, часто сами становятся подкрепляющими ... Фундаментальная часть теории стимулирования-сенсибилизации Робинсона и Берриджа утверждает, что стимулирующая ценность или привлекательность Природа таких процессов вторичного подкрепления, в дополнение к самим основным подкрепляющим элементам, может сохраняться и даже становиться сенсибилизированной со временем в связи с развитием наркомании (Робинсон и Берридж, 1993). ...
    Отрицательное подкрепление - это особое состояние, связанное с усилением поведенческих реакций, которые прекращают действие некоторого продолжающегося (предположительно отталкивающего) стимула. В этом случае мы можем определить отрицательное подкрепление как мотивационный стимул, усиливающий такую ​​реакцию «бегства». Исторически сложилось так, что в отношении наркозависимости этот феномен постоянно наблюдался у людей, когда наркотики вводились самостоятельно, чтобы утолить мотивационную потребность в состоянии абстиненции (Wikler, 1952).
  40. ^ a b c Berridge KC (апрель 2012 г.). «От ошибки предсказания к значимости стимула: мезолимбическое вычисление мотивации вознаграждения» . Евро. J. Neurosci . 35 (7): 1124–1143. DOI : 10.1111 / j.1460-9568.2012.07990.x . PMC 3325516 . PMID 22487042 .  Когда Павловской CS + приписывается значимость стимула, она не только вызывает «желание» для ее UCS, но часто сама реплика становится очень привлекательной - даже в иррациональной степени. Эта привлекательность реплики - еще одна отличительная черта значимости стимула. На CS становится трудно не смотреть (Wiers & Stacy, 2006; Hickey et al., 2010a; Piech et al., 2010; Anderson et al., 2011). CS даже приобретает некоторые стимулирующие свойства, аналогичные его UCS. Привлекательный CS часто вызывает поведенчески мотивированный подход, и иногда человек может даже попытаться «потреблять» CS как свою UCS (например, есть, пить, курить, заниматься сексом, принимать как наркотик). «Желание» CS может также превратить ранее нейтральный стимул в инструментальное условное подкрепление, так что человек будет работать, чтобы получить сигнал (однако,существуют и альтернативные психологические механизмы условного подкрепления).
  41. ^ a b c Berridge KC, Kringelbach ML (май 2015 г.). «Системы удовольствия в мозгу» . Нейрон . 86 (3): 646–664. DOI : 10.1016 / j.neuron.2015.02.018 . PMC 4425246 . PMID 25950633 .  Важной целью в будущем нейробиологии наркологии является понимание того, как интенсивная мотивация становится узко сфокусированной на конкретной цели. Было высказано предположение, что зависимость отчасти объясняется чрезмерной заметностью стимулов, создаваемой сенсибилизированными или гиперреактивными дофаминовыми системами, которые вызывают сильное «желание» (Робинсон и Берридж, 1993). Но почему одна цель становится более «востребованной», чем все остальные, полностью не объяснено. У наркоманов или пациентов, стимулированных агонистами, повторение дофаминовой стимуляции значимости стимулов объясняется конкретными индивидуализированными занятиями, такими как прием вызывающего привыкание наркотика или определенных компульсий. В Павловских ситуациях вознаграждения некоторые сигналы для вознаграждения становятся более «желанными», чем другие, в качестве мощных мотивационных магнитов, причем разными способами у разных людей (Robinson et al., 2014b;Сондерс и Робинсон, 2013). ... Однако гедонистические эффекты могут со временем измениться. Поскольку препарат принимался неоднократно, мезолимбическая дофаминергическая сенсибилизация могла, следовательно, происходить у восприимчивых людей, усиливая `` желание '' (Leyton and Vezina, 2013; Lodge and Grace, 2011; Wolf and Ferrario, 2010), даже если опиоидные гедонические механизмы подверглись подавлению. из-за постоянной лекарственной стимуляции, вызывающей толерантность «симпатии». Стимулирующая сенсибилизация вызывает зависимость, выборочно усиливая вызванное сигналом «желание» снова принять наркотик, и так сильно вызывает мотивацию, даже если наркотик становится менее приятным (Робинсон и Берридж, 1993).мезолимбическая дофаминергическая сенсибилизация может, следовательно, происходить у восприимчивых людей, чтобы усилить `` желание '' (Leyton and Vezina, 2013; Lodge and Grace, 2011; Wolf and Ferrario, 2010), даже если опиоидные гедонические механизмы подверглись подавлению из-за постоянной стимуляции лекарствами, вызывая «симпатичная» толерантность. Стимулирующая сенсибилизация вызывает зависимость, выборочно усиливая вызванное сигналом «желание» снова принять наркотик, и так сильно вызывает мотивацию, даже если наркотик становится менее приятным (Робинсон и Берридж, 1993).мезолимбическая дофаминергическая сенсибилизация может, следовательно, происходить у восприимчивых людей, чтобы усилить `` желание '' (Leyton and Vezina, 2013; Lodge and Grace, 2011; Wolf and Ferrario, 2010), даже если опиоидные гедонические механизмы подверглись подавлению из-за постоянной стимуляции лекарствами, вызывая «симпатичная» толерантность. Стимулирующая сенсибилизация вызывает зависимость, выборочно усиливая вызванное сигналом «желание» снова принять наркотик, и так сильно вызывает мотивацию, даже если наркотик становится менее приятным (Робинсон и Берридж, 1993).путем выборочного усиления вызванного сигналом «желания» снова принять наркотик и таким мощным стимулом, даже если наркотик стал менее приятным (Робинсон и Берридж, 1993).путем выборочного усиления вызванного сигналом «желания» снова принять наркотик и таким мощным стимулом, даже если наркотик стал менее приятным (Робинсон и Берридж, 1993).
  42. ^ МакГриви, P & Boakes, Р. "кнут и пряник: Принципы подготовки животных". (Сидней:. "Sydney University Press", 2011)
  43. ^ «Все о дрессировке животных - основы | Парки и развлечения SeaWorld» . Основы дрессировки животных . Парки морского мира.
  44. ^ Dillenburger, K .; Кинан, М. (2009). «Ни один из букв ABA не означает аутизм: развенчание мифов». J Intellect Dev Disabil . 34 (2): 193–95. DOI : 10.1080 / 13668250902845244 . PMID 19404840 . S2CID 1818966 .  
  45. ^ DeVries, JE; Бурнетт, ММ; Редмон, WK (1991). «Профилактика СПИДа: улучшение соблюдения медсестрами правил ношения перчаток за счет обратной связи» . Журнал прикладного анализа поведения . 24 (4): 705–11. DOI : 10,1901 / jaba.1991.24-705 . PMC 1279627 . PMID 1797773 .  
  46. ^ Братья, KJ; Krantz, PJ; McClannahan, LE (1994). «Переработка офисной бумаги: функция близости контейнера» . Журнал прикладного анализа поведения . 27 (1): 153–60. DOI : 10,1901 / jaba.1994.27-153 . PMC 1297784 . PMID 16795821 .  
  47. ^ Дардиг, Джилл С .; Хьюард, Уильям Л .; Heron, Timothy E .; Нэнси А. Ниф; Петерсон, Стефани; Дайан М. Сайнато; Картледж, Гвендолин; Гарднер, Ральф; Peterson, Lloyd R .; Сьюзен Б. Херш (2005). Сосредоточьтесь на анализе поведения в образовании: достижения, проблемы и возможности . Река Аппер Сэдл, Нью-Джерси: Пирсон / Меррилл / Прентис-Холл. ISBN 978-0-13-111339-8.
  48. ^ Галлахер, SM; Кинан М. (2000). «Самостоятельное использование материалов для занятий пожилыми людьми в жилых помещениях» . Журнал прикладного анализа поведения . 33 (3): 325–28. DOI : 10,1901 / jaba.2000.33-325 . PMC 1284256 . PMID 11051575 .  
  49. ^ Де Лука, RV; Холборн, SW (1992). «Влияние схемы подкрепления с переменным соотношением и изменяющимися критериями на упражнения у тучных и не тучных мальчиков» . Журнал прикладного анализа поведения . 25 (3): 671–79. DOI : 10,1901 / jaba.1992.25-671 . PMC 1279749 . PMID 1429319 .  
  50. ^ Фокс, ДК; Хопкинс, Б.Л .; Гнев, WK (1987). «Долгосрочное влияние экономики токена на показатели безопасности при добыче открытым способом» . Журнал прикладного анализа поведения . 20 (3): 215–24. DOI : 10,1901 / jaba.1987.20-215 . PMC 1286011 . PMID 3667473 .  
  51. ^ Drasgow, E .; Halle, JW; Остроский, М.М. (1998). «Влияние дифференциального подкрепления на генерализацию замещающего мандата у трех детей с серьезной задержкой речевого развития» . Журнал прикладного анализа поведения . 31 (3): 357–74. DOI : 10,1901 / jaba.1998.31-357 . PMC 1284128 . PMID 9757580 .  
  52. ^ Пауэрс, РБ; Осборн, Дж. Г.; Андерсон, EG (1973). «Положительное усиление удаления мусора в естественной среде» . Журнал прикладного анализа поведения . 6 (4): 579–86. DOI : 10,1901 / jaba.1973.6-579 . PMC 1310876 . PMID 16795442 .  
  53. ^ Hagopian, LP; Томпсон, Р.Х. (1999). «Подтверждение соблюдения режима респираторной терапии у ребенка с муковисцидозом» . Журнал прикладного анализа поведения . 32 (2): 233–36. DOI : 10,1901 / jaba.1999.32-233 . PMC 1284184 . PMID 10396778 .  
  54. ^ Кун, SAC; Лерман, округ Колумбия; Ворндран, CM (2003). «Пирамидальный тренинг для семей с детьми с проблемным поведением» . Журнал прикладного анализа поведения . 36 (1): 77–88. DOI : 10,1901 / jaba.2003.36-77 . PMC 1284418 . PMID 12723868 .  
  55. ^ Van Houten, R .; Malenfant, JEL; Austin, J .; Леббон, А. (2005). Воллмер, Тимоти (ред.). «Влияние предупреждения о задержке переключения передач с помощью ремня безопасности на использование ремня безопасности автомобилистами, которые не пристегиваются регулярно» . Журнал прикладного анализа поведения . 38 (2): 195–203. DOI : 10,1901 / jaba.2005.48-04 . PMC 1226155 . PMID 16033166 .  
  56. ^ Wong, SE; Martinez-Diaz, JA; Массель, Гонконг; Эдельштейн, BA; Wiegand, W .; Bowen, L .; Либерман, Р.П. (1993). «Тренировка разговорных навыков с больными шизофренией в стационаре: исследование обобщения в разных условиях и среди собеседников». Поведенческая терапия . 24 (2): 285–304. DOI : 10.1016 / S0005-7894 (05) 80270-9 .
  57. ^ Brobst, B .; Уорд, П. (2002). «Влияние публичных публикаций, постановки целей и устных отзывов на навыки футболисток» . Журнал прикладного анализа поведения . 35 (3): 247–57. DOI : 10,1901 / jaba.2002.35-247 . PMC 1284383 . PMID 12365738 .  
  58. ^ Фортман, DL; Огден, Дж. Дж. (1992). «Роль прикладного анализа поведения в управлении зоопарком: сегодня и завтра» . Журнал прикладного анализа поведения . 25 (3): 647–52. DOI : 10,1901 / jaba.1992.25-647 . PMC 1279745 . PMID 16795790 .  
  59. ^ а б Каздин А.Е. (2010). Обучение навыкам решения проблем и обучение родителей управлению оппозиционным вызывающим расстройством и расстройством поведения. Доказательная психотерапия для детей и подростков (2-е изд.), 211–226. Нью-Йорк: Guilford Press.
  60. ^ Forgatch MS, Patterson GR (2010). Тренинг по управлению родителями - модель штата Орегон: вмешательство в антиобщественное поведение детей и подростков. Доказательная психотерапия для детей и подростков (2-е изд.), 159–78. Нью-Йорк: Guilford Press.
  61. ^ Domjan, М. (2009). Принципы обучения и поведения. Издательская компания Wadsworth. 6-е издание. страницы 244–249.
  62. ^ Бледа, Мигель Анхель Перес; Ньето, Хосе Эктор Лозано (2012). «Импульсивность, интеллект и различение непредвиденных обстоятельств подкрепления в графике с фиксированным соотношением 3». Испанский журнал психологии . 3 (15): 922–929. DOI : 10.5209 / rev_SJOP.2012.v15.n3.39384 . PMID 23156902 . ProQuest 1439791203 .  
  63. ^ a b c d Гроссман, Дэйв (1995). Об убийстве: психологическая стоимость обучения убивать на войне и в обществе . Бостон: Маленький Браун. ISBN 978-0316040938.
  64. ^ Маршалл, SLA (1947). Люди против огня: проблема боевого командования в будущей войне . Вашингтон: Пехотный журнал. ISBN 978-0-8061-3280-8.
  65. ^ a b Мюррей, К.А., Гроссман, Д., и Кентридж, Р.В. (21 октября 2018 г.). «Поведенческая психология» . killology.com/behavioral-psychology .CS1 maint: несколько имен: список авторов ( ссылка )
  66. ^ Kazdin, Алан (1978). История модификации поведения: экспериментальные основы современных исследований . Балтимор: University Park Press.
  67. ^ Штамм, Филип С .; Lambert, Deborah L .; Керр, Мэри Маргарет; Стэгг, Воган; Ленкнер, Донна А. (1983). «Натуралистическая оценка соответствия детей просьбам учителей и последствия их выполнения» . Журнал прикладного анализа поведения . 16 (2): 243–249. DOI : 10,1901 / jaba.1983.16-243 . PMC 1307879 . PMID 16795665 .  
  68. ^ а б Гарланд, Энн Ф .; Хоули, Кристин М .; Брукман-Фрейзи, Лорен; Херлбурт, Майкл С. (май 2008 г.). «Выявление общих элементов доказательных психосоциальных методов лечения проблем детского деструктивного поведения». Журнал Американской академии детской и подростковой психиатрии . 47 (5): 505–514. DOI : 10.1097 / CHI.0b013e31816765c2 . PMID 18356768 . 
  69. ^ Crowell, Charles R .; Андерсон, Д. Крис; Abel, Dawn M .; Серджио, Джозеф П. (1988). «Разъяснение задач, отзывы о производительности и общественная похвала: процедуры улучшения обслуживания клиентов кассирами банка» . Журнал прикладного анализа поведения . 21 (1): 65–71. DOI : 10,1901 / jaba.1988.21-65 . PMC 1286094 . PMID 16795713 .  
  70. ^ Каздин, Алан Э. (1973). «Влияние заместительного подкрепления на внимательное поведение в классе» . Журнал прикладного анализа поведения . 6 (1): 71–78. DOI : 10,1901 / jaba.1973.6-71 . PMC 1310808 . PMID 16795397 .  
  71. ^ Брофи, Джери (1981). «О похвале эффективно». Журнал начальной школы . 81 (5): 269–278. DOI : 10.1086 / 461229 . JSTOR 1001606 . 
  72. ^ a b Симонсен, Брэнди; Фэрбенкс, Сара; Бриеш, Эми; Майерс, Дайан; Сугай, Джордж (2008). «Доказательная практика в управлении классом: от исследований к практике». Воспитание и лечение детей . 31 (1): 351–380. DOI : 10.1353 / etc.0.0007 . S2CID 145087451 . 
  73. ^ Вайс, Джон Р .; Каздин, Алан Э. (2010). Доказательная психотерапия для детей и подростков . Guilford Press.
  74. ^ a b Брайкер, Харриет Б. (2004). Кто дергает за ниточки? Как разорвать цикл манипуляции . ISBN 978-0-07-144672-3.
  75. ^ Даттон; Художник (1981). «Травматическая связь: развитие эмоциональных привязанностей у женщин, подвергшихся побоям, и других отношений периодического насилия». Виктимология: Международный журнал (7).
  76. ^ Крисси Сандерсон. Консультирование переживших домашнее насилие . Издательство Джессики Кингсли; 15 июня 2008 г. ISBN 978-1-84642-811-1 . п. 84. 
  77. ^ "Травматическая связь | Encyclopedia.com" . www.encyclopedia.com .
  78. Джон Хопсон: Поведенческий игровой дизайн , Гамасутра , 27 апреля 2001 г.
  79. Рианна Худ, Вик (12 октября 2017 г.). "Коробки с добычей - это азартные игры?" . Eurogamer . Проверено 12 октября 2017 года .
  80. ^ Мелкая тирания в организациях , Эшфорт, Блейк, Human Relations, Vol. 47, № 7. С. 755–778 (1994).
  81. ^ Helge H, Sheehan MJ, Cooper CL, Einarsen S "Организационные эффекты издевательств на рабочем месте" в издевательствах и домогательствах на рабочем месте: изменения в теории, исследованиях и практике (2010)
  82. ^ Operant Conditioning и практика защитной медицины. Викрам С. Прабху Всемирная нейрохирургия, 2016-07-01, том 91, страницы 603–605

{78} Александр Б.К. (2010) Зависимость: Вид из Крысиного парка, извлечено из Зависимости: Вид из Крысиного парка (2010)

Внешние ссылки [ править ]

  • Статья об оперантном кондиционировании в Scholarpedia
  • Журнал прикладного анализа поведения
  • Журнал экспериментального анализа поведения
  • Отрицательное подкрепление
  • scienceofbehavior.com