Оперантного кондиционирования | Вымирание | ||||||||||||||||||||||||||||||
Подкрепление Повышение поведения | Наказание Снижение поведения | ||||||||||||||||||||||||||||||
Положительное подкрепление Добавьте аппетитный стимул после правильного поведения | Отрицательное подкрепление | Положительное наказание Добавить вредный стимул вслед за поведением | Отрицательное наказание Устранение аппетитного стимула вслед за поведением | ||||||||||||||||||||||||||||
Побег Устранение вредных стимулов при правильном поведении | Активное избегание Поведение избегает вредных раздражителей | ||||||||||||||||||||||||||||||
Оперантное обусловливание (также называемое инструментальным обусловливанием ) - это тип процесса ассоциативного обучения, посредством которого сила поведения изменяется путем подкрепления или наказания. Это также процедура, которая используется для такого обучения.
Хотя как оперантное, так и классическое обусловливание связаны с поведением, контролируемым стимулами окружающей среды, они различаются по своей природе. При оперантном обусловливании поведение контролируется внешними стимулами. Например, ребенок может научиться открывать коробку, чтобы положить внутрь сладости, или научиться не прикасаться к горячей плите; с оперантной точки зрения ящик и печь являются «различительными раздражителями». Оперантное поведение называется «добровольным». Ответы находятся под контролем организма и являются операторами. Например, ребенок может оказаться перед выбором: открыть коробку или погладить щенка.
Напротив, классическая обусловленность включает непроизвольное поведение, основанное на сочетании стимулов с биологически значимыми событиями. Ответы находятся под контролем некоторых стимулов, потому что они являются рефлексами, автоматически вызываемыми соответствующими стимулами. Например, вид сладкого может вызвать у ребенка слюноотделение, или звук хлопка двери может сигнализировать рассерженному родителю, заставляя ребенка дрожать. Слюноотделение и дрожь не действуют; они не подкрепляются своими последствиями, и их не «выбирают» добровольно.
Однако оба вида обучения могут влиять на поведение. Классически обусловленные стимулы - например, изображение конфет на коробке - могут усилить оперантную обусловленность, побуждая ребенка подойти и открыть коробку. Исследования показали, что это полезное явление в тех случаях, когда оперантное поведение подвержено ошибкам. [1]
В исследовании обучения животных в 20-м веке доминировал анализ этих двух видов обучения [2], и они до сих пор лежат в основе анализа поведения. Они также применялись для изучения социальной психологии , помогая прояснить определенные явления, такие как эффект ложного консенсуса . [1]
Оперантное обусловливание, иногда называемое инструментальным обучением , впервые было всесторонне изучено Эдвардом Л. Торндайком (1874–1949), который наблюдал за поведением кошек, пытающихся вырваться из самодельных коробок-головоломок. [3] Кошка могла выскользнуть из ящика, просто потянув за шнур или толкнув шест, но когда ее сначала сдерживали, кошкам требовалось много времени, чтобы выбраться. При повторных испытаниях неэффективные ответы возникали реже, а успешные - чаще, поэтому кошки убегали все быстрее и быстрее. [3] Торндайк обобщил это открытие в своем законе действия., в котором говорится, что поведение, за которым следуют удовлетворительные последствия, как правило, повторяется, а поведение, которое приводит к неприятным последствиям, с меньшей вероятностью повторяется. Короче говоря, некоторые последствия усиливают поведение, а некоторые - ослабляют . Построив график зависимости времени побега от номера испытания, Торндайк с помощью этой процедуры получил первые известные кривые обучения животных . [4]
Похоже, что люди учатся многим простым образцам поведения посредством процесса, изученного Торндайком, который теперь называется оперантным обусловливанием. То есть ответы сохраняются, когда они приводят к успешному результату, и отбрасываются, когда они этого не делают, или когда они вызывают отвращение. Обычно это происходит без планирования какого-либо «учителя», но оперантное обусловливание использовалось родителями в обучении своих детей на протяжении тысяч лет. [5]
Б. Ф. Скиннера (1904–1990) называют отцом оперантной обусловленности, и его работы часто цитируются в связи с этой темой. Его книга 1938 года «Поведение организмов: экспериментальный анализ» [6] положила начало его пожизненному изучению оперантного обусловливания и его применению к поведению человека и животных. Следуя идеям Эрнста Маха , Скиннер отверг ссылку Торндайка на ненаблюдаемые психические состояния, такие как удовлетворение, построив свой анализ на наблюдаемом поведении и его столь же наблюдаемых последствиях. [7]
Скиннер считал, что классическая обусловленность слишком упрощена, чтобы ее можно было использовать для описания чего-то столь сложного, как человеческое поведение. По его мнению, оперантное кондиционирование лучше описывает человеческое поведение, поскольку оно исследует причины и следствия намеренного поведения.
Чтобы реализовать свой эмпирический подход, Скиннер изобрел камеру оперантного кондиционирования , или « ящик Скиннера », в котором такие предметы, как голуби и крысы, были изолированы и могли подвергаться тщательно контролируемым раздражителям. В отличие от коробки-головоломки Торндайка, такая компоновка позволяла испытуемому дать один или два простых повторяемых ответа, и частота таких ответов стала основным поведенческим критерием Скиннера. [8] Другое изобретение, накопительный регистратор, создавало графическую запись, по которой можно было оценить эти показатели отклика. Эти записи были первичными данными, которые Скиннер и его коллеги использовали для изучения влияния различных схем подкрепления на скорость реакции. [9]График подкрепления может быть определен как «любая процедура, которая доставляет подкрепление организму в соответствии с каким-то четко определенным правилом». [10] Эффекты расписания стали, в свою очередь, основными выводами, на основе которых Скиннер разработал свою концепцию оперантного обусловливания. Он также опирался на многие менее формальные наблюдения за поведением людей и животных. [11]
Многие работы Скиннера посвящены применению оперантной обусловленности к человеческому поведению. [12] В 1948 году он опубликовал « Уолден Два» , вымышленный рассказ о мирном, счастливом, продуктивном сообществе, организованном вокруг его принципов обусловливания. [13] В 1957 году Скиннер опубликовал « Вербальное поведение» , [14]который распространил принципы оперантного обусловливания на язык, форму человеческого поведения, которая ранее совершенно иначе анализировалась лингвистами и другими. Скиннер определил новые функциональные отношения, такие как «мандаты» и «такты», чтобы уловить некоторые основы языка, но он не ввел никаких новых принципов, рассматривая вербальное поведение, как любое другое поведение, контролируемое его последствиями, включая реакции аудитории говорящего.
Говорят, что оперантное поведение «испускается»; то есть изначально он не вызывается каким-либо конкретным стимулом. Таким образом, можно спросить, почему это вообще происходит. Ответ на этот вопрос подобен ответу Дарвина на вопрос о происхождении «новой» телесной структуры, а именно вариации и отбора. Точно так же поведение человека меняется от момента к моменту, в таких аспектах, как конкретные участвующие движения, величина приложенной силы или время реакции. Вариации, которые приводят к подкреплению, усиливаются, и если подкрепление постоянное, поведение, как правило, остается стабильным. Однако изменчивость поведения сама по себе может быть изменена путем манипулирования определенными переменными. [15]
Подкрепление и наказание - это основные инструменты, с помощью которых модифицируется оперантное поведение. Эти термины определяются по их влиянию на поведение. Либо может быть положительным, либо отрицательным.
Еще одна процедура называется «угасание».
Всего существует пять последствий.
Важно отметить, что об актерах (например, о крысе) не говорят как о подкреплении, наказании или подавлении; это действия , которые подкрепляются, наказываются или исключаются. Подкрепление, наказание и исчезновение - это не термины, использование которых ограничено лабораторией. Естественно возникающие последствия также могут усиливать, наказывать или подавлять поведение и не всегда планируются или реализуются намеренно.
Графики армирования - это правила, которые контролируют доставку арматуры. Правила определяют либо время, когда подкрепление должно быть доступно, или количество ответов, которые необходимо сделать, либо и то, и другое. Возможно множество правил, но следующие являются наиболее основными и часто используемыми [18] [9]
Эффективность подкрепления и наказания можно изменить.
Большинство этих факторов выполняют биологические функции. Например, процесс насыщения помогает организму поддерживать стабильную внутреннюю среду ( гомеостаз ). Когда организм, например, лишен сахара, вкус сахара является эффективным усилителем. Когда уровень сахара в крови в организме достигает или превышает оптимальный уровень, вкус сахара становится менее эффективным или даже неприятным.
Формирование - это метод кондиционирования, который часто используется при дрессировке животных и в обучении невербальных людей. Это зависит от оперантной изменчивости и подкрепления, как описано выше. Тренер начинает с определения желаемого конечного (или «целевого») поведения. Затем дрессировщик выбирает поведение, которое животное или человек уже испускает с некоторой вероятностью. Затем форма этого поведения постепенно изменяется в ходе последовательных испытаний, усиливая поведение, которое все больше и больше приближается к целевому поведению. Когда целевое поведение, наконец, проявляется, оно может быть усилено и поддержано с помощью графика подкрепления.
Неконтролируемое подкрепление - это доставка подкрепляющих стимулов независимо от поведения организма. Неконтролируемое подкрепление может использоваться в попытке уменьшить нежелательное целевое поведение путем усиления множества альтернативных ответов при одновременном гашении целевого ответа. [21] Поскольку никакое измеряемое поведение не идентифицируется как усиливающееся, существуют разногласия по поводу использования термина «неконтролируемое подкрепление». [22]
Хотя изначально оперантное поведение излучается без идентифицированной ссылки на конкретный стимул, во время оперантного обусловливания операнты попадают под контроль стимулов, которые присутствуют, когда поведение подкрепляется. Такие стимулы называются «различительными стимулами». Результатом является так называемая « трехчленная непредвиденная ситуация ». То есть различающие стимулы создают повод для реакций, которые производят вознаграждение или наказание. Пример: крысу можно обучить нажимать на рычаг, только когда загорается свет; собака устремляется на кухню, когда слышит, как ее мешок с едой дребезжит; ребенок тянется за конфетой, когда видит ее на столе.
Большая часть поведения находится под контролем стимулов. Можно выделить несколько аспектов этого:
Большую часть поведения нелегко описать в терминах индивидуальных реакций, подкрепляемых один за другим. Объем оперантного анализа расширяется за счет идеи поведенческих цепочек, которые представляют собой последовательности ответов, связанных вместе трехчленными случайностями, определенными выше. Цепочка основана на экспериментально продемонстрированном факте, что различительный стимул не только создает повод для последующего поведения, но также может усилить поведение, которое ему предшествует. То есть различительный раздражитель также является «условным подкреплением». Например, свет, который задает повод для нажатия рычага, может использоваться для усиления «поворота» в присутствии шума. В результате получается последовательность «шум - разворот - свет - нажатие рычага - еда». Можно построить гораздо более длинные цепочки, добавив больше стимулов и ответов.
При обучении избеганию поведение прекращает действие (отталкивающего) стимула. Например, защита глаз от солнечного света прекращает (отталкивающую) стимуляцию яркого света в глазах. (Это пример негативного подкрепления, определенного выше.) Поведение, которое поддерживается за счет предотвращения стимула, называется «избеганием», как, например, надевание солнцезащитных очков перед выходом на улицу. Поведение избегания порождает так называемый «парадокс избегания», поскольку можно спросить, как отсутствие стимула может служить подкреплением? К этому вопросу обращается несколько теорий избегания (см. Ниже).
Обычно используются два типа экспериментальных настроек: дискриминированное обучение и обучение избеганию свободных оперантов.
Эксперимент дискриминированного избегания включает в себя серию испытаний, в которых за нейтральным стимулом, таким как свет, следует отталкивающий стимул, такой как шок. После появления нейтрального стимула оперантная реакция, такая как нажатие на рычаг, предотвращает или прекращает отвращение к стимулу. В ранних испытаниях субъект не реагирует до тех пор, пока не сработает отталкивающий стимул, поэтому эти ранние испытания называются испытаниями «бегства». По мере обучения субъект начинает реагировать на нейтральный стимул и, таким образом, предотвращает возникновение отталкивающего стимула. Такие испытания называются «испытаниями избегания». Говорят, что этот эксперимент включает классическое обусловливание, потому что нейтральный CS (условный стимул) сочетается с отталкивающим US (безусловный стимул);эта идея лежит в основе двухфакторной теории обучения избеганию, описанной ниже.
При свободном оперантном избегании субъект периодически получает отвращающий стимул (часто электрический шок), если не происходит оперантный ответ; ответ задерживает начало шока. В этой ситуации, в отличие от дискриминированного избегания, никакой предшествующий стимул не сигнализирует о шоке. Два важных временных интервала определяют скорость обучения избеганию. Это первый интервал SS (шок-шок). Это время между последовательными ударами при отсутствии реакции. Второй интервал - это интервал RS (ответ-шок). Это определяет время, на которое оперантный ответ задерживает начало следующего разряда. Обратите внимание, что каждый раз, когда субъект выполняет оперантный ответ, интервал RS без шока начинается заново.
Эта теория была первоначально предложена для объяснения различенного обучения избеганию, при котором организм учится избегать отталкивающего стимула, уклоняясь от сигнала для этого стимула. Здесь задействованы два процесса: классическое кондиционирование сигнала с последующим оперантным кондиционированием реакции ухода:
а) Классическая обусловленность страха. Первоначально организм испытывает сочетание CS с аверсивным УЗИ. Теория предполагает, что это соединение создает ассоциацию между CS и США посредством классической обусловленности, и из-за отталкивающей природы США CS вызывает условную эмоциональную реакцию (CER) - «страх». б) Усиление оперантной реакции уменьшением страха.В результате первого процесса CS теперь сигнализирует о страхе; эта неприятная эмоциональная реакция служит для мотивации оперантных ответов, а ответы, завершающие CS, подкрепляются прекращением страха. Обратите внимание, что в теории не говорится, что организм «избегает» США в смысле его ожидания, а скорее, что организм «избегает» отвращающего внутреннего состояния, вызванного CS. Некоторые экспериментальные данные, похоже, противоречат теории двух факторов. Например, поведение избегания часто гаснет очень медленно, даже если первоначальное соединение CS-US больше не повторяется, поэтому можно ожидать, что реакция страха исчезнет (см. Классическое обусловливание.). Кроме того, животные, которые научились избегать, часто демонстрируют мало признаков страха, предполагая, что бегство от страха не является необходимым для сохранения поведения избегания. [23]
Некоторые теоретики предполагают, что поведение избегания может быть просто особым случаем оперантного поведения, поддерживаемого его последствиями. С этой точки зрения идея «последствий» расширена и включает чувствительность к структуре событий. Таким образом, при избегании следствием реакции является снижение скорости аверсивной стимуляции. Действительно, экспериментальные данные свидетельствуют о том, что «пропущенный шок» воспринимается как стимул и может действовать как подкрепление. Когнитивные теории избегания продвигают эту идею на шаг вперед. Например, крыса начинает «ожидать» шока, если она не нажимает на рычаг, и «не ожидать шока», если нажимает на него, и поведение избегания усиливается, если эти ожидания подтверждаются. [23]
Оперантное накопление относится к наблюдению, что крысы, подкрепленные определенным образом, могут позволить пищевым гранулам накапливаться в пищевом лотке вместо того, чтобы извлекать эти гранулы. В этой процедуре извлечение гранул всегда предусматривало одноминутный период исчезновения, в течение которого не было дополнительных пищевых гранул, но те, которые были накоплены ранее, могли быть потреблены. Это открытие, по-видимому, противоречит обычному выводу о том, что крысы ведут себя импульсивно в ситуациях, когда есть выбор между меньшим пищевым объектом сразу и большим пищевым объектом после некоторой задержки. Смотрите графики армирования . [24]
Первые научные исследования по выявлению нейронов, которые реагировали таким образом, что предполагалось, что они кодируют условные стимулы, были получены в работах Махлона деЛонга [25] [26] и Р.Т. Ричардсона. [26] Они показали, что нейроны базального ядра , которые выделяют ацетилхолин во всей коре головного мозга , активируются вскоре после условного стимула или после первичного вознаграждения, если условного стимула нет. Эти нейроны одинаково активны как для положительных, так и для отрицательных подкреплений, и было показано, что они связаны с нейропластичностью во многих областях коры . [27] Также существуют доказательства того, чтодофамин активируется в одно и то же время. Существует множество доказательств того, что дофамин участвует как в подкрепляющем, так и в аверсивном обучении. [28] Дофаминовые пути гораздо более плотно проецируются на лобные области коры головного мозга . Холинергические проекции, напротив, плотны даже в задних отделах коры, таких как первичная зрительная кора . Исследование пациентов с болезнью Паркинсона , состоянием, приписываемым недостаточному действию дофамина, дополнительно иллюстрирует роль дофамина в положительном подкреплении. [29]Исследование показало, что пациенты, не принимавшие лекарства, с большей готовностью учились с неприятными последствиями, чем с положительным подкреплением. Пациенты, которые принимали лекарства, показали обратное: положительное подкрепление оказалось более эффективной формой обучения при высокой активности дофамина.
Предполагается, что в основе подкрепления лежит нейрохимический процесс с участием дофамина. Когда организм испытывает усиливающий стимул, активируются дофаминовые пути в мозге. Эта сеть путей «высвобождает короткий импульс дофамина на многие дендриты , тем самым передавая глобальный сигнал подкрепления постсинаптическим нейронам ». [30]Это позволяет недавно активированным синапсам увеличивать свою чувствительность к эфферентным (проводящим наружу) сигналам, тем самым увеличивая вероятность возникновения недавних реакций, которые предшествовали подкреплению. Эти реакции статистически наиболее вероятно были поведением, ответственным за успешное достижение подкрепления. Но когда применение подкрепления либо менее немедленное, либо менее случайное (менее последовательное), способность дофамина воздействовать на соответствующие синапсы снижается.
Ряд наблюдений, кажется, показывает, что оперантное поведение может быть установлено без подкрепления в смысле, определенном выше. Чаще всего упоминается феномен автоформирования (иногда называемый «отслеживанием знаков»), при котором за стимулом постоянно следует подкрепление, и, как следствие, животное начинает реагировать на стимул. Например, загорается клавиша ответа, а затем предлагается еда. Когда это повторяется несколько раз, голубь начинает клевать ключ, даже если еда приходит независимо от того, клюет птица или нет. Точно так же крысы начинают брать в руки небольшие предметы, например рычаг, когда пища оказывается поблизости. [31] [32] Поразительно, но голуби и крысы сохраняют такое поведение, даже когда клевание клавиши или нажатие на рычаг приводит к уменьшению количества пищи (тренировка бездействия).[33] [34] Еще одно очевидное оперантное поведение, которое проявляется без подкрепления, - это контразагрузка .
Эти и другие наблюдения, по-видимому, противоречат закону эффекта , и они побудили некоторых исследователей предложить новые концепции оперантного подкрепления (например, [35] [36] [37] ). Более общая точка зрения состоит в том, что автоформирование является примером классического обусловливания. ; Фактически процедура автоформирования стала одним из наиболее распространенных способов измерения классической обусловленности. С этой точки зрения, на многие виды поведения могут влиять как классические случайности (стимул-реакция), так и оперантные случайности (реакция-подкрепление), и задача экспериментатора состоит в том, чтобы выяснить, как они взаимодействуют. [38]
Подкрепление и наказание повсеместно используются в человеческих социальных взаимодействиях, и было предложено и реализовано очень много приложений оперантных принципов. Ниже приведены некоторые примеры.
Положительное и отрицательное подкрепление играют центральную роль в развитии и сохранении зависимости и наркотической зависимости . Наркотик, вызывающий привыкание, по своей сути полезен ; то есть он действует как основной положительный стимул к употреблению наркотиков. Система вознаграждения мозга придает ему значимость стимула (т.е. он «желателен» или «желателен») [39] [40] [41], так что по мере развития зависимости лишение наркотика приводит к влечению. Кроме того, стимулы, связанные с употреблением наркотиков - например, вид шприца и место использования - становятся связанными с интенсивным подкреплением, вызываемым наркотиком. [39] [40] [41]Эти ранее нейтральные стимулы приобретают несколько свойств: их появление может вызывать тягу, и они могут стать условными положительными подкрепляющими элементами при продолжении их употребления. [39] [40] [41] Таким образом, если зависимый человек сталкивается с одним из этих наркотических сигналов, тяга к связанному с ним наркотику может появиться снова. Например, агентства по борьбе с наркотиками ранее использовали плакаты с изображениями принадлежностей для наркотиков как попытку показать опасность употребления наркотиков. Однако такие плакаты больше не используются из-за эффекта значимости стимула, вызывающего рецидив при виде стимулов, изображенных на плакатах.
У наркозависимых людей отрицательное подкрепление возникает, когда лекарство вводится самостоятельно , чтобы облегчить или «избежать» симптомов физической зависимости (например, тремора и потливости) и / или психологической зависимости (например, ангедонии , беспокойства, раздражительности и т. Д.). тревога), возникающие во время отмены препарата . [39]
Дрессировщики и владельцы домашних животных применяли принципы и практики оперантного кондиционирования задолго до того, как эти идеи были названы и изучены, и дрессировка животных по-прежнему является одним из самых ярких и убедительных примеров оперантного контроля. Из концепций и процедур, описанных в этой статье, наиболее заметными являются следующие: (а) наличие первичного подкрепления (например, мешок собачьих вкусняшек); (б) использование вторичного подкрепления (например, щелчок кликера сразу после желаемого ответа, а затем вкуснятина); (c) случайность, гарантирующая, что подкрепление (например, кликер) следует желаемому поведению, а не чему-то еще; (d) формирование, как при постепенном обучении собаки прыгать все выше и выше; (д) периодическое усиление,как постепенное уменьшение частоты подкрепления, чтобы вызвать стойкое поведение без насыщения; (е) цепочка, когда сложное поведение постепенно строится из более мелких единиц.[42]
Пример дрессировки животных из Seaworld, связанный с оперантной обусловленностью [43]
Дрессировка животных влияет на положительное и отрицательное подкрепление. График подкреплений может сыграть большую роль в дрессировке животных.
Прикладной анализ поведения - это дисциплина, инициированная Б. Ф. Скиннером, которая применяет принципы обусловливания к модификации социально значимого человеческого поведения. В нем используются базовые концепции теории обусловливания, включая условный стимул (S C ), различительный стимул (S d ), ответ (R) и подкрепляющий стимул (S rein или S r для подкрепляющих, иногда S ave для отталкивающих стимулов). [23]Условный стимул контролирует поведение, развиваемое респондентом (классическое), например, эмоциональные реакции. Три других термина вместе образуют «трехчленную случайность» Скиннера: различительный стимул дает повод для реакций, которые приводят к подкреплению. Исследователи обнаружили, что следующий протокол является эффективным, когда они используют инструменты оперантной обусловленности для изменения человеческого поведения: [ необходима цитата ]
Практики прикладного анализа поведения (ABA) используют эти процедуры, а также их множество вариаций и усовершенствований для решения различных социально значимых форм поведения и проблем. Во многих случаях практикующие врачи используют оперантные методы для развития конструктивного, социально приемлемого поведения, которое заменяет аберрантное поведение. Методы ABA были эффективно применены к таким вещам, как ранние интенсивные поведенческие вмешательства для детей с расстройствами аутистического спектра (РАС) [44], исследования принципов, влияющих на преступное поведение , профилактика ВИЧ [45], сохранение природных ресурсов, [ 46] образование, [47] геронтология ,[48] здоровье и физические упражнения , [49] промышленная безопасность , [50] овладение языком , [51] мусор, [52] медицинские процедуры , [53] воспитание детей, [54] психотерапия , [ необходима ссылка ] использование ремней безопасности, [55] тяжелые психические расстройства , [56] спорт, [57] злоупотребление психоактивными веществами , фобии , педиатрические нарушения питания, а также управление зоопарком и уход за животными . [58] Некоторые из этих приложений описаны ниже.
Обеспечение положительного подкрепления правильного поведения ребенка является одним из основных направлений обучения родителей управлению. Как правило, родители учатся поощрять соответствующее поведение с помощью социальных поощрений (например, похвалы, улыбки и объятия), а также конкретных наград (например, наклеек или указаний на более крупное вознаграждение в рамках системы стимулов, созданной совместно с ребенком). [59] Кроме того, родители учатся выбирать простое поведение в качестве первоначального акцента и вознаграждают за каждый из маленьких шагов, которые их ребенок делает для достижения большей цели (эта концепция называется «последовательные приближения»). [59] [60]
И психологи, и экономисты заинтересовались применением оперантных концепций и открытий к поведению людей на рынке. Примером может служить анализ потребительского спроса, индексированного по количеству приобретенного товара. В экономике степень влияния цены на потребление называется «эластичностью спроса по цене». Некоторые товары более эластичны, чем другие; например, изменение цен на определенные продукты питания может иметь большое влияние на покупаемое количество, в то время как на бензин и другие повседневные предметы потребления изменения цен могут в меньшей степени повлиять. С точки зрения оперантного анализа, такие эффекты можно интерпретировать с точки зрения мотивации потребителей и относительной ценности товаров как подкрепляющих факторов. [61]
Как говорилось ранее в этой статье, график с переменным соотношением дает подкрепление после выдачи непредсказуемого числа ответов. Этот график обычно обеспечивает быструю и настойчивую реакцию. Игровые автоматы рассчитываются по графику с переменным соотношением, и они вызывают у игроков именно такое упорное маневрирование. Выплаты с переменным соотношением от игровых автоматов и других форм азартных игр часто упоминались как фактор, лежащий в основе игровой зависимости. [62]
Человеческие существа обладают врожденным сопротивлением убийству и не хотят действовать прямым агрессивным образом по отношению к представителям своего собственного вида, даже ради спасения жизни. Это сопротивление убийству сделало пехоту чрезвычайно неэффективной на протяжении всей истории военных действий. [63]
Этот феномен не был понят до тех пор, пока SLA Marshall (бригадный генерал и военный историк) не провела интервью с пехотой Второй мировой войны сразу после боевого столкновения. В известной и противоречивой книге Маршалла «Люди против огня» говорится, что только 15% солдат стреляли из винтовок с целью убить в бою. [64] После принятия исследований Маршалла армией США в 1946 году, Отдел исследований кадровых ресурсов армии США начал внедрять новые протоколы обучения, которые напоминают методы оперантного кондиционирования. Последующее применение таких методов увеличило процент солдат, способных убивать, примерно до 50% в Корее и более 90% во Вьетнаме. [63] Революции в обучении включали замену традиционных всплывающих стрельбищ трехмерными всплывающими целями в форме человека, которые разрушались при попадании. Это обеспечило немедленную обратную связь и послужило положительным подкреплением поведения солдата. [65] Другие усовершенствования методов военной подготовки включали курс стрельбы по времени; более реалистичное обучение; частые повторы; похвала начальства; награды за меткую стрельбу; и групповое признание. Отрицательное подкрепление включает подотчетность сверстников или требование пересдать курсы. Современная военная подготовка создает условия для реакции среднего мозга на боевое давление, точно моделируя реальный бой, с использованием в основном классической техники Павлова и Скиннера.оперантное обусловливание (обе формы бихевиоризма ). [63]
Современное обучение меткой стрельбе является таким прекрасным примером бихевиоризма, что оно годами использовалось во вводном курсе психологии, преподаваемом всем курсантам в Военной академии США в Вест-Пойнте, как классический пример оперантной обусловленности. В 1980-х годах во время визита в Вест-Пойнт Б.Ф. Скиннер определил современную военную стрельбу как почти идеальное применение оперантной обусловленности. [65]
Подполковник Дэйв Гроссман заявляет об оперантной обусловленности и военной подготовке в США, что:
Вполне возможно, что никто намеренно не использовал методы оперантного кондиционирования или модификации поведения для обучения солдат в этой области ... Но с точки зрения психолога, который также является историком и кадровым военным, для меня становится все более очевидным, что это именно то, что было достигнуто. [63]
Теория подталкивания (или подталкивания) - это концепция в поведенческой науке , политической теории и экономике, в которой утверждается, что косвенные предложения, направленные на достижение ненасильственного соблюдения, могут влиять на мотивы, стимулы и принятие решений группами и отдельными лицами, по крайней мере, столь же эффективно - если не более эффективно - чем прямое указание, законодательство или правоприменение.
Концепция похвалы как средства поведенческого подкрепления уходит корнями в модель оперантного обусловливания Б.Ф. Скиннера. Через эту призму похвала рассматривается как средство положительного подкрепления, при котором наблюдаемое поведение повышается за счет случайной похвалы за такое поведение. [66] Сотни исследований продемонстрировали эффективность похвалы в поощрении позитивного поведения, в частности, в исследовании того, как учителя и родители хвалят ребенка для улучшения поведения и успеваемости, [67] [68] но также и в исследовании производительность труда. [69]Также было продемонстрировано, что похвала усиливает позитивное поведение у соседних людей, которых не хвалят (например, у одноклассника получателя похвалы) через косвенное подкрепление. [70] Похвала может быть более или менее эффективной в изменении поведения в зависимости от ее формы, содержания и подачи. Для того чтобы похвала повлияла на позитивное изменение поведения, она должна зависеть от позитивного поведения (т. Е. Вводиться только после того, как целевое поведение реализовано), должна указывать особенности поведения, которое должно быть усилено, и должна быть искренней и искренней. достоверно. [71]
Признавая эффект похвалы как позитивной стратегии подкрепления, многочисленные поведенческие и когнитивные поведенческие вмешательства включили в свои протоколы использование похвалы. [72] [73] Стратегическое использование похвалы признано научно обоснованной практикой как в управлении классом [72], так и в программах обучения родителей, [68] хотя похвалы часто относят к более широкой категории положительного подкрепления в исследованиях вмешательства. который включает в себя такие стратегии, как стратегическое внимание и поведенческие вознаграждения.
Было проведено несколько исследований по влиянию когнитивно-поведенческой терапии и оперантно-поведенческой терапии на различные медицинские состояния. Когда пациенты разработали когнитивные и поведенческие методы, которые изменили их поведение, отношения и эмоции; тяжесть их боли уменьшилась. Результаты этих исследований показали влияние когнитивных функций на восприятие боли, а представленное воздействие объяснило общую эффективность когнитивно-поведенческой терапии (КПТ) и оперантно-поведенческой терапии (ОБТ).
Брайкер выделил следующие способы, которыми манипуляторы управляют своими жертвами: [74]
Травматическая связь возникает в результате продолжающихся циклов жестокого обращения, в которых периодическое усиление вознаграждения и наказания создает сильные эмоциональные связи, устойчивые к изменениям. [75] [76]
Другой источник указал, что [77]«Необходимые условия для травмирующей связи заключаются в том, что один человек должен доминировать над другим, и что уровень жестокого обращения постоянно возрастает, а затем спадает. Отношения характеризуются периодами снисходительного, сострадательного и даже ласкового поведения доминирующего человека, перемежающихся периодическими эпизодами жестокого обращения. Чтобы сохранить преимущество, обидчик манипулирует поведением жертвы и ограничивает возможности жертвы, чтобы сохранить дисбаланс сил. Любая угроза балансу доминирования и подчинения может быть встречена нарастающим циклом наказания, варьирующимся от бурного запугивания до яростных вспышек насилия. Жертва также изолирует жертву от других источников поддержки, что снижает вероятность обнаружения и вмешательства, ухудшает положение жертвы ».способность получать уравновешивающую обратную связь с самореферентной реакцией и усиливает чувство односторонней зависимости ... Травматические последствия этих оскорбительных отношений могут включать снижение способности жертвы к точной самооценке, что приводит к чувству личной неадекватности и подчиненное чувство зависимости от доминирующего человека. Жертвы также могут столкнуться с различными неприятными социальными и правовыми последствиями своей эмоциональной и поведенческой связи с кем-то, кто совершил агрессивные действия, даже если они сами были реципиентами агрессии. '.приводящее к чувству личной неполноценности и подчиненному чувству зависимости от доминирующего человека. Жертвы также могут столкнуться с различными неприятными социальными и правовыми последствиями своей эмоциональной и поведенческой связи с кем-то, кто совершил агрессивные действия, даже если они сами были реципиентами агрессии. '.приводящее к чувству личной неполноценности и подчиненному чувству зависимости от доминирующего человека. Жертвы также могут столкнуться с различными неприятными социальными и правовыми последствиями своей эмоциональной и поведенческой связи с кем-то, кто совершил агрессивные действия, даже если они сами были реципиентами агрессии. '.
Большинство [ править ] из видеоигр разработаны вокруг петли навязчивой , добавив тип положительного подкрепления через график с переменной скоростью , чтобы держать игрок играть. Это может привести к патологии зависимости от видеоигр . [78]
В рамках тенденции в монетизации видеоигр во время 2010s, некоторые игры предложили лут коробку в качестве награды или предметы , которые можно приобрести на реальных средства. Ящики содержат случайный набор игровых предметов. Эта практика была привязана к тем же методам, которые используются в игровых автоматах и других игровых устройствах для выдачи вознаграждений, поскольку она следует графику с переменной ставкой. Хотя общее мнение, что лутбоксы являются формой азартных игр, такая практика классифицируется только в нескольких странах. Однако методы использования этих предметов в качестве виртуальной валюты для азартных онлайн-игр или торговли за реальные деньги привели к созданию рынка азартных игр со скинами, который проходит юридическую оценку. [79]
Эшфорт обсудил потенциально деструктивные стороны лидерства и определил то, что он называл мелкими тиранами : лидеры, которые придерживаются тиранического стиля управления, что создает атмосферу страха на рабочем месте. [80] Частичное или периодическое негативное подкрепление может создать эффективную атмосферу страха и сомнения . [74] Когда сотрудники понимают, что с хулиганами можно мириться, в результате может возникнуть атмосфера страха. [81]
Индивидуальные различия в чувствительности к вознаграждению , наказанию и мотивации изучались в рамках теории чувствительности к подкреплению, а также применялись к производительности на рабочем месте .
Одна из многих причин, по которым здравоохранение требует больших затрат, - это практика защитной медицины. Прабху рассматривает статью Коула и обсуждает, как реакции двух групп нейрохирургов являются классическим оперантным поведением. Одна группа практикует в штате с ограничениями по медицинским искам, а другая группа без ограничений. Группа нейрохирургов была анонимно опрошена об их образцах практики. Врачи изменили свою практику в ответ на отрицательный отзыв (страх перед судебным иском) в группе, которая практиковала в штате без ограничений по медицинским искам. [82]
Вознаграждение в оперантном обусловливании - это положительное подкрепление. ... Оперантное поведение дает хорошее определение вознаграждения. Все, что заставляет человека возвращаться за большим, является положительным подкреплением и, следовательно, наградой. Хотя это дает хорошее определение, положительное подкрепление - лишь одна из нескольких функций вознаграждения. ... Награды привлекательны. Они мотивируют и заставляют прилагать усилия. ... Награды побуждают подходящее поведение, также называемое аппетитным или подготовительным поведением, и завершающееся поведение. ... Таким образом, любой стимул, объект, событие, действие или ситуация, которые могут заставить нас приблизиться и поглотить их, по определению являются наградой.
Злоупотребляемые вещества (от алкоголя до психостимуляторов) изначально попадают в организм регулярно в соответствии с их положительными укрепляющими свойствами. Важно отметить, что повторяющееся воздействие полезных веществ запускает цепочку вторичных подкрепляющих событий, в результате чего сигналы и контексты, связанные с употреблением наркотиков, сами могут стать подкрепляющими и тем самым способствовать продолжающемуся употреблению и возможному злоупотреблению выбранными веществами. ...
Важным аспектом подкрепления, имеющим большое значение для процесса зависимости (и особенно рецидива), является вторичное подкрепление (Stewart, 1992). Вторичные подкрепления (во многих случаях также рассматриваемые как условные подкрепления), вероятно, управляют большинством процессов подкрепления у людей. В конкретном случае наркомании [наркомании] сигналы и контексты, которые тесно и неоднократно связаны с употреблением наркотиков, часто сами становятся подкрепляющими ... Фундаментальная часть теории стимулирования-сенсибилизации Робинсона и Берриджа утверждает, что стимулирующая ценность или привлекательность Природа таких процессов вторичного подкрепления, в дополнение к самим основным подкрепляющим элементам, может сохраняться и даже становиться сенсибилизированной со временем в связи с развитием наркомании (Робинсон и Берридж, 1993). ...
Отрицательное подкрепление - это особое состояние, связанное с усилением поведенческих реакций, которые прекращают действие некоторого продолжающегося (предположительно отталкивающего) стимула. В этом случае мы можем определить отрицательное подкрепление как мотивационный стимул, усиливающий такую реакцию «бегства». Исторически в отношении наркозависимости этот феномен постоянно наблюдался у людей, когда наркотики вводились самостоятельно, чтобы утолить мотивационную потребность в состоянии абстиненции (Wikler, 1952).
Когда Павловской CS + приписывается значимость стимула, она не только вызывает «желание» для ее UCS, но часто сама реплика становится очень привлекательной - даже в иррациональной степени. Эта привлекательность реплики - еще одна отличительная черта значимости стимула. На CS становится трудно не смотреть (Wiers & Stacy, 2006; Hickey et al., 2010a; Piech et al., 2010; Anderson et al., 2011). CS даже приобретает некоторые стимулирующие свойства, аналогичные его UCS. Привлекательный CS часто вызывает поведенчески мотивированный подход, и иногда человек может даже попытаться «потреблять» CS как свою UCS (например, есть, пить, курить, заниматься сексом, принимать как наркотик). «Желание» CS может также превратить ранее нейтральный стимул в инструментальное условное подкрепление, так что человек будет работать, чтобы получить сигнал (однако,существуют и альтернативные психологические механизмы условного подкрепления).
Важной целью в будущем нейробиологии наркологии является понимание того, как интенсивная мотивация становится узко сфокусированной на конкретной цели. Было высказано предположение, что зависимость отчасти вызвана чрезмерной заметностью стимулов, создаваемой сенсибилизированными или гиперреактивными дофаминовыми системами, которые вызывают сильное «желание» (Робинсон и Берридж, 1993). Но почему одна цель становится более «востребованной», чем все остальные, полностью не объяснено. У наркоманов или пациентов, стимулированных агонистами, повторение дофаминовой стимуляции значимости стимулов приписывается конкретным индивидуальным занятиям, таким как прием вызывающего привыкание наркотика или определенных компульсий. В павловских ситуациях вознаграждения некоторые сигналы к вознаграждению становятся более «желанными», чем другие, в качестве мощных мотивационных магнитов, причем у разных людей разные способы (Robinson et al., 2014b;Сондерс и Робинсон, 2013). ... Однако гедонистические эффекты могут со временем измениться. Поскольку препарат принимался неоднократно, мезолимбическая дофаминергическая сенсибилизация могла, следовательно, происходить у восприимчивых людей, усиливая `` желание '' (Leyton and Vezina, 2013; Lodge and Grace, 2011; Wolf and Ferrario, 2010), даже если опиоидные гедонические механизмы подверглись подавлению. из-за постоянной лекарственной стимуляции, вызывающей толерантность "симпатии". Стимулирующая сенсибилизация вызывает зависимость, выборочно усиливая вызванное сигналом «желание» снова принять наркотик, и так сильно вызывает мотивацию, даже если наркотик становится менее приятным (Робинсон и Берридж, 1993).мезолимбическая дофаминергическая сенсибилизация может, следовательно, происходить у восприимчивых людей, чтобы усилить `` желание '' (Leyton and Vezina, 2013; Lodge and Grace, 2011; Wolf and Ferrario, 2010), даже если опиоидные гедонические механизмы подверглись подавлению из-за постоянной стимуляции лекарствами, вызывая «симпатичная» толерантность. Стимулирующая сенсибилизация вызывает зависимость, выборочно усиливая вызванное сигналом «желание» снова принять наркотик, и так сильно вызывает мотивацию, даже если наркотик становится менее приятным (Робинсон и Берридж, 1993).мезолимбическая дофаминергическая сенсибилизация может, следовательно, происходить у восприимчивых людей, чтобы усилить `` желание '' (Leyton and Vezina, 2013; Lodge and Grace, 2011; Wolf and Ferrario, 2010), даже если опиоидные гедонические механизмы подверглись подавлению из-за постоянной стимуляции лекарствами, вызывая «симпатичная» толерантность. Стимулирующая сенсибилизация вызывает зависимость, выборочно усиливая вызванное сигналом «желание» снова принять наркотик, и так сильно вызывает мотивацию, даже если наркотик становится менее приятным (Робинсон и Берридж, 1993).путем выборочного усиления вызванного сигналом «желания» снова принять наркотик и таким мощным стимулом, даже если наркотик стал менее приятным (Робинсон и Берридж, 1993).путем выборочного усиления вызванного сигналом «желания» снова принять наркотик и таким мощным стимулом, даже если наркотик стал менее приятным (Робинсон и Берридж, 1993).
{78} Александр Б.К. (2010) Зависимость: Вид из Крысиного парка, извлечено из Зависимости: Вид из Крысиного парка (2010)
Ресурсы библиотеки об условном обозначении оперантов |
|
Поищите оперант в Викисловаре, бесплатном словаре. |
Викискладе есть медиафайлы по теме оперантного кондиционирования . |