Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Первичное значение адаптированного значения ( PVLV ) модель является возможным объяснением вознаграждения предсказания свойств огневого дофамина (DA) нейронов. [1] Он моделирует поведенческие и нейронные данные о состоянии Павлова и дофаминергических нейронах среднего мозга, которые срабатывают пропорционально неожиданным вознаграждениям. Это альтернатива алгоритму временных разностей (TD) . [2]

Используется в составе Леабры .

Ссылки [ править ]

  1. ^ О'Рейли, RC; Франк, MJ; Хейзи, Т.Э. и Ватц, Б. (2007). "PVLV: Первичная ценность и усвоенная ценность Павловского алгоритма обучения" . Поведенческая неврология . 121 (1): 31–4. CiteSeerX  10.1.1.67.6739 . DOI : 10.1037 / 0735-7044.121.1.31 . PMID  17324049 .
  2. ^ "Leabra PBWM" . CCNLab.