Перейти к навигации Перейти к поиску
Первичное значение адаптированного значения ( PVLV ) модель является возможным объяснением вознаграждения предсказания свойств огневого дофамина (DA) нейронов. [1] Он моделирует поведенческие и нейронные данные о состоянии Павлова и дофаминергических нейронах среднего мозга, которые срабатывают пропорционально неожиданным вознаграждениям. Это альтернатива алгоритму временных разностей (TD) . [2]
Используется в составе Леабры .
Ссылки [ править ]
- ^ О'Рейли, RC; Франк, MJ; Хейзи, Т.Э. и Ватц, Б. (2007). "PVLV: Первичная ценность и усвоенная ценность Павловского алгоритма обучения" . Поведенческая неврология . 121 (1): 31–4. CiteSeerX 10.1.1.67.6739 . DOI : 10.1037 / 0735-7044.121.1.31 . PMID 17324049 .
- ^ "Leabra PBWM" . CCNLab.