ПВЛВ

Первичное значение адаптированного значения ( PVLV ) модель является возможным объяснением вознаграждения предсказания свойств огневого дофамина (DA) нейронов. ^[1] Он моделирует поведенческие и нейронные данные о состоянии Павлова и дофаминергических нейронах среднего мозга, которые срабатывают пропорционально неожиданным вознаграждениям. Это альтернатива алгоритму временных разностей (TD) . ^[2]

Используется в составе Леабры .

Ссылки [ править ]

^ О'Рейли, RC; Франк, MJ; Хейзи, Т.Э. и Ватц, Б. (2007). "PVLV: Первичная ценность и усвоенная ценность Павловского алгоритма обучения" . Поведенческая неврология . 121 (1): 31–4. CiteSeerX 10.1.1.67.6739 . DOI : 10.1037 / 0735-7044.121.1.31 . PMID 17324049 .
^ "Leabra PBWM" . CCNLab.

Эта статья по нейробиологии - незавершенная . Вы можете помочь Википедии, расширив ее .

[1] О'Рейли, RC; Франк, MJ; Хейзи, Т.Э. и Ватц, Б. (2007). "PVLV: Первичная ценность и усвоенная ценность Павловского алгоритма обучения" . Поведенческая неврология . 121 (1): 31–4. CiteSeerX 10.1.1.67.6739 . DOI : 10.1037 / 0735-7044.121.1.31 . PMID 17324049 .

[2] "Leabra PBWM" . CCNLab.

[1]