ПОМДП Монте-Карло


В классе марковских алгоритмов принятия решений POMDP Монте-Карло (MC-POMDP) ​​представляет собой версию фильтра частиц для алгоритма частично наблюдаемого марковского процесса принятия решений (POMDP). В MC-POMDP фильтры частиц используются для обновления и аппроксимации убеждений, а алгоритм применим к состояниям с непрерывными значениями, действиям и измерениям. [1]