DESPOT-α: Online POMDP Planning With Large State And Observation Spaces

Under Construction

对这篇文章的理解还没完全，这篇文章有一个重要的前置也没读完。数学难度较高。这里尝试同时写两个文章的review。这两篇文章解答的都是求解POMDP(partially observable markov decision process)的问题，基本思路是蒙特卡洛算法(然而还有大量的数学理论以及分析，目前并未学贯通)

前置论文算法:

Keys	Action
`?`	Open this help
`n`	Next page
`p`	Previous page
`s`	Search