1.你能那个说一下马尔可夫模型是什么吗?2.所以它幽灵(一种智能体)处于什么位置?和哪些因素有关?3.这个整个代码仓库的话是怎么个构造的?就是包含哪几个大块和哪几个大类?4.哪一块和这个贝叶斯实现那个逻辑有关5.那你这个算是一个偏性能的优化的一个项目吗6.它如果应用在推荐领域的话是否可行呢?比如广告推荐啦,视频推荐这种。7.那这个马尔可夫模型在这里体现在哪里呢?8.这个项目里还有一个那个决策逻辑是基于贪心策略的动作选择算法,结合实时概率信念分布。这块能详细介绍一下。9.通过什么指标判断他下一步动作是否是优的呢?10.那有没有比如考虑一个全局的一个最优策略呢,这么一个方案。11.为什么一次最多走...