排序方式: 共有9条查询结果,搜索用时 93 毫秒
1
1.
2.
3.
4.
部分可观察马尔可夫决策规划──首达目标模型刘迪芬(湖南师范大学数学系,长沙410081)刘建庸,刘克(中国科学院应用数学研究所,北京100080)PARTIALLYOBSERVABLEMARKOVDECISIONPROGRAMMING:FIRSTPA... 相似文献
5.
MARKOV DECISION PROGRAMMING WITH CONSTRAINTS 总被引:1,自引:0,他引:1
MARKOVDECISIONPROGRAMMINGWITHCONSTRAINTSLIUJIANYONG(刘建庸);LIUKE(刘克)(InstituteofAppliedMathematics,theChineseAcademyofSciences,... 相似文献
6.
7.
在状态空间和行动集均有限的条件下,[1-5]讨论了时间离散的,平稳的马氏决策规划的摄动模型,其中,[1,3,4]讨论了单摄动模型,[5]讨论了具有加权准则的摄动模型,[6,7]讨论了时间离散的,平稳的马氏报酬过程的摄动模型,但[6,7]仅考虑了摄动对最优值的影响,而没有考虑摄动对最优策略的影响,本文将讨论具有摄动的非平衡平均马氏均策规划和连续时间折扣马氏决策规划。 相似文献
8.
In this paper, we discuss Markovian decision programming with recursive vector-reward andgive an algorithm to find optimal policies. We prove that: (1) There is a Markovian optimal policy for the nonstationary case; (2) Thereis a stationary optimal policy for the stationary case. 相似文献
9.
对平均准则的讨论一直是马氏决策过程研究的热点之一,近几年已从最优方程推广到最优不等式。本文系统地了介绍最优不等式的提出及其发展思路,目前已取得的成果等,同时也指出了有待于进一步研究的问题。 相似文献
1