无界报酬折扣半马氏模型最优策略的结构 |
| |
引用本文: | 董泽清,刘克.无界报酬折扣半马氏模型最优策略的结构[J].中国科学A辑,1985,28(11):975-985. |
| |
作者姓名: | 董泽清 刘克 |
| |
作者单位: | 中国科学院应用数学研究所 北京 |
| |
摘 要: | 本文研究Lippmann型无界报酬折扣半马氏决策规划(简记为URSMDP)最优策略的结构。我们证明了:任给一策略,若它是a折扣最优的,则随机平稳策略,对同一a也是折扣最优的;对任给的整数n≥1,我们也给出了(在适当历史下)也是a折扣最优的充分条件;任一随机a折扣最优平稳策略必可分解为若干个决定性平稳最优策略(对同一a)的凸组合。从而较完满地解决了该模型最优策略的结构问题。
|
|
| 点击此处可从《中国科学A辑》浏览原始摘要信息 |
| 点击此处可从《中国科学A辑》下载免费的PDF全文 |
|