随机折扣部分可观察马尔可夫决策规划 |
| |
引用本文: | 刘迪芬.随机折扣部分可观察马尔可夫决策规划[J].系统科学与数学,1993,13(2):152-159. |
| |
作者姓名: | 刘迪芬 |
| |
作者单位: | 湖南师范大学数学系 长沙410006
(刘迪芬),中国科学院应用数学研究所 北京100080
(刘克),中国科学院应用数学研究所 北京100080(刘建庸) |
| |
基金项目: | 国家自然科学基金资助课题 |
| |
摘 要: | 一、引言考虑一个部分可观察马尔可夫决策规划模型(简记为 POMDP),并引文1]中所用的定义、记号(只将δ_N 换成∏,(?)换成 A)和有关结论.于是信息向量 π(t)与 π(t 1)有如下关系
|
PARTIALLY OBSERVABLE MARKOV DECISION PROGRAMMING WITH STOCHASTIC DISCOUNT FACTORS |
| |
Institution: | (1)Hunan Normal University,Changsha 410006;(2)Institute of Applied Mathematies Academia Siniea,Beijing 100080;(3)Institute of Applied Mathematies Academia Siniea,Beijing 100080 |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《系统科学与数学》浏览原始摘要信息 |
| 点击此处可从《系统科学与数学》下载免费的PDF全文 |