首页 | 本学科首页   官方微博 | 高级检索  
     检索      

随机折扣部分可观察马尔可夫决策规划
引用本文:刘迪芬.随机折扣部分可观察马尔可夫决策规划[J].系统科学与数学,1993,13(2):152-159.
作者姓名:刘迪芬
作者单位:湖南师范大学数学系 长沙410006 (刘迪芬),中国科学院应用数学研究所 北京100080 (刘克),中国科学院应用数学研究所 北京100080(刘建庸)
基金项目:国家自然科学基金资助课题
摘    要:一、引言考虑一个部分可观察马尔可夫决策规划模型(简记为 POMDP),并引文1]中所用的定义、记号(只将δ_N 换成∏,(?)换成 A)和有关结论.于是信息向量 π(t)与 π(t 1)有如下关系


PARTIALLY OBSERVABLE MARKOV DECISION PROGRAMMING WITH STOCHASTIC DISCOUNT FACTORS
Institution:(1)Hunan Normal University,Changsha 410006;(2)Institute of Applied Mathematies Academia Siniea,Beijing 100080;(3)Institute of Applied Mathematies Academia Siniea,Beijing 100080
Abstract:
Keywords:
本文献已被 CNKI 等数据库收录!
点击此处可从《系统科学与数学》浏览原始摘要信息
点击此处可从《系统科学与数学》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号