首页 | 官方网站   微博 | 高级检索  
     

非平稳MDP平均模型及其滚动式算法
引用本文:郭先平.非平稳MDP平均模型及其滚动式算法[J].系统科学与数学,1999,19(4):439-446.
作者姓名:郭先平
作者单位:中山大学数学系!亚太运筹中心,广州510275(郭先平),中国科学院应用数学研究所!北京100080(刘建庸,刘克)
基金项目:国家青年基金,国家自然科学基金,广东省自然科学基金,亚太运筹中心资助
摘    要:本文考虑可数状态空间非平稳马尔可夫决策过程(MDP)的平均目标.首先,我们指出并改正了Park,et,al[1]和Alden,etal[2]的错误,并在弱于Park,etal[1]的条件下,借助于新建立的最优方程,证明了最优平均值的收敛性和平均最优马氏策略的存在性.其次,给出了ε(>0)-平均最优马氏策略的滚动式算法.

关 键 词:非平稳MDP  平均目标  ε(≥0)-平均最优马氏策略  滚动式算法  最优方程

AVERAGE MODEL IN NONHOMOGENEOUS MARKOV DECISION PROCESSES AND ROLLING HORIZON ALGORITHM
Xian PIng GUO,Jian Yong LIU,Ke LIU.AVERAGE MODEL IN NONHOMOGENEOUS MARKOV DECISION PROCESSES AND ROLLING HORIZON ALGORITHM[J].Journal of Systems Science and Mathematical Sciences,1999,19(4):439-446.
Authors:Xian PIng GUO  Jian Yong LIU  Ke LIU
Affiliation:(1)Department of Mathematics, Zhong Shan University; APORC 510275,P.R.China;(2)Institute Of Applied Mathematics, Academia Silica, Beijing 100080,P.R.China
Abstract:
Keywords:
本文献已被 CNKI 等数据库收录!
点击此处可从《系统科学与数学》浏览原始摘要信息
点击此处可从《系统科学与数学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号