非平稳MDP平均模型及其滚动式算法 AVERAGE MODEL IN NONHOMOGENEOUS MARKOV DECISION PROCESSES AND ROLLING HORIZON ALGORITHM期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

非平稳MDP平均模型及其滚动式算法

引用本文：	郭先平.非平稳MDP平均模型及其滚动式算法[J].系统科学与数学,1999,19(4):439-446.

作者姓名：	郭先平

作者单位：	中山大学数学系!亚太运筹中心，广州５１０２７５(郭先平)，中国科学院应用数学研究所!北京１０００８０(刘建庸，刘克)

基金项目：	国家青年基金，国家自然科学基金，广东省自然科学基金，亚太运筹中心资助

摘要：	本文考虑可数状态空间非平稳马尔可夫决策过程（ＭＤＰ）的平均目标．首先，我们指出并改正了Ｐａｒｋ，ｅｔ，ａｌ［１］和Ａｌｄｅｎ，ｅｔａｌ［２］的错误，并在弱于Ｐａｒｋ,ｅｔａｌ［１］的条件下，借助于新建立的最优方程，证明了最优平均值的收敛性和平均最优马氏策略的存在性．其次，给出了ε（＞０）－平均最优马氏策略的滚动式算法．
关键词：	非平稳MDP 平均目标 ε（≥0）－平均最优马氏策略滚动式算法最优方程
AVERAGE MODEL IN NONHOMOGENEOUS MARKOV DECISION PROCESSES AND ROLLING HORIZON ALGORITHM

Xian PIng GUO,Jian Yong LIU,Ke LIU.AVERAGE MODEL IN NONHOMOGENEOUS MARKOV DECISION PROCESSES AND ROLLING HORIZON ALGORITHM[J].Journal of Systems Science and Mathematical Sciences,1999,19(4):439-446.

Authors:	Xian PIng GUO Jian Yong LIU Ke LIU

Affiliation:	(1)Department of Mathematics, Zhong Shan University; APORC 510275,P.R.China;(2)Institute Of Applied Mathematics, Academia Silica, Beijing 100080,P.R.China

Abstract:

Keywords:
本文献已被 CNKI 等数据库收录！
	点击此处可从《系统科学与数学》浏览原始摘要信息
	点击此处可从《系统科学与数学》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏