首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于Span压缩的相对值迭代算法
引用本文:胡光华,吴沧浦.基于Span压缩的相对值迭代算法[J].运筹学学报,1999,3(2):1-9.
作者姓名:胡光华  吴沧浦
作者单位:北京理工大学自动控制系!北京,100081
摘    要:本文研究平均报酬马氏决策过程(MDP)的相对值迭代算法.给出了span半范数压缩因子的一个表达式,证明了该因子小于1时本文绘出的相对值迭代算法及小步长相对值迭代算法均收敛到其最优解.

关 键 词:马氏决策过程  压缩映射  动态规划  平均报酬

Relative Value Iteration Algorithm Based on Contraction Span Semi-Norm
GUANGHUA HU, CANGPU WU.Relative Value Iteration Algorithm Based on Contraction Span Semi-Norm[J].OR Transactions,1999,3(2):1-9.
Authors:GUANGHUA HU  CANGPU WU
Abstract:In this paper, the relative value iteration algorithm for average reward Markov decision processes (MDP)is investigated. A formulation of contraction factor of span seminorm is given, the convergence of relative value iteration (RVI) algorithm and the smallstep RVI algorithm are proved under a condition of the contraction span semi-norm.
Keywords:Markov decision processes  contraction mappings  dynamic programming  average reward
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号