首页 | 本学科首页   官方微博 | 高级检索  
     检索      

向量值马氏决策规划的线性加权解法
引用本文:曾庆宁.向量值马氏决策规划的线性加权解法[J].应用数学学报,2001,24(4):630-632.
作者姓名:曾庆宁
作者单位:广西桂林电子工业学院电子信息分院信息工程系,
摘    要:类似[1-4],折扣向量值马氏决策规划(DVMDP)描述为: {S,(A(i),i∈S),q,r,Vβ},(1)其中S为可数状态集,A(i)是有限决策集,q(j|i,a)是转移概率,r=r(i,j,a)=(r1(i,j,a),r2(i,j,a),…,rp(i,j,a))是状态i处使用决策a于下一步转移到状态j时所获的p维报酬向量,r(i,j,a)对i,j,a一致有界,Vβ是β折扣目标. 以Π表一般策略集,若 π ∈Π有 Vβ(π)≤ Vβ(π*),则称π* 为DVMDP的“强有效策略”,Vβ(π*)为“…

关 键 词:折扣向量值  马氏决策规划  线性加权解法  多目标规划

Linear-weighted Method for Solving Vector-Valued Markov Decision Decision Programming.
Abstract:
Keywords:
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号