向量值马氏决策规划的线性加权解法 |
| |
引用本文: | 曾庆宁.向量值马氏决策规划的线性加权解法[J].应用数学学报,2001,24(4):630-632. |
| |
作者姓名: | 曾庆宁 |
| |
作者单位: | 广西桂林电子工业学院电子信息分院信息工程系, |
| |
摘 要: | 类似[1-4],折扣向量值马氏决策规划(DVMDP)描述为: {S,(A(i),i∈S),q,r,Vβ},(1)其中S为可数状态集,A(i)是有限决策集,q(j|i,a)是转移概率,r=r(i,j,a)=(r1(i,j,a),r2(i,j,a),…,rp(i,j,a))是状态i处使用决策a于下一步转移到状态j时所获的p维报酬向量,r(i,j,a)对i,j,a一致有界,Vβ是β折扣目标. 以Π表一般策略集,若 π ∈Π有 Vβ(π)≤ Vβ(π*),则称π* 为DVMDP的“强有效策略”,Vβ(π*)为“…
|
关 键 词: | 折扣向量值 马氏决策规划 线性加权解法 多目标规划 |
Linear-weighted Method for Solving Vector-Valued Markov Decision Decision Programming. |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 CNKI 维普 万方数据 等数据库收录! |