首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
随机冲击下的折扣半马氏决策规划   总被引:1,自引:0,他引:1  
随机冲击下的折扣半马氏决策规划胡奇英(西安电子科技大学七系,西安710071)DISCOUNTEDSEMI-MARKOVDECISIONPROGRAMMINGUNDERSTOCHASTICSHOCKS¥HUQIYING(XidianUniversit...  相似文献   

2.
随机终止的非平稳折扣半马氏决策规划   总被引:1,自引:1,他引:0  
半马氏决策规划(SMDP)提出至今讨论了时齐模型{S,A,,,p,T V}和非时齐模型{&:A。,rt。,P。;T,。,Vn},后者的元素中至少有一个与决策周期数。有关.在实际问题中还有元素全部或部分与时间因子有关的模型,我们称之为非平稳模型.SMDP的目标函数也仅讨论决策周期数有限和无限这两种情形,但有时还要考虑时间段K到上系统的最优控制.这里T为系统的终止时间,可是随机的.我们称这种问题为随机终止的。本文讨论随机终止的非平稳折扣SMDP.  相似文献   

3.
一般化马氏决策规划的现状与展望   总被引:3,自引:0,他引:3  
  相似文献   

4.
无限阶段部分可观察马尔可夫决策规划   总被引:2,自引:0,他引:2  
本文对[1,2]所考虑的无限阶段折扣费用部分可观察马尔可夫决策规划作了进一步的讨论,澄清了其中的一些模糊概念,补充或纠正了其中的疏漏和错误,特别地,在保持费用函数分片线性的原则下扩大了有限瞬时策略类,最后给出了几个新的结论,并对[1]中的策略迭代算法给出了修正及收敛估计。  相似文献   

5.
目标规划的特点和进展   总被引:4,自引:0,他引:4  
  相似文献   

6.
二层凸规划的基本性质   总被引:2,自引:0,他引:2  
王先甲  冯尚友 《应用数学》1995,8(3):283-288
本文研究了一类抛述二层决策问题的二层数学规划模型,在一定条件下讨论了下层极值函数和上层复合目标函数的凸性和连续性,给出了二层决策问题优决策的存在条件。  相似文献   

7.
多属性决策中的目标规划   总被引:5,自引:0,他引:5  
针对只有部分权重信息的对方案有偏好的多属性决策问题,本文给出了一种简单的目标规划模型,通过对该模型的求解却可得到决策方案的排序。最后给出了一个算例。  相似文献   

8.
部分可观察马尔可夫决策规划──首达目标模型刘迪芬(湖南师范大学数学系,长沙410081)刘建庸,刘克(中国科学院应用数学研究所,北京100080)PARTIALLYOBSERVABLEMARKOVDECISIONPROGRAMMING:FIRSTPA...  相似文献   

9.
1.引言我们将在可测(确定性)马氏策略类Π_m~d(c)中讨论连续时间平均马氏决策(简称平均CTMDP):{S,(A(i),(?)(i),i∈S),q,r,(?)}.本文假设状态空间 S 为可列集;行动集 A(i)为一般点集,(A(i),(?)(i),i∈S)为可测空间,任给 a∈A(i),要求{a}∈(?)(i);q 是保守的转移速率族;报酬率 r 是一致有界的可测函数,即存在 M<∞,使|r(i,a)|≤M 对 i∈S,a∈A(i)成立.对π∈Π_m~d(c),i∈S,平均报酬函数(?)定义为:  相似文献   

10.
本文给出线性二级决策的一种非迭代算法,并给出一个算例。  相似文献   

11.
随机排序模型及求解方法   总被引:1,自引:0,他引:1  
本文介绍了随机排序模型,并对求解随机排序的基本方法作一简要综述。  相似文献   

12.
类似[1-4],折扣向量值马氏决策规划(DVMDP)描述为: {S,(A(i),i∈S),q,r,Vβ},(1)其中S为可数状态集,A(i)是有限决策集,q(j|i,a)是转移概率,r=r(i,j,a)=(r1(i,j,a),r2(i,j,a),…,rp(i,j,a))是状态i处使用决策a于下一步转移到状态j时所获的p维报酬向量,r(i,j,a)对i,j,a一致有界,Vβ是β折扣目标. 以Π表一般策略集,若 π ∈Π有 Vβ(π)≤ Vβ(π*),则称π* 为DVMDP的“强有效策略”,Vβ(π*)为“…  相似文献   

13.
报酬无界的连续时间折扣马氏决策规划   总被引:2,自引:0,他引:2  
本文讨论了报酬函数夫界,转移速率族一致有界,状态空间和行动集均可数的连续时间折扣马氏决策规划,文中引入了一为新的无界报酬函数,并在一新的马氏策略类中,证明了有界报酬下成立的所有结果。讨论了最优策略的结构,得到了该模型策略为最优的一个充要条件。  相似文献   

14.
给出一种模糊多目标马尔可夫决策规划的定义,即当报酬是模糊函数时的多目标马尔可夫决策规划,并解决求解这种规划的最优策略的方法以及这种多目标规划最优解的判决问题。  相似文献   

15.
双层规划的递阶交互决策有效化方法   总被引:2,自引:0,他引:2  
刘红英 《应用数学》2005,18(3):333-338
本文讨论了协调集上双层规划问题解的性质,所得结论表明上层将所得利益全部让给下层,或下层将所得利益全部让给上层.当决策者不满足此种有效化方式时,必须寻找体现递阶结构的有效化方法.本文给出了一种保持递阶结构的递阶交互决策有效化方法.该方法适用于下层有多个平行子问题的双层线性规划.  相似文献   

16.
多属性决策的群排序方法研究   总被引:13,自引:1,他引:13  
在多属性群决策中,决策的决策结果有两种表现形式,即决策方案的优先序和决策方案的排序权向量。本研究基于决策方案优先序的群排序方法,提出了加权偏差平方和最小化方法及基于测度函数的0-1规划方法。  相似文献   

17.
本文研究约束折扣半马氏决策规划问题,即在一折扣期望费用约束下,使折扣期望报酬达最大的约束最优问题,假设状态集可数,行动集为紧的非空Borel集,本文给出了p-约束最优策略的充要条件,证明了在适当的假设条件下必存在p-约束最优策略。  相似文献   

18.
求解群体多目标凸规划的一个交互规划算法   总被引:3,自引:0,他引:3  
本文给出一个由决策群体求解带有非线性约束的多目标凸规划问题的交互规划算法。此法通过决策群体与分析者之间以及各决策者之间的交互,最终得到群体满意的有效解,本文还证明了这一算法的收敛性定理。  相似文献   

19.
本文考虑的是状态空间和行动空间均为一般集的受约束的平稳望总报酬模型,首先证明了随机策略类及最优策略类的紧性,然后,利用引入Lagrange乘子的技巧,在放弃通常的对期望费用的强约束假设下,用拓扑分析的方法,证明了约束最优策略的存在性,从而即推广了无约束的Erikj Balder(1992)的模型,又改进了Linl Sennott的结果。  相似文献   

20.
多属性决策的组合赋权优化方法   总被引:6,自引:0,他引:6  
针对多属性决策中属性权重的确定问题,提出了一种主观权重与客观权重的集成方法。对每个决策属性,将各个决策者给出的主观权重和客观权重作为样本点,采用规划的方法来集成主观权重和客观权重,使决策结果更加可靠、可信。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号