首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 31 毫秒
1.
本文主要讨论了无界报酬向量模型的平稳策略问题,给出了改进平稳策略的方法,建立起向量模型的最优方程,获得平稳策略为强最优策略的充要条件.指出最优平稳策略的期望报酬函数必为极大不动点,最后提出一种寻求最优平稳策略的策略迭代算法.  相似文献   

2.
讨论了无界报酬非时齐扣马氏决策模型,且哲扣因子βt依赖于前一阶段所处的状态和采取的行动,从而推广了常数折扣因子的马氏决策模型,在一定的假设下,得到了最优方程,证明了存在ε-最优马氏策略。  相似文献   

3.
本文讨论在一般状态和行动空间下,Lippman[1]的无界报酬折扣半马氏决策规划的ε(≥0)最优平稳策略的存在性问题,最优策略的性质及这类模型的不变问题,最后给出在有限行动空间下不变问题最优策略的一种算法。  相似文献   

4.
本文研究具有可数状态空间和任意行动空间的Lippman型无界报酬折扣半马氏决策模型(DSMDM)矩最优策略的结构.证明了:若策略π,σ是(K)矩最优的.则π~nσ及π的任一自组合策略也是(K)矩最优的,且存在与π等价的(K)矩最优策略π~(?),使~nπ~(*hn)为(K)矩最优的;存在(K)矩最优策略的充要条件是(K)矩最优行动集A_K(i)非空;策略π为(K)矩最优当且仅当π_n(A_K(i)|H_n,i)=1,α.e.P_(πn);π为(K)矩最优策略的又一充要条件是它可分解为若干个确定性(K)矩最优策略的一个凸组合.这样,该模型矩最优策略的结构就得到了较完满的解决.  相似文献   

5.
本文在矩最优准则下讨论具有可数状态空间和任意行动空间的Lippman型无界报酬折扣半马氏决策模型。对任意ε>0,证明了k阶矩ε-最优平稳策略的存在性,从而一般策略类中的矩最优性等价于平稳策略类中的矩最优性。(k-1)矩最优策略π为(k)矩最优的充要条件是(-1)~(k 1)V_k(π)满足最优方程,这里V_k(π)为使用π时的总折扣报酬的k阶矩。对平稳策略,给出了折扣报酬的各阶矩的递推公式,如果每个状态可用的行动集为有限集,证明了矩最优平稳策略的存在性,并建立了构造所有矩最优平稳策略的迭代算法。  相似文献   

6.
7.
本文讨论一类非时齐折扣马氏决策规划的总折扣报酬的k(≥1)矩和矩最优问题,得到k矩和矩最优策略存在的一个充要条件;并将k矩最优问题化为同类型的一个马氏决策规划的一阶矩最优问题,从而也解决了这类模型的k矩最优策略的结构问题.  相似文献   

8.
在Harrison意义下的无界报酬函数折扣模型下,本文讨论了最优策略的几个性质和它的结构。本文证明了:若π~*=(π_1~*,π_2~*,…)是该模型的最优策略,则π_1~(*∞),(π_1~*,…,π_n~*)~∞与(π_1~*,…,π_n~*,π_1~*,π_2~*,…)(n≥1)都是最优策略;给出π_n~*也构成最优随机平稳策略的条件和修改方法;策略π~*=(π_1~*,π_2~*,…)是最优的当且仅当它在任何时刻可达的状态上都必须选取最优决策;最后指出π_0~(*∞)为最优随机平稳策略的充要条件是决策规则π_0~*是若干个最优平稳策略f_n~∞的决策函数f_n的凸组合。从而较完满地解决了Harrison无界报酬意义下折扣模型的最优策略结构问题。  相似文献   

9.
本文在状态集可数、行动集任意的条件下,讨沦报酬函数满足一种推广的绝对平均相对有界的非时齐折扣马氏决策规划;建立了模型的最优方程,证明了ε(>0)最优马氏策略的存在性;最后给出最优策略(最优马氏策略)存在的必要充分条件.  相似文献   

10.
讨论了折扣周期马氏决策模型的最优策略的结构,并给出了其线性规划算法.  相似文献   

11.
备件储备量的马尔可夫决策模型研究   总被引:1,自引:0,他引:1       下载免费PDF全文
在分析通信装备备件随机需求的基础上,结合费用因素,运用马氏决策规划方法,建立了备件随机存储管理的优化模型,并通过模型计算,给出了备件随机存储的最优策略。结果显示以此方法来控制备件储备量既能保障通信装备的维修需求,又能使存储费用降到最低水平。  相似文献   

12.
为了保证企业投资决策最优的投资效果,企业应把投资决策过程分为多个阶段.建立了以获得利润最大化,同时把投资总风险控制在可承受范围内为目标的基本动态规划模型.该模型把一个多阶段的投资问题转化为多个单阶段的问题,从而求解整个投资阶段的最优决策问题就转化成求解一系列单个投资阶段中的最优问题.  相似文献   

13.
马尔可夫决策规划与采掘计划优化   总被引:3,自引:0,他引:3  
应用马尔可夫决策规划(MDP)模型对采掘计划进行了费用优化。  相似文献   

14.
本文应用离散时间的马尔可夫决策规划(MDP)的原理和方法,建立了农田灌溉的MDP模型。同时,给出了求解(择优)的算法,并对一个简化的例子进行了实际求解。最后,讨论了模型的进一步发展。  相似文献   

15.
线性规划问题最优解判别定理的研究   总被引:2,自引:0,他引:2  
指出一些文献中线性规划问题最优解判别定理的不全面或不正确之处,给出线性规划问题唯一最优解的判别定理和无穷多最优解的判别定理,并举例验证了该定理的正确性  相似文献   

16.
本文针对可编程序控制器用户程序的编制问题,给出了一种用阶段过渡控制图作为桥梁来编制梯形图的通用方法,并对若干实例在PLC-2/30可编程控制器上全部验证通过,说明这种方法正确无误。该方法严密清晰,简单实用,有规可循,因此是解决PC用户编程很有实用价值的一种通用方法。  相似文献   

17.
针对属性值由实数形式给出,属性权重完全未知,且带有决策者偏好信息的多属性决策问题,以传统离差最大化决策方法为基础,提出了一种最优化决策模型.为解决权重信息不完全的多属性决策问题提供了新的思路.最后,给出了一个实际例子以说明模型的有效性和应用性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号