期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

胡奇英《应用数学学报》1994,17(4):522-533

随机冲击下的折扣半马氏决策规划胡奇英（西安电子科技大学七系，西安７１００７１）ＤＩＳＣＯＵＮＴＥＤＳＥＭＩ－ＭＡＲＫＯＶＤＥＣＩＳＩＯＮＰＲＯＧＲＡＭＭＩＮＧＵＮＤＥＲＳＴＯＣＨＡＳＴＩＣＳＨＯＣＫＳ￥ＨＵＱＩＹＩＮＧ（ＸｉｄｉａｎＵｎｉｖｅｒｓｉｔ... 相似文献

2.

随机终止的非平稳折扣半马氏决策规划 总被引：1，自引：1，他引：0

胡奇英《应用数学学报》1993,16(4):566-570

半马氏决策规划(SMDP)提出至今讨论了时齐模型{S,A,,,p,T V}和非时齐模型{＆:A。,rt。,P。;T,。,Vn},后者的元素中至少有一个与决策周期数。有关.在实际问题中还有元素全部或部分与时间因子有关的模型,我们称之为非平稳模型.SMDP的目标函数也仅讨论决策周期数有限和无限这两种情形,但有时还要考虑时间段K到上系统的最优控制.这里T为系统的终止时间,可是随机的.我们称这种问题为随机终止的。本文讨论随机终止的非平稳折扣SMDP. 相似文献

3.

一般化马氏决策规划的现状与展望 总被引：3，自引：0，他引：3

胡奇英《运筹学杂志》1992,11(2):21-29

相似文献

4.

无限阶段部分可观察马尔可夫决策规划 总被引：2，自引：0，他引：2

刘迪芬刘克《高校应用数学学报(A辑)》1993,(2):210-221

本文对[1,2]所考虑的无限阶段折扣费用部分可观察马尔可夫决策规划作了进一步的讨论,澄清了其中的一些模糊概念,补充或纠正了其中的疏漏和错误,特别地,在保持费用函数分片线性的原则下扩大了有限瞬时策略类,最后给出了几个新的结论,并对[1]中的策略迭代算法给出了修正及收敛估计。相似文献

5.

目标规划的特点和进展 总被引：4，自引：0，他引：4

宣家骥《运筹学杂志》1993,12(1):34-43

相似文献

6.

二层凸规划的基本性质 总被引：2，自引：0，他引：2

王先甲冯尚友《应用数学》1995,8(3):283-288

本文研究了一类抛述二层决策问题的二层数学规划模型，在一定条件下讨论了下层极值函数和上层复合目标函数的凸性和连续性，给出了二层决策问题优决策的存在条件。相似文献

7.

多属性决策中的目标规划 总被引：5，自引：0，他引：5

徐泽水张文献《应用数学与计算数学学报》2001,15(2):53-57

针对只有部分权重信息的对方案有偏好的多属性决策问题,本文给出了一种简单的目标规划模型,通过对该模型的求解却可得到决策方案的排序。最后给出了一个算例。相似文献

8.

部分可观察马尔可夫决策规划—首达目标模型

刘迪芬刘建庸《应用数学学报》1994,17(1):44-58

部分可观察马尔可夫决策规划──首达目标模型刘迪芬（湖南师范大学数学系，长沙４１００８１）刘建庸，刘克（中国科学院应用数学研究所，北京１０００８０）ＰＡＲＴＩＡＬＬＹＯＢＳＥＲＶＡＢＬＥＭＡＲＫＯＶＤＥＣＩＳＩＯＮＰＲＯＧＲＡＭＭＩＮＧ：ＦＩＲＳＴＰＡ... 相似文献

9.

一类连续时间平均马氏决策平稳最优策略的存在性

郑少慧《应用数学学报》1989,12(2):250-256

1.引言我们将在可测(确定性)马氏策略类Π_m~d(c)中讨论连续时间平均马氏决策(简称平均CTMDP):{S,(A(i),(?)(i),i∈S),q,r,(?)}.本文假设状态空间 S 为可列集;行动集 A(i)为一般点集,(A(i),(?)(i),i∈S)为可测空间,任给 a∈A(i),要求{a}∈(?)(i);q 是保守的转移速率族;报酬率 r 是一致有界的可测函数,即存在 M<∞,使|r(i,a)|≤M 对 i∈S,a∈A(i)成立.对π∈Π_m~d(c),i∈S,平均报酬函数(?)定义为: 相似文献

10.

线性二级决策的最优边界面算法

林国钧石明奎《运筹学杂志》1997,16(1):38-40

本文给出线性二级决策的一种非迭代算法，并给出一个算例。相似文献

11.

随机排序模型及求解方法 总被引：1，自引：0，他引：1

唐恒永《数学理论与应用》1999,(3)

本文介绍了随机排序模型,并对求解随机排序的基本方法作一简要综述。相似文献

12.

向量值马氏决策规划的线性加权解法

曾庆宁《应用数学学报》2001,24(4):630-632

类似［１－４］,折扣向量值马氏决策规划（ＤＶＭＤＰ）描述为：｛Ｓ,（Ａ（ｉ）,ｉ∈Ｓ）,ｑ,ｒ,Ｖβ｝,（１）其中Ｓ为可数状态集,Ａ（ｉ）是有限决策集,ｑ（ｊ｜ｉ,ａ）是转移概率,ｒ＝ｒ（ｉ,ｊ,ａ）＝（ｒ１（ｉ,ｊ,ａ）,ｒ２（ｉ,ｊ,ａ）,…,ｒｐ（ｉ,ｊ,ａ））是状态ｉ处使用决策ａ于下一步转移到状态ｊ时所获的ｐ维报酬向量,ｒ（ｉ,ｊ,ａ）对ｉ,ｊ,ａ一致有界,Ｖβ是β折扣目标．以Π表一般策略集,若　π　∈Π有Ｖβ（π）≤ Ｖβ（π*）,则称π* 为ＤＶＭＤＰ的“强有效策略”,Ｖβ（π*）为“… 相似文献

13.

报酬无界的连续时间折扣马氏决策规划 总被引：2，自引：0，他引：2

伍从斌张继红《应用概率统计》1997,13(1):1-10

本文讨论了报酬函数夫界，转移速率族一致有界，状态空间和行动集均可数的连续时间折扣马氏决策规划，文中引入了一为新的无界报酬函数，并在一新的马氏策略类中，证明了有界报酬下成立的所有结果。讨论了最优策略的结构，得到了该模型策略为最优的一个充要条件。相似文献

14.

具有模糊报酬的多目标马尔可夫决策规划

曾庆宁《模糊系统与数学》2001,15(3):82-85

给出一种模糊多目标马尔可夫决策规划的定义,即当报酬是模糊函数时的多目标马尔可夫决策规划,并解决求解这种规划的最优策略的方法以及这种多目标规划最优解的判决问题。相似文献

15.

双层规划的递阶交互决策有效化方法 总被引：2，自引：0，他引：2

刘红英《应用数学》2005,18(3):333-338

本文讨论了协调集上双层规划问题解的性质,所得结论表明上层将所得利益全部让给下层,或下层将所得利益全部让给上层.当决策者不满足此种有效化方式时,必须寻找体现递阶结构的有效化方法.本文给出了一种保持递阶结构的递阶交互决策有效化方法.该方法适用于下层有多个平行子问题的双层线性规划. 相似文献

16.

多属性决策的群排序方法研究 总被引：13，自引：1，他引：13

宋光兴邹平《运筹与管理》2002,11(3):27-31

在多属性群决策中，决策的决策结果有两种表现形式，即决策方案的优先序和决策方案的排序权向量。本研究基于决策方案优先序的群排序方法，提出了加权偏差平方和最小化方法及基于测度函数的0-1规划方法。相似文献

17.

约束折扣半马氏决策规划

胡光华张升《应用数学学报》1997,20(2):187-195

本文研究约束折扣半马氏决策规划问题，即在一折扣期望费用约束下，使折扣期望报酬达最大的约束最优问题，假设状态集可数，行动集为紧的非空Ｂｏｒｅｌ集，本文给出了ｐ－约束最优策略的充要条件，证明了在适当的假设条件下必存在ｐ－约束最优策略。相似文献

18.

求解群体多目标凸规划的一个交互规划算法 总被引：3，自引：0，他引：3

王晓敏《运筹学杂志》1996,15(1):37-46

本文给出一个由决策群体求解带有非线性约束的多目标凸规划问题的交互规划算法。此法通过决策群体与分析者之间以及各决策者之间的交互，最终得到群体满意的有效解，本文还证明了这一算法的收敛性定理。相似文献

19.

受约束的非平稳期望总报酬模型

郭先平《数理统计与应用概率》1996,11(4):326-331

本文考虑的是状态空间和行动空间均为一般集的受约束的平稳望总报酬模型，首先证明了随机策略类及最优策略类的紧性，然后，利用引入Ｌａｇｒａｎｇｅ乘子的技巧，在放弃通常的对期望费用的强约束假设下，用拓扑分析的方法，证明了约束最优策略的存在性，从而即推广了无约束的ＥｒｉｋｊＢａｌｄｅｒ（１９９２）的模型，又改进了ＬｉｎｌＳｅｎｎｏｔｔ的结果。相似文献

20.

多属性决策的组合赋权优化方法 总被引：6，自引：0，他引：6

江文奇《运筹与管理》2006,15(6):40-43

针对多属性决策中属性权重的确定问题，提出了一种主观权重与客观权重的集成方法。对每个决策属性，将各个决策者给出的主观权重和客观权重作为样本点，采用规划的方法来集成主观权重和客观权重，使决策结果更加可靠、可信。相似文献