期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

黄永辉郭先平《数学学报》2010,53(3):503-514

本文考虑可数状态非负费用的折扣半马氏决策过程.首先在给定半马氏决策核和策略下构造一个连续时间半马氏决策过程,然后用最小非负解方法证明值函数满足最优方程和存在ε-最优平稳策略,并进一步给出最优策略的存在性条件及其一些性质.最后,给出了值迭代算法和一个数值算例. 相似文献

2.

随机冲击下的折扣半马氏决策规划 总被引：1，自引：0，他引：1

胡奇英《应用数学学报》1994,17(4):522-533

随机冲击下的折扣半马氏决策规划胡奇英（西安电子科技大学七系，西安７１００７１）ＤＩＳＣＯＵＮＴＥＤＳＥＭＩ－ＭＡＲＫＯＶＤＥＣＩＳＩＯＮＰＲＯＧＲＡＭＭＩＮＧＵＮＤＥＲＳＴＯＣＨＡＳＴＩＣＳＨＯＣＫＳ￥ＨＵＱＩＹＩＮＧ（ＸｉｄｉａｎＵｎｉｖｅｒｓｉｔ... 相似文献

3.

随机终止的非平稳折扣半马氏决策规划 总被引：1，自引：1，他引：0

胡奇英《应用数学学报》1993,16(4):566-570

半马氏决策规划(SMDP)提出至今讨论了时齐模型{S,A,,,p,T V}和非时齐模型{＆:A。,rt。,P。;T,。,Vn},后者的元素中至少有一个与决策周期数。有关.在实际问题中还有元素全部或部分与时间因子有关的模型,我们称之为非平稳模型.SMDP的目标函数也仅讨论决策周期数有限和无限这两种情形,但有时还要考虑时间段K到上系统的最优控制.这里T为系统的终止时间,可是随机的.我们称这种问题为随机终止的。本文讨论随机终止的非平稳折扣SMDP. 相似文献

4.

离散型冲击折扣半马氏决策过程

胡奇英《数学研究及应用》1995,15(1):119-122

本文讨论离散型冲击折扣半马氏决策过程，在建立模型后，我们将它化成了一个等价的离散时间马氏决策过程．相似文献

5.

报酬无界的连续时间折扣马氏决策规划 总被引：2，自引：0，他引：2

伍从斌张继红《应用概率统计》1997,13(1):1-10

本文讨论了报酬函数夫界，转移速率族一致有界，状态空间和行动集均可数的连续时间折扣马氏决策规划，文中引入了一为新的无界报酬函数，并在一新的马氏策略类中，证明了有界报酬下成立的所有结果。讨论了最优策略的结构，得到了该模型策略为最优的一个充要条件。相似文献

6.

一类连续时间平均马氏决策平稳最优策略的存在性

郑少慧《应用数学学报》1989,12(2):250-256

1.引言我们将在可测(确定性)马氏策略类Π_m~d(c)中讨论连续时间平均马氏决策(简称平均CTMDP):{S,(A(i),(?)(i),i∈S),q,r,(?)}.本文假设状态空间 S 为可列集;行动集 A(i)为一般点集,(A(i),(?)(i),i∈S)为可测空间,任给 a∈A(i),要求{a}∈(?)(i);q 是保守的转移速率族;报酬率 r 是一致有界的可测函数,即存在 M<∞,使|r(i,a)|≤M 对 i∈S,a∈A(i)成立.对π∈Π_m~d(c),i∈S,平均报酬函数(?)定义为: 相似文献

7.

无界报酬折扣马氏决策规划中的逐次逼近法

胡奇英《数理统计与应用概率》1995,10(2):31-37

本文讨论报酬为〔１〕中无界型和折扣马氏决策规划中的逐次逼近法，包括通常的逐次逼近法和有有限状态逼近可数状态问题中的逐次逼近法，讨论了两者的收敛性和后者界的估计。相似文献

8.

一般化马氏决策规划的现状与展望 总被引：3，自引：0，他引：3

胡奇英《运筹学杂志》1992,11(2):21-29

相似文献

9.

具有摄动的两类马氏决策规则

刘建庸王军明《应用数学学报》2001,24(2):302-305

在状态空间和行动集均有限的条件下,[1-5]讨论了时间离散的,平稳的马氏决策规划的摄动模型,其中,[1,3,4]讨论了单摄动模型,[5]讨论了具有加权准则的摄动模型,[6,7]讨论了时间离散的,平稳的马氏报酬过程的摄动模型,但[6,7]仅考虑了摄动对最优值的影响,而没有考虑摄动对最优策略的影响,本文将讨论具有摄动的非平衡平均马氏均策规划和连续时间折扣马氏决策规划。相似文献

10.

报酬函数及转移速率族均非一致有界的连续时间折扣马氏决策规划

伍从斌《应用数学学报》1997,20(2):196-208

本文首次在报酬函数及转移速率族均非一致有界的条件下，对可数状态空间，可地动集的连续时间折扣马氏决策规划进行研究，文中引入一类新的无界报酬函数，在一类新的马氏策略中，讨论了最优策略的存在性及春结构，除证明了在有界报酬和一致有界转移速率族下成立的主要结果外，本文还得到一些重要结论。相似文献

11.

具有平均费用的非平稳Markov决策过程

魏力仁《经济数学》1995,(1)

本文研究了在一般状态空间具有平均费用的非平稳Ｍａｒｋｏｖ决策过程，把在平稳情形用补充的折扣模型的最优方程来建立平均费用的最优方程的结果，推广到非平稳的情形．利用这个结果证明了最优策略的存在性．相似文献

12.

基于制造商资金有约束的替代产品的最优生产决策 总被引：1，自引：1，他引：0

魏杰涂奉生魏灿生孙俊清《系统科学与数学》2009,29(7):902-913

考虑一个单周期的生产决策模型,在该模型中有一个制造商生产两种可替代的产品.面对随机的市场需求,制造商要在需求到来之前制定出两种产品的生产决策来最大化自己的期望利润.在制造商的资金有、无约束两种情形下,证明了制造商的收益函数的期望是关于两种产品生产数量的凹函数,探讨了资金的约束以及产品的替代给制造商的生产决策所带来的影响,给出了最优生产数量的若干性质.另外,针对需求分布为均匀分布的特殊情形给出了制造商最优生产决策的简单表达形式. 相似文献

13.

带随机过程的随机规划问题最优解集的过程特性与稳定性 总被引：1，自引：0，他引：1

陈志平高勇《应用数学学报》1997,20(3):466-472

本文证明了带随机过程的随机规划问题最优解集做为集值随机过程的可测性、可测最优解选择过程的存在性。研究了最优解集过程的平稳性、马氏性以及最优值过程的鞅性和最优解集过程的集值鞅性。最后，讨论了在有限维分布意义下最优解集过程对所含随机过程参数的连续性以及最优值过程的稳定性。相似文献

14.

连锁中心店存贮决策模拟系统研究

胡平徐士钰《运筹与管理》1997,6(2):50-54

针对连锁店中心在约束条件下，如何确定各种商品合理存货水平的问题，本文在建立动态规划模型并求解的基础上，利用计算机对市场需求量的仿真，计算选择连锁中心店存贮量最佳决策方案。相似文献

15.

Bandit过程及其应用

王熙逵《经济数学》2001,18(4):39-48

本文有两个目的.第一,对Bandit过程这一学科的主要概念及结果作一次系统性的介绍.第二,综述Bandit过程的模型,计算与应用的最新发展.本文刻画了Bandit过程与马氏决策规划的关系.通过考虑理论上或方法论上的局限,实际中或计算上的困难,以及应用中的限制.我们讨论一些重要的争端和公开的问题. 相似文献

16.

线性等式约束下多元线性模型的简单投影预测

袁权龙孙明伟向正会郭晓春《经济数学》2009,26(3):95-98

研究线性等式约束下一般生长曲线模型的简单投影预测θCSPP关于协方差阵的稳健性,得到θCSPP为条件线性可预测变量的条件最优线性无偏预测的充要条件,推广Bolfarine H等的有关结果。相似文献

17.

Dynamic routing to heterogeneous collections of unreliable servers

K. D. Glazebrook C. Kirkbride 《Queueing Systems》2007,55(1):9-25

We argue the importance of problems concerning the dynamic routing of tasks for service in environments where the servers have diverse characteristics and are subject to breakdown. We propose a general model in which both service times and repair times at each machine are i.i.d.with some general distribution. Routing decisions take account of queue lengths, machine states (up or down), the elapsed processing times of jobs in service and the times to date of any machine repairs in progress. We develop an approach to machine calibration which yields a machine index which is a function of all of the preceding information. The heuristic which routes all tasks to the machine of current smallest index performs outstandingly well. The approach of the paper is flexible and is capable of yielding strongly performing routing policies for a range of variants of the basic model. These include cases where job processing is lost at each breakdown and where the machine state may be only partially observed. AMS Subject Classifications 49L20, 90B22 相似文献

18.

一类带投资收益风险模型的罚金折现期望

徐俊科刘再明宋华《经济数学》2007,24(3):234-238

本文对经典风险模型考虑有投资收益的情况.其投资收益率用泊松过程加布朗运动来描述.得到了罚金折现期望函数满足的方程.并对某些特殊情况给出了进一步的讨论. 相似文献