期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

郭先平《系统科学与数学》1999,19(4):439-446

本文考虑可数状态空间非平稳马尔可夫决策过程（ＭＤＰ）的平均目标．首先,我们指出并改正了Ｐａｒｋ,ｅｔ,ａｌ［１］和Ａｌｄｅｎ,ｅｔａｌ［２］的错误,并在弱于Ｐａｒｋ,ｅｔａｌ［１］的条件下,借助于新建立的最优方程,证明了最优平均值的收敛性和平均最优马氏策略的存在性．其次,给出了ε（＞０）－平均最优马氏策略的滚动式算法．相似文献

2.

Borel状态空间非平稳MDP的平均方差准则

郭先平《数学学报》2001,44(2):333-342

本文考虑具有Ｂｏｒｅｌ状态空间和行动空间非平稳ＭＤＰ的平均方差准则．首先,在遍历条件下,利用最优方程,证明了关于平均期望目标最优马氏策略的存在性．然后,通过构造新的模型,利用马氏过程的理论,进一步证明了在关于平均期望目标是最优的一类马氏策略中,存在一个马氏策略使得平均方差达到最小．作为本文的特例还得到了ＤｙｎｋｉｎＥ．Ｂ．和ＹｕｓｈｋｅｖｉｃｈＡ．Ａ．及ＫｕｒａｎｏＭ．等中的主要结果．相似文献

3.

非平稳MDP的期望平均准则

郭先平侯振挺《系统科学与数学》1999,19(1):123-128

本文考虑的是非平稳MDP的期望平均准则,在弱遍历条件下,用概率及鞅论的方法证明了。∈（0）－最优马氏策略的存在性,作为特例,较好地解决了Feinberg和Park在1994年提及的开问题．相似文献

4.

不完全信息的非平稳MDP平均模型

郭先平《数理统计与应用概率》1995,10(2):14-21

本文考虑的是可数状态空间不完全信息的非平衡ＭＤＰ平均模型，借助于模型的转化，建立了不完全信息的非平衡ＭＤＰ平均模型的最优方程，并进一步给出了最优方程的解及ε（〉，０）－最优策略存在的充分条件。相似文献

5.

可数状态MDP的平均模型 总被引：1，自引：0，他引：1

郭先平《数学年刊A辑(中文版)》1996,(5)

本文考虑可数状态空间任意行动空间MDP的平均模型，分析了四个平均报酬准则，在通常的遍历性条件下，用鞅论的方法证明了其最优报酬值的一致性和最优策略的存在性，从而较好地解决了Feinberg和Park[1]再次提及的Open问题．通过导入相应于Feinberg和Park[1]的非循环条件，用概率分析的方法证明了一致最优（f，B）-生成策略的存在性，推广了Feinberg和Park（1994）的主要结果。相似文献

6.

非平稳MDP平均模型── 一致最优(G,B)-生成策略的存在性

郭先平《数学学报》2000,43(2):269-274

本文考虑的是可数状态空间任意行动空间非平稳ＭＤＰ平均模型,借鉴于ＦｅｉｎｂｅｒｇＥ．Ａ（１９９４）的思想,提出了比马氏策略和ＦｅｉｎｂｅｒｇＥ．Ａ的（ｆ,Ｂ）－生成策略和更为广泛的（Ｇ,Ｂ）－生成策略的概念,在弱遍历条件下,用概率分析的方法,证明了一致最优（Ｇ,Ｂ）－生成策略的存在性．从而将ＦｅｉｎｂｅｒｇＥ．Ａ．（１９９４）的主要结果推广到非平衡可数状态空间情形．相似文献

7.

非平稳MDP--平均样本轨道最优

郭先平《数学物理学报(A辑)》2000,20(1):31-35

作者考虑的是任意状态空间,任意行动空间非平稳ＭＤＰ的平均样本轨道目标。在弱遍历条件下用鞅的极限理论,证明了最优马氏策略的存在性,推广了Ａ．Ａｒａｐｏｓｔａｔｈｉｓ,Ｖ．Ｂｏｒｋａｒ,Ｅ．Ｆ．Ｇａｕｃｈｅｒａｎｄ,Ｍ．Ｇｈｏｓｈ,Ｓ．Ｍａｒｃｕｓ（１９９３）的主要结果。相似文献

8.

一类连续时间平均马氏决策平稳最优策略的存在性

郑少慧《应用数学学报》1989,12(2):250-256

1.引言我们将在可测(确定性)马氏策略类Π_m~d(c)中讨论连续时间平均马氏决策(简称平均CTMDP):{S,(A(i),(?)(i),i∈S),q,r,(?)}.本文假设状态空间 S 为可列集;行动集 A(i)为一般点集,(A(i),(?)(i),i∈S)为可测空间,任给 a∈A(i),要求{a}∈(?)(i);q 是保守的转移速率族;报酬率 r 是一致有界的可测函数,即存在 M<∞,使|r(i,a)|≤M 对 i∈S,a∈A(i)成立.对π∈Π_m~d(c),i∈S,平均报酬函数(?)定义为: 相似文献

9.

非一致有界费用MDP的强平均最优性条件

肖晴初谭杭生《运筹学学报》2010,14(1):95-105

研究可数状态空间任意行动空间非一致性有界费用马氏决策过程(MDP)的强平均最优,给出了使得每个常用的平均最优策略也是强平均最优的条件,并实质性的推广了Cavazos-Cadena和Fernandez-Gaucheran(Math. Meth. Oper. Res., 1996, 43: 281-300)的主要结果. 相似文献

10.

受约束的非平稳期望总报酬模型

郭先平《数理统计与应用概率》1996,11(4):326-331

本文考虑的是状态空间和行动空间均为一般集的受约束的平稳望总报酬模型，首先证明了随机策略类及最优策略类的紧性，然后，利用引入Ｌａｇｒａｎｇｅ乘子的技巧，在放弃通常的对期望费用的强约束假设下，用拓扑分析的方法，证明了约束最优策略的存在性，从而即推广了无约束的ＥｒｉｋｊＢａｌｄｅｒ（１９９２）的模型，又改进了ＬｉｎｌＳｅｎｎｏｔｔ的结果。相似文献

11.

基于可信性理论的均值-熵-偏度投资组合模型及其算法求解 总被引：2，自引：0，他引：2

下载免费PDF全文

王灿杰邓雪《运筹与管理》2019,28(2):154-159

本文考虑到证券市场的投资者往往面临着随机和模糊两种不确定性的情形,在模糊随机环境下把证券的收益率视作三角模糊变量,在可信性理论基础上建立了带融资约束条件的均值-熵-偏度三目标投资组合决策模型,拓展了基于可信性理论的投资组合决策模型的研究内容,同时通过对约束条件处理方法,外部档案维护方法等关键算子的改良,提出了一种新的约束多目标粒子群算法。本文运用该算法对模型进行求解,把得到的最优解与传统的多目标粒子群算法得到的最优解进行对比,结果表明新算法得到的最优解的质量会显著地优于传统的多目标粒子群算法的最优解,从而验证了算法的有效性和准确性。该算法可以在三维空间中得到一个分布性和逼近性较好的Pareto最优曲面,满足投资者对不同目标的差异需求,为投资者提供合理的投资组合决策方案。相似文献

12.

Policy Iteration for Average Cost Markov Control Processes on Borel Spaces

Onésimo Hernández-Lerma Jean B. Lasserre 《Acta Appl Math》1997,47(2):125-154

This paper studies the policy iteration algorithm (PIA) for average cost Markov control processes on Borel spaces. Two classes of MCPs are considered. One of them allows some restricted-growth unbounded cost functions and compact control constraint sets; the other one requires strictly unbounded costs and the control constraint sets may be non-compact. For each of these classes, the PIA yields, under suitable assumptions, the optimal (minimum) cost, an optimal stationary control policy, and a solution to the average cost optimality equation. 相似文献

13.

物流配送装载率分析与四阶段算法研究 总被引：1，自引：0，他引：1

下载免费PDF全文

饶卫振李美燕寻楠王炳成于灏侯艳辉《运筹与管理》2018,27(12):64-72

在城市物流配送中,租用车型的选择与车辆平均装载率具有密切的关系。然而,在带能力约束的车辆路径问题(Capacitated Vehicle Routing Problem, CVRP)中, 假设配送车辆装载量为事先已知。在实际物流配送中, 很多配送车辆为租用, 因此需要确定租用的车型大小。本文基于CVRP问题,假设配送车辆载量Q为变量,以车辆平均装载率为优化目标构建了数学模型. 通过数学推导证明了,派送车辆的平均装载率ρ的理论区间为(50%, 100%]。分析得出结论:当顾客需求数据中需求数据大于且接近0.5倍载量Q的越多,车辆平均装载率越低。为了验证分析结论的正确性, 分别设计一个求解CVRP问题的多阶段算法和具有大需求量的CVRP问题算例. 通过求解算例表明:本文理论分析的正确性, 其中四阶段算法的求解结果与当前已知最优解平均偏差仅为0.92%,达到优秀算法水平。相似文献

14.

中止规则的平均延迟时间及其应用 总被引：1，自引：1，他引：0

范永亮王玉华《数理统计与管理》1996,15(4):34-38

本文以平均延迟时间为度量，对适用于连续抽样方案的四种中止规则，即规则［Ｓ］，［Ｒ］，［Ｎ，ｃ］及［Ｒ，ｄ］的中止“速度”进行了比较。结果表明：［Ｒ］优于［Ｓ］，而［Ｎ，ｃ］与［Ｒ，ｄ］均优于［Ｒ］。这些结论及方法可被用来适当地选择中止规则，以提高连续型生产的质量控制水平相似文献

15.

SARIMA模型在新疆手足口病发病率预测中的应用

张利萍唐丹丹郑彦玲王凯张学良《数学的实践与认识》2017,(9):115-122

建立新疆手足口病发病率的季节求和自回归-移动平均模型(Seasonal AutoregressiveIntegrated Moving Average Model,SARIMA),探讨采用SARIMA模型预测手足口病发病趋势的可行性和实用性.利用R统计软件基于新疆2006-2012手足口病月发病率数据建立SARIMA模型,拟合2012年手足口病各月发病率数据,并预测了2013年手足口病月发病率.经过序列平稳化、模型识别以及模型诊断,SARIMA(1,0,1)(0,1,0)_(12)能较好地拟合既往时间段的发病率,且预测值符合新疆手足口病实际发病率的波动趋势.SARIMA模型能够有效地预测手足口病发病趋势,对预警、防控具有积极指导意义. 相似文献

16.

货运列车编组调度问题的模型与算法研究

刘盾赵军韩冬陈滋利《数学的实践与认识》2009,39(16)

从双向编组站运输生产实际情况出发,以最大化车站发出车数和最小化车辆在站平均停留时间(中时)为目标,综合考虑解体、编组调机能力限制、到发列车车流接续、车流在站停留时间约束的影响,建立了车站货运列车编组调度问题的多目标非线性混合整数规划模型,结合该优化模型难以求解的特点,将编组调度问题分解为配流、待解车列解体和待编车列编组三个子问题,进而设计了求解该问题的分层启发式算法,对正常和特殊运输组织条件下的列车编组调度问题进行了求解. 相似文献

17.

Nonlinear Programming Algorithm and Its Convergence Rate Analysis

王国富李学全《数学季刊》1998,13(1):8-13

相似文献