共查询到10条相似文献,搜索用时 15 毫秒
1.
本文考虑具有 Borel状态空间和行动空间非平稳 MDP的平均方差准则.首先,在遍历条件下,利用最优方程,证明了关于平均期望目标最优马氏策略的存在性.然后,通过构造新的模型,利用马氏过程的理论,进一步证明了在关于平均期望目标是最优的一类马氏策略中,存在一个马氏策略使得平均方差达到最小.作为本文的特例还得到了 Dynkin E. B.和 Yushkevich A. A.及 Kurano M.等中的主要结果. 相似文献
2.
本文考虑的是非平稳MDP的期望平均准则,在弱遍历条件下,用概率及鞅论的方法证明了。∈(0)-最优马氏策略的存在性,作为特例,较好地解决了Feinberg和Park在1994年提及的开问题. 相似文献
3.
关于一类自由作业机器排序问题 总被引:1,自引:0,他引:1
文章研究文[1]中提出的加工时间依赖于机器的自由作业排序问题。M.Doror在[1]中提出了一个算法(算法3.4)。最近,A.J.Vakharia、B.Catay[2]及项思明、唐国春[3]均指出M.Doror的算法不是最优的。项思明和唐国春提出对这类问题在机器连续加工情形下的一种求解方法,即将排序问题化成指派问题。本文对这种解法作了简化,并回答文[3]中提出的几个问题。 相似文献
4.
张建方.关于“平均冒尖性”及其它,数理统计与管理,1997,16(1),39~44.本文针对李久坤的文章[1]提出质疑和批评,阐述“平均冒尖性”作为正交设计与均匀设计比较准则的科学性,并指出[1]在计算“平均冒尖性”时所犯的错误 相似文献
5.
本文对可数状态集、非空决策集、报酬无界的平均准则马氏决策过程,提出了一组新的条件,在此条件下存在(ε)最优平稳策略,且当最优不等式中的和有定义时最优不等式也成立。 相似文献
6.
徐光辉[1,第六章§1]讨论了成批服务系统M/M[r]/1,并在limPj(t)=Pj>0假设下,求出马氏过程N(t)的平稳分布{Pi},李文琦等在[2,P1688]指出[1.P218—219]给出的关于limPj(t)=Pj>0的证明是不准确的,并利用Foster判别法给出N(t)的遍历性的严格证明。本文指出N(t)的遍历性可由Pij(△t)的表达式及Takacs[4,P94定理2]推出。 相似文献
7.
本文改进了S.T.Yau(文[1])中关于单位球面中具有平行平均曲率向量场的子流形的一个结果。然而从截面曲率这一角度出发,给出了空间形式R^n+p(c)(n>1,p>1)中具有平行平均曲率向量场的可定向闭子流形M^n的有关结果和积分不等式。 相似文献
8.
一个仓库多个销售点的存货策略 总被引:1,自引:0,他引:1
本文介绍由Robin Roundy[1]提出的“一个仓库多个销售点存货系统”的一种近似最优存货策略-q-最优整数比率策略,它具有94%以上的效率.文中通过实例介绍这一策略的具体算法及其所具效率. 相似文献
9.
本文考虑的是转移速率族任意且费用率函数可能无界的连续时间马尔可夫决策过程的折扣模型.放弃了传统的要求相应于每个策略的 Q -过程唯一等条件,而首次考虑相应每个策略的 Q -过程不一定唯一, 转移速率族也不一定保守, 费用率函数可能无界, 且允许行动空间非空任意的情形. 本文首次用"α-折扣费用最优不等式"更新了传统的α-折扣费用最优方程,并用"最优不等式"和新的方法,不仅证明了传统的主要结果即最优平稳策略的存在性, 而且还进一步探讨了( ∈>0 )-最优平稳策略,具有单调性质的最优平稳策略, 以及(∈≥0) -最优决策过程的存在性, 得到了一些有意义的新结果. 最后, 提供了一个迁移率受控的生灭系统例子, 它满足本文的所有条件, 而传统的假设(见文献[1-14])均不成立. 相似文献
10.
半参数回归模型非参数分量L1模估计的最优收敛速度 总被引:1,自引:1,他引:0
对半参数回归模型,采用分段多项式逼近非参数函数,构造了参数与非参数分量L1模糊估计,并获得了非参数分量L1模估计的最优估计收敛速度为Op(n^-m+r/[2(m+r)+1])。 相似文献