共查询到20条相似文献,搜索用时 31 毫秒
1.
郭先平 《应用数学与计算数学学报》1995,9(2):53-59
本文考虑的是Hinderer提出的状态空间和行动空间均业般集的非平稳MDP平均模型,利用扩大状态空间的方法,建立了此模型的最优方程,并给出了最优方程有解及蜞 最优策略存在的条件,从最优方程出发,用概率的方法证明了最优策略的存在性,最后还提供了此模型的值迭代算法及其收敛性证明,从而推广了Smith。L.Lassere,B「3」及Larma^「6」等的主要结果。 相似文献
2.
本文考虑具有 Borel状态空间和行动空间非平稳 MDP的平均方差准则.首先,在遍历条件下,利用最优方程,证明了关于平均期望目标最优马氏策略的存在性.然后,通过构造新的模型,利用马氏过程的理论,进一步证明了在关于平均期望目标是最优的一类马氏策略中,存在一个马氏策略使得平均方差达到最小.作为本文的特例还得到了 Dynkin E. B.和 Yushkevich A. A.及 Kurano M.等中的主要结果. 相似文献
3.
本文研究了在一般状态空间具有平均费用的非平稳Markov决策过程,把在平稳情形用补充的折扣模型的最优方程来建立平均费用的最优方程的结果,推广到非平稳的情形.利用这个结果证明了最优策略的存在性. 相似文献
4.
本文考虑可数状态空间非平稳马尔可夫决策过程(MDP)的平均目标.首先,我们指出并改正了Park,et,al[1]和Alden,etal[2]的错误,并在弱于Park,etal[1]的条件下,借助于新建立的最优方程,证明了最优平均值的收敛性和平均最优马氏策略的存在性.其次,给出了ε(>0)-平均最优马氏策略的滚动式算法. 相似文献
5.
郭先平 《数学物理学报(A辑)》2000,20(1):31-35
作者考虑的是任意状态空间,任意行动空间非平稳MDP的平均样本轨道目标。在弱遍历条件下用鞅的极限理论,证明了最优马氏策略的存在性,推广了A.Arapostathis,V.Borkar,E.F.Gaucherand,M.Ghosh,S.Marcus(1993)的主要结果。 相似文献
6.
本文考虑的是可数状态空间任意行动空间非平稳MDP平均模型,借鉴于Feinberg E. A(1994)的思想,提出了比马氏策略和 Feinberg E. A的(f,B)-生成策略和更为广泛的(G,B)-生成策略的概念,在弱遍历条件下,用概率分析的方法,证明了一致最优(G,B)-生成策略的存在性.从而将 Feinberg E. A.(1994)的主要结果推广到非平衡可数状态空间情形. 相似文献
7.
本文讨论了可数状态空间、可数决策空间、次随机转移率族、有界报酬函数的马氏决策规划(MDP)的折扣模型,给出了一个非ε-最优策略的检验准则. 相似文献
8.
9.
《数学年刊A辑(中文版)》2000,(2)
非牛顿流的Oldroyd 模型的整体解 P. L. Lions N. Masmoudi 考虑由不可压的Navier-Stokes方程和迁移方程之间强耦合所组成的非牛顿流的Oldroyd模型,证明了对于一般的初始条件存在的整体弱解,存在性的证明依赖于证明解的紧致性的时间传播. 非线性弹性板的单向特征值问题:通过伪单调算子的近似法 L. Gratie 考虑在部分边界上施压和放在平的刚性支撑上的Von Karman板的弯曲模型的一类变分不等式.D.Goeleven, V. H. Nguyen和M.Thera的存在性… 相似文献
10.
11.
12.
求解二阶椭圆方程的区域分解方法──有限差分逼近储德林,胡显承(清华大学应用数学系)THEDOMAINDECOMPOSITIONMETHODFORSOLVINGSECONDORDERELLIPTICPARTIALDIFFERENTIALEQUATION... 相似文献
13.
本文讨论高阶MDWW方程的Lax对,在位势与特征函数之间的约束条件下,Lax系统被非线性化成为有限维Liouville完全可积系统.并且获得了高阶MDWW方程解的对合表示. 相似文献
14.
哮喘模型的谱方法与逆谱方法 总被引:4,自引:0,他引:4
哮喘模型的谱方法与逆谱方法鲁百年(陕西师范大学数学系)SPECTRALANDPSEUDOSPECTRALAPPROXIMATIONSFORTHEMODELOFWHEEZES¥LuBai-mian(DepartmentofMathematics,Sha... 相似文献
15.
对平均准则的讨论一直是马氏决策过程研究的热点之一,近几年已从最优方程推广到最优不等式。本文系统地了介绍最优不等式的提出及其发展思路,目前已取得的成果等,同时也指出了有待于进一步研究的问题。 相似文献
16.
Gu Chaohao 《数学年刊B辑(英文版)》1994,15(4):385-400
COMPLETEEXTREMALSURFACESOFMIXEDTYPEIN3-DIMENSIONALMINKOWSKISPACE¥GUCHAOHAO(InstituteofMathematics,FudanUniversity,Shanghai200... 相似文献
17.
椭圆离散方程并行预条件子局部构造算法Ⅱ:非自共轭型方程孙家昶,曹建文(中国科学院软件研究所并行软件研究开发中心)ACLASSOFLOCALGREEN-LIKEPARALLELPRECONDITIONERALGORITHMFORELLIPTICDISC... 相似文献
18.
Glowinski区域分解算法的收敛性方程──Stokes方程储德林,胡显承(清华大学应用数学系,北京100084)THECONVERGENCEOFGLOWINSKI'SDOMAINDECOMPOSITIONALGORITHM──STOKESEQUA... 相似文献
19.
在状态空间和行动集均有限的条件下,[1-5]讨论了时间离散的,平稳的马氏决策规划的摄动模型,其中,[1,3,4]讨论了单摄动模型,[5]讨论了具有加权准则的摄动模型,[6,7]讨论了时间离散的,平稳的马氏报酬过程的摄动模型,但[6,7]仅考虑了摄动对最优值的影响,而没有考虑摄动对最优策略的影响,本文将讨论具有摄动的非平衡平均马氏均策规划和连续时间折扣马氏决策规划。 相似文献
20.
本文研究了具有最大增长方向的面积平均P叶函数的渐近性质和最大增长方向的唯一性,推广并改进了I.M.Milin的一个结果。 相似文献