共查询到10条相似文献,搜索用时 15 毫秒
1.
2.
3.
4.
5.
本文考虑连续时间Markov决策过程折扣模型的均值-方差优化问题.假设状态空间和行动空间均为Polish空间,转移率和报酬率函数均无界.本文的优化目标是在折扣最优平稳策略类里,选取相应方差最小的策略.本文致力于寻找Polish空间下Markov决策过程均值-方差最优策略存在的条件.利用首次进入分解方法,本文证明均值-方差优化问题可以转化为"等价"的期望折扣优化问题,进而得到关于均值-方差优化问题的"最优方程"和均值-方差最优策略的存在性以及它相应的特征.最后,本文给出若干例子说明折扣最优策略的不唯一性和均值-方差最优策略的存在性. 相似文献
6.
7.
以随机分析的知识和最优控制理论为基础,讨论了一类带停时的奇异型随机控制的折扣费用模型,在原模型的状态过程的基础上添加了漂移因子和扩散因子,并在λ<δα的情况下讨论了该问题相应的变分方程的解,给出了此随机控制问题的最优策略,即最优控制和最优停时,并且证明了变分方程的解即为最优费用函数. 相似文献
8.
9.
该文分析了折扣准则下基于多数量需求拍卖机制的多阶段存贮问题,运用动态规划方法,在有限阶段对该问题研究了每个时期应该出售的最优产品数量、最优分配方案和最优订购策略,提出了运用修正的多需求二级价格拍卖模型来实现最优分配,并对无限阶段下的动态存贮/分配问题进行了讨论. 相似文献