首页 | 本学科首页   官方微博 | 高级检索  
     检索      

Polish空间上的折扣马氏过程量子化策略的渐近优化北大核心CSCD
引用本文:吴晓,孔荫莹,郭圳滨.Polish空间上的折扣马氏过程量子化策略的渐近优化北大核心CSCD[J].数学物理学报(A辑),2022(2):594-604.
作者姓名:吴晓  孔荫莹  郭圳滨
作者单位:1.肇庆学院数学与统计学院526061;2.广东财经大学智能财会管理学院510320;3.广发证券股份有限公司发展研究中心200120;
基金项目:国家自然科学基金(11961005);中山大学广东省计算科学重点实验室开放基金(2021021);广东省普通高校重点领域(新一代信息技术)基金(2020ZDZX3019);广州市科技计划项目(202102080420)。
摘    要:该文研究了Polish空间上、带折扣因子的连续时间马尔可夫决策过程(CTMDPs)的量子化平稳策略的渐近最优性问题.首先,建立了折扣最优方程(DOE)及其解的存在性和唯一性.其次,在适当的条件下证明了最优确定性平稳策略的存在性.此外,为了对行动空间进行离散化,构造了一列量子化策略,利用有限行动空间的策略来逼近一般(Polish)空间上的折扣CTMDPs最优平稳策略.最后,通过一个例子来说明该文的渐近逼近结果.

关 键 词:连续时间马尔可夫决策过程  依赖状态折扣因子  折扣准则  量子化平稳策略  渐近最优性
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号