Polish空间上的折扣马氏过程量子化策略的渐近优化北大核心CSCD 期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

Polish空间上的折扣马氏过程量子化策略的渐近优化北大核心CSCD

引用本文：	吴晓,孔荫莹,郭圳滨.Polish空间上的折扣马氏过程量子化策略的渐近优化北大核心CSCD[J].数学物理学报(A辑),2022(2):594-604.

作者姓名：	吴晓孔荫莹郭圳滨

作者单位：	1.肇庆学院数学与统计学院526061;2.广东财经大学智能财会管理学院510320;3.广发证券股份有限公司发展研究中心200120;

基金项目：	国家自然科学基金(11961005)；中山大学广东省计算科学重点实验室开放基金(2021021)；广东省普通高校重点领域(新一代信息技术)基金(2020ZDZX3019)；广州市科技计划项目(202102080420)。

摘要：	该文研究了Polish空间上、带折扣因子的连续时间马尔可夫决策过程(CTMDPs)的量子化平稳策略的渐近最优性问题.首先,建立了折扣最优方程(DOE)及其解的存在性和唯一性.其次,在适当的条件下证明了最优确定性平稳策略的存在性.此外,为了对行动空间进行离散化,构造了一列量子化策略,利用有限行动空间的策略来逼近一般(Polish)空间上的折扣CTMDPs最优平稳策略.最后,通过一个例子来说明该文的渐近逼近结果.
关键词：	连续时间马尔可夫决策过程依赖状态折扣因子折扣准则量子化平稳策略渐近最优性
本文献已被维普等数据库收录！