Polish空间上的折扣马氏过程量子化策略的渐近优化北大核心CSCD |
| |
引用本文: | 吴晓,孔荫莹,郭圳滨.Polish空间上的折扣马氏过程量子化策略的渐近优化北大核心CSCD[J].数学物理学报(A辑),2022(2):594-604. |
| |
作者姓名: | 吴晓 孔荫莹 郭圳滨 |
| |
作者单位: | 1.肇庆学院数学与统计学院526061;2.广东财经大学智能财会管理学院510320;3.广发证券股份有限公司发展研究中心200120; |
| |
基金项目: | 国家自然科学基金(11961005);中山大学广东省计算科学重点实验室开放基金(2021021);广东省普通高校重点领域(新一代信息技术)基金(2020ZDZX3019);广州市科技计划项目(202102080420)。 |
| |
摘 要: | 该文研究了Polish空间上、带折扣因子的连续时间马尔可夫决策过程(CTMDPs)的量子化平稳策略的渐近最优性问题.首先,建立了折扣最优方程(DOE)及其解的存在性和唯一性.其次,在适当的条件下证明了最优确定性平稳策略的存在性.此外,为了对行动空间进行离散化,构造了一列量子化策略,利用有限行动空间的策略来逼近一般(Polish)空间上的折扣CTMDPs最优平稳策略.最后,通过一个例子来说明该文的渐近逼近结果.
|
关 键 词: | 连续时间马尔可夫决策过程 依赖状态折扣因子 折扣准则 量子化平稳策略 渐近最优性 |
本文献已被 维普 等数据库收录! |
|