一种状态集结因子化SARSA(λ)强化学习算法 |
| |
引用本文: | 李春贵,刘永信.一种状态集结因子化SARSA(λ)强化学习算法[J].内蒙古大学学报(自然科学版),2001,32(6):675-678. |
| |
作者姓名: | 李春贵 刘永信 |
| |
作者单位: | 北京理工大学自动控制系 |
| |
摘 要: | 提出了一种自适应状态集结因子化SARSA(λ)强化学习算法,在学习的过程中利用Bellman余留数进行状态集结,通过集结,大大减少了状态空间搜索与计算的复杂度,有利于求解大状态空间的MDPs问题,而且,本算法不需要有关状态特征的先验知识,有很好的通用性。
|
关 键 词: | 强化学习 状态集结 MDPs Q(λ)学习 SARSA(λ)学习 机器学习 因子化 Bellman余留数 |
文章编号: | 1000-1638(2001)06-0675-04 |
修稿时间: | 2001年8月20日 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|