首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种状态集结因子化SARSA(λ)强化学习算法
引用本文:李春贵,刘永信.一种状态集结因子化SARSA(λ)强化学习算法[J].内蒙古大学学报(自然科学版),2001,32(6):675-678.
作者姓名:李春贵  刘永信
作者单位:北京理工大学自动控制系
摘    要:提出了一种自适应状态集结因子化SARSA(λ)强化学习算法,在学习的过程中利用Bellman余留数进行状态集结,通过集结,大大减少了状态空间搜索与计算的复杂度,有利于求解大状态空间的MDPs问题,而且,本算法不需要有关状态特征的先验知识,有很好的通用性。

关 键 词:强化学习  状态集结  MDPs  Q(λ)学习  SARSA(λ)学习  机器学习  因子化  Bellman余留数
文章编号:1000-1638(2001)06-0675-04
修稿时间:2001年8月20日
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号