一种状态集结因子化SARSA（λ）强化学习算法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

一种状态集结因子化SARSA（λ）强化学习算法

引用本文：	李春贵,刘永信.一种状态集结因子化SARSA（λ）强化学习算法[J].内蒙古大学学报(自然科学版),2001,32(6):675-678.

作者姓名：	李春贵刘永信

作者单位：	北京理工大学自动控制系

摘要：	提出了一种自适应状态集结因子化SARSA（λ）强化学习算法，在学习的过程中利用Bellman余留数进行状态集结，通过集结，大大减少了状态空间搜索与计算的复杂度，有利于求解大状态空间的MDPs问题，而且，本算法不需要有关状态特征的先验知识，有很好的通用性。
关键词：	强化学习状态集结 MDPs Q（λ）学习 SARSA（λ）学习机器学习因子化 Bellman余留数
文章编号：	1000-1638(2001)06-0675-04
修稿时间：	2001年8月20日
本文献已被 CNKI 维普万方数据等数据库收录！