一种改进的强化学习方法在RoboCup中应用研究

程显毅, 朱倩

广西师范大学学报(自然科学版) ›› 2010, Vol. 28 ›› Issue (03) : 99 -103.

PDF
广西师范大学学报(自然科学版) ›› 2010, Vol. 28 ›› Issue (03) : 99 -103. DOI: 10.16088/j.issn.1001-6600.2010.03.033

一种改进的强化学习方法在RoboCup中应用研究

    程显毅, 朱倩
作者信息 +

Author information +
文章历史 +
PDF

摘要

基于CMAC(cerebella model articulation controller)提出一种动态强化学习方法(dynamic cerebellamodel articulation controller-advantage learning,DCMAC-AL)。该方法利用advantage(λ)learning计算状态-动作函数,强化不同动作的值函数差异,以避免动作抖动;然后在CMAC函数拟合基础上,利用Bellman误差动态添加特征值,提高CMAC函数拟合的自适应性。同时,在RoboCup仿真平台上对多智能体防守任务(takeaway)进行建模,利用新提出的算法进行学习实验。实验结果表明,DCMAC-AL比采用CMAC的advantage(λ)learning方法有更好的学习效果。

关键词

强化学习 / agent / RoboCup / CMAC

Key words

引用本文

引用格式 ▾
一种改进的强化学习方法在RoboCup中应用研究[J]. 广西师范大学学报(自然科学版), 2010, 28(03): 99-103 DOI:10.16088/j.issn.1001-6600.2010.03.033

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

61

访问

0

被引

详细

导航
相关文章

AI思维导图

/