PDF
摘要
基于CMAC(cerebella model articulation controller)提出一种动态强化学习方法(dynamic cerebellamodel articulation controller-advantage learning,DCMAC-AL)。该方法利用advantage(λ)learning计算状态-动作函数,强化不同动作的值函数差异,以避免动作抖动;然后在CMAC函数拟合基础上,利用Bellman误差动态添加特征值,提高CMAC函数拟合的自适应性。同时,在RoboCup仿真平台上对多智能体防守任务(takeaway)进行建模,利用新提出的算法进行学习实验。实验结果表明,DCMAC-AL比采用CMAC的advantage(λ)learning方法有更好的学习效果。
关键词
强化学习
/
agent
/
RoboCup
/
CMAC
Key words
一种改进的强化学习方法在RoboCup中应用研究[J].
广西师范大学学报(自然科学版), 2010, 28(03): 99-103 DOI:10.16088/j.issn.1001-6600.2010.03.033