基于Q-Learning的智能体训练

石家庄铁道大学学报（自然科学版） ›› 2007, Vol. 0 ›› Issue (02) : 37 -39+72. DOI: 10.13319/j.cnki.sjztddxxbzrb.2007.02.009

基于Q-Learning的智能体训练

赵增荣, 韩提文

作者信息 +

Author information +

文章历史 +

PDF

针对机器人足球比赛的多智能体环境下智能体的训练问题,提出了一种将模糊控制与Q-Learning相结合的学习方法,并在学习过程中自动调节回报函数以获得最优策略,此方法的有效性在中型组的仿真平台上得到了验证,并取得了较好效果,还可将它改进应用于其他多智体环境。

引用格式 ▾

基于Q-Learning的智能体训练[J]. 石家庄铁道大学学报（自然科学版）, 2007, 0(02): 37-39+72 DOI:10.13319/j.cnki.sjztddxxbzrb.2007.02.009

登录浏览全文

4963

原文顺序 | 出版日期 | 本文引用

PDF

访问

被引

详细

导航