基于Q-Learning的智能体训练

赵增荣, 韩提文

石家庄铁道大学学报(自然科学版) ›› 2007, Vol. 0 ›› Issue (02) : 37 -39+72.

PDF
石家庄铁道大学学报(自然科学版) ›› 2007, Vol. 0 ›› Issue (02) : 37 -39+72. DOI: 10.13319/j.cnki.sjztddxxbzrb.2007.02.009

基于Q-Learning的智能体训练

作者信息 +

Author information +
文章历史 +
PDF

摘要

针对机器人足球比赛的多智能体环境下智能体的训练问题,提出了一种将模糊控制与Q-Learning相结合的学习方法,并在学习过程中自动调节回报函数以获得最优策略,此方法的有效性在中型组的仿真平台上得到了验证,并取得了较好效果,还可将它改进应用于其他多智体环境。

关键词

Q-Learning / 模糊控制 / 回报函数

Key words

引用本文

引用格式 ▾
赵增荣, 韩提文 基于Q-Learning的智能体训练[J]. 石家庄铁道大学学报(自然科学版), 2007, 0(02): 37-39+72 DOI:10.13319/j.cnki.sjztddxxbzrb.2007.02.009

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

10

访问

0

被引

详细

导航
相关文章

AI思维导图

/