智能系统中的强化学习方法

甘宁, 李玉龙, 汪永寿, 乔琛

数学建模及其应用 ›› 2024, Vol. 13 ›› Issue (03) : 1 -14.

PDF
数学建模及其应用 ›› 2024, Vol. 13 ›› Issue (03) : 1 -14. DOI: 10.19943/j.2095-3070.jmmia.2024.03.01

智能系统中的强化学习方法

    甘宁, 李玉龙, 汪永寿, 乔琛
作者信息 +

Author information +
文章历史 +
PDF

摘要

作为人工智能领域的常用技术之一,强化学习、监督学习和非监督学习并列为三种机器学习范式.强化学习是指智能体与环境直接进行交互,通过最大化累计奖励学习最佳策略的过程.本文梳理了强化学习领域的发展历程,并介绍了经典的强化学习和基于深度网络的强化学习算法和模型,包括基于值函数和策略梯度的方法、演员-评论家算法、深度Q网络及其优化模型,最后对强化学习当前面临的研究挑战和未来的发展前景进行了讨论.

关键词

强化学习 / 机器学习 / 人工智能

Key words

引用本文

引用格式 ▾
智能系统中的强化学习方法[J]. 数学建模及其应用, 2024, 13(03): 1-14 DOI:10.19943/j.2095-3070.jmmia.2024.03.01

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

135

访问

0

被引

详细

导航
相关文章

AI思维导图

/