基于有效动作表示的策略搜索强化学习方法
王馨雪, 黄佳欣, 赵婷婷, 陈亚瑞, 王嫄
天津科技大学学报 ›› 2025, Vol. 40 ›› Issue (05) : 57 -65.
潜在空间 / 动作表示 / 连续动作空间 / 回报预测 / 有效动作表示提取器 / 策略搜索强化学习方法
BibTeX
EndNote
RefWorks
TxT
登录浏览全文
注册一个新账户 忘记密码
专题
124
访问
0
被引
详细
/