云边协同环境下一种面向任务的多智能体强化学习任务卸载方案

唐宁昆, 王高才

小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (04) : 863 -875.

PDF
小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (04) : 863 -875. DOI: 10.20009/j.cnki.21-1106/TP.2023-0582

云边协同环境下一种面向任务的多智能体强化学习任务卸载方案

    唐宁昆, 王高才
作者信息 +

Author information +
文章历史 +
PDF

摘要

在云边协同计算环境中,计算任务的卸载决策问题是当前的研究热点.现有的方案通常采用单智能体强化学习算法求解该问题,存在鲁棒性低、决策空间过大等缺陷,且未考虑用户移动性、奖励延迟性以及信息观测与同步问题.针对上述不足,本文提出一种考虑设备局部观测能力的云边协同网络模型及任务计算队列和传输队列模型,并设计一种基于“面向任务”的多智能体强化学习的分布式卸载方案.首先,该方案给出信息同步协议以便设备获取网络全局状态,同时设计任务卸载调度规则以规定服务器在用户跨区移动和线路故障等场景下的计算和调度流程.然后,该方案以边缘服务器为智能体构建基于Actor-Critic框架的多智能体系统,给出智能体之间的协作方法,同时考虑线路故障时智能体的独立工作问题.随后为解决奖励延迟问题,本文将卸载决策问题建模为一种“面向任务”的马尔可夫决策过程,摒弃了常用的等距时隙模型,转而以任务处理时间为步长,采用动态且并行的时隙.最后以此过程为数学基础,本文提出一种任务卸载决策算法TOMAC-A2C.该算法利用多智能体强化学习思想,给出智能体之间协作完成卸载工作并相互评价以更新神经网络参数的方法,同时引入长短期记忆网络以对用户的移动性进行记忆和预测.基于来自现实世界的安卓设备移动情况数据集的实验结果表明,本文所提出的分布式卸载决策方案在面临高负载和高线路故障率时均能有效降低服务时延、能耗及任务丢弃率.

关键词

移动边缘计算 / 任务卸载 / 深度强化学习 / 多智能体 / 面向任务

Key words

引用本文

引用格式 ▾
云边协同环境下一种面向任务的多智能体强化学习任务卸载方案[J]. 小型微型计算机系统, 2025, 46(04): 863-875 DOI:10.20009/j.cnki.21-1106/TP.2023-0582

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

133

访问

0

被引

详细

导航
相关文章

AI思维导图

/