分布式强化学习驱动的量子编译自动调优方法

刘毅, 朱雨, 许瑾晨, 杜启明, 连航, 涂政

信息工程大学学报 ›› 2025, Vol. 26 ›› Issue (04) : 462 -469.

PDF
信息工程大学学报 ›› 2025, Vol. 26 ›› Issue (04) : 462 -469.

分布式强化学习驱动的量子编译自动调优方法

    刘毅, 朱雨, 许瑾晨, 杜启明, 连航, 涂政
作者信息 +

Author information +
文章历史 +
PDF

摘要

针对强化学习模型应用到量子编译自动调优领域开销大的问题,提出一种分布式强化学习(DRL)驱动的量子编译自动调优方法,通过将经验生成与智能体训练解耦,基于分布式集群实现了并行经验生成。该方法通过建立具有稠密奖励特性的量子编译马尔可夫决策过程(MDP)模型,设计经验生成与智能体训练的解耦机制,结合动态经验加载策略,在保证优化效果的同时提升训练效率。实验结果表明,分布式训练框架训练耗时减少54.6%;优化性能方面,智能体在测试集77.3%的量子线路上表现优于Qiskit-O3编译器,对未见过的Shor算法线路平均减少17.4%量子门数量。

关键词

强化学习 / 分布式系统 / 深度Q网络 / 量子编译优化 / 量子编译自动调优

Key words

引用本文

引用格式 ▾
分布式强化学习驱动的量子编译自动调优方法[J]. 信息工程大学学报, 2025, 26(04): 462-469 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

140

访问

0

被引

详细

导航
相关文章

AI思维导图

/