容器云环境GPU共享技术研究与实现

吴阳阳, 吴恒, 唐震, 张文博

广西大学学报(自然科学版) ›› 2026, Vol. 51 ›› Issue (01) : 177 -187.

PDF
广西大学学报(自然科学版) ›› 2026, Vol. 51 ›› Issue (01) : 177 -187. DOI: 10.13624/j.cnki.issn.1001-7445.2026.0177

容器云环境GPU共享技术研究与实现

    吴阳阳, 吴恒, 唐震, 张文博
作者信息 +

Author information +
文章历史 +
PDF

摘要

针对传统基于时间分片的图形处理单元(GPU)共享方案中容器在时间片内独占GPU而导致的任务低负载时资源浪费问题,提出一种GPU共享框架(TQShare)。TQShare整合核函数执行时间预测技术与核函数时间配额管理机制,支持多个容器在同一时间片内并发执行深度学习任务,从而提升资源利用率;同时,通过对任务启动的核函数进行动态调度管理,实现资源的有效隔离。实验结果表明,与KubeShare相比,TQShare将GPU平均利用率提高了13.4个百分点,深度学习工作负载完成时间缩短了14.7%,且平均性能开销仅为2.41%。

关键词

容器 / 图形处理单元共享 / 资源隔离 / 图形处理单元利用率 / 深度学习

Key words

引用本文

引用格式 ▾
吴阳阳, 吴恒, 唐震, 张文博. 容器云环境GPU共享技术研究与实现[J]. 广西大学学报(自然科学版), 2026, 51(01): 177-187 DOI:10.13624/j.cnki.issn.1001-7445.2026.0177

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/