GPU上Tensor Core加速的共轭梯度解法器

卢玥辰, 袁雨萧, 杨德闯, 刘伟峰

电子科技大学学报 ›› 2026, Vol. 55 ›› Issue (2) : 244 -251.

PDF
电子科技大学学报 ›› 2026, Vol. 55 ›› Issue (2) : 244 -251.

GPU上Tensor Core加速的共轭梯度解法器

    卢玥辰, 袁雨萧, 杨德闯, 刘伟峰
作者信息 +

Author information +
文章历史 +
PDF

摘要

共轭梯度方法(CG)和稳定双共轭梯度方法(BiCGSTAB)是求解稀疏线性系统的两种经典且高效的迭代方法,被广泛应用于科学计算和工程问题中。尽管GPU等并行处理器提升了这两种方法的并行性,但最新的硬件单元Tensor Core及其计算能力尚未被用于这两种方法中。该文设计了一个Tensor Core加速的CG解法器,利用Tensor Core计算CG和BiCGSTAB方法中的关键组件稀疏矩阵-向量乘法(SpMV)和点积操作,以发挥Tensor Core的计算能力,从而提升两种方法的整体性能。在NVIDIA A100和H100 GPU上的实验结果表明,Tensor Core加速的这两种方法相比调用CUDA官方库的基准版本在多个稀疏矩阵上均取得了显著的加速效果。

关键词

稀疏矩阵-向量乘法 / 点积 / 共轭梯度法 / 稳定双共轭梯度法 / 张量核心 / 图形处理单元

Key words

引用本文

引用格式 ▾
GPU上Tensor Core加速的共轭梯度解法器[J]. 电子科技大学学报, 2026, 55(2): 244-251 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/