面向国产RISC-V芯片的高效高精度求和与点积算法

李骥, 邱琪, 张翔, 肖调杰, 孟祥飞, 龚春叶, 冯超超

小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (11) : 2798 -2806.

PDF
小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (11) : 2798 -2806. DOI: 10.20009/j.cnki.21-1106/TP.2024-0481

面向国产RISC-V芯片的高效高精度求和与点积算法

    李骥, 邱琪, 张翔, 肖调杰, 孟祥飞, 龚春叶, 冯超超
作者信息 +

Author information +
文章历史 +
PDF

摘要

RISC-V作为一种新兴的开源精简指令集架构,是后摩尔时代处理器技术发展与创新的关键之一.浮点求和与点积运算是数值运算的基础组成部分,在众多领域应用广泛.目前RISC-V架构尚未适配兼具高精度和高效率的求和与点积运算算法,这是因为现有优化方案难以良好地平衡运算精度和效率,要么侧重于低精度算法效率,要么通过牺牲效率实现高精度运算.本文利用RVV(RISC-V Vector instruction set extension, RVV)矢量扩展指令,设计并实现了一种基于无误差变换技术的高效、高精度求和与点积算法.首先避免使用规约指令以防止运算精度降低,实现并优化两类运算基于RVV的向量化算法;其次根据算法中的数据依赖关系,对寄存器配置参数进行优化.最后针对算法核心步骤进行汇编优化,增加指令级并行度,提高流水线利用率.实验结果表明,与两类运算操作的原始算法相比,优化后的算法运算效率分别提高了4.4和4.2倍.优化后的算法与多精度库MPFR中的四精度算法有相同精度,但其运算效率明显优于后者,其计算速度与OpenBLAS的双精度计算速度相当.

关键词

RISC-V / 点积 / 求和 / 无误差变换 / 高精度 / 向量化

Key words

引用本文

引用格式 ▾
面向国产RISC-V芯片的高效高精度求和与点积算法[J]. 小型微型计算机系统, 2025, 46(11): 2798-2806 DOI:10.20009/j.cnki.21-1106/TP.2024-0481

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

73

访问

0

被引

详细

导航
相关文章

AI思维导图

/