基于端口粒度故障定级管理的NoC容错架构设计

史再峰, 刘鑫涛, 张熙宇, 罗韬

天津大学学报(自然科学与工程技术版) ›› 2026, Vol. 59 ›› Issue (5) : 496 -506.

PDF
天津大学学报(自然科学与工程技术版) ›› 2026, Vol. 59 ›› Issue (5) : 496 -506.

基于端口粒度故障定级管理的NoC容错架构设计

    史再峰, 刘鑫涛, 张熙宇, 罗韬
作者信息 +

Author information +
文章历史 +
PDF

摘要

随着半导体工艺持续演进至深亚微米节点,片上网络关键组件在高密度集成环境下,面临日益严峻的物理缺陷与电噪声干扰,故障发生概率显著上升.现有容错机制在处理多类型并发故障时,常因故障模式识别精度不足,导致资源利用率偏低与通信性能下降.针对上述问题,本文提出一种基于端口粒度的故障定级管理容错架构,设计三级协同故障管控机制.首先,引入信用返还标识确认机制,实现链路层端口的亚周期级实时故障检测,能够精确定位并快速上报报文丢失与数据校验错误,显著提高故障检测准确率与响应速度;其次,设计轻量化备份缓冲区并融合优先级调度策略,支持故障报文的快速跨步重传,有效降低重传延迟与带宽开销;最后,基于故障状态机模型动态评估端口故障等级,实现通信资源自适应调度,进一步提升系统整体资源利用率.此外,该架构集成了协同容错路由算法,可快速识别瞬态故障并实现端口重启,同时对永久性故障端口实施智能隔离与动态路径绕行,从而减少冗余重传并降低容错操作带来的带宽损失.实验结果表明,在多类故障并发的合成流量场景下,本文所提架构的饱和吞吐率较FT-E2E容错方案最高可提升41.6%,较EsyTest容错方案最高可提升26.2%,实现了系统可靠性与通信性能的协同优化.

关键词

片上网络 / 容错架构 / 故障定级 / 可靠通信

Key words

引用本文

引用格式 ▾
基于端口粒度故障定级管理的NoC容错架构设计[J]. 天津大学学报(自然科学与工程技术版), 2026, 59(5): 496-506 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/