PDF
摘要
内窥镜图像分割技术作为常规临床诊断手段,其分割精度直接影响对病变区域的诊断和治疗决策。针对现有方法在图像质量不佳、病变区域边界模糊等复杂场景下的局限性,提出一种融合多尺度特征感知与模糊边界建模的息肉分割网络。首先,通过离散小波变换将图像分解为不同尺度和频率的子带,分别提取图像全局结构和局部细节特征,并结合自适应注意力机制动态调整各子带特征权重,实现多尺度特征感知。其次,采用变分多采样模块将特征映射至潜在空间进行概率分布建模,通过多次重参数化采样生成多样化潜在空间表示,有效平滑模糊区域并提高边界分割准确性。在CVC-300,CVC-ClinicDB,Kvasir-SEG,CVC-ColonDB,ETIS-LaribPolyDB等5个公开数据集和USTCAI非公开数据集上进行实验,验证本文方法的性能。结果表明:本文方法在mDice系数和mIoU指标上均优于现有方法,特别是在ETIS-LaribPolyDB数据集上以57.54%的mDice系数超越现有最优方法 7.16%,在CVC-ClinicDB数据集上达到91.88%的mDice系数,展现出优异的复杂场景分割性能和泛化能力。本文方法通过融合多尺度特征感知与模糊边界建模技术,有效解决了内窥镜图像分割中的关键难题,为临床诊断提供了更精准可靠的技术支持。
关键词
息肉图像
/
图像分割
/
特征感知
/
模糊边界
/
边界建模
/
注意力机制
/
智慧医疗
Key words
融合多尺度感知与模糊边界建模的息肉分割网络[J].
安徽工业大学学报(自然科学版), 2025, 42(05): 498-509 DOI: