融合多尺度卷积和数据增强的中文嵌套实体识别方法

陆艳军, 冯禄华, 任梦瑶, 谢彧

小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (07) : 1554 -1561.

PDF
小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (07) : 1554 -1561. DOI: 10.20009/j.cnki.21-1106/TP.2024-0271

融合多尺度卷积和数据增强的中文嵌套实体识别方法

    陆艳军, 冯禄华, 任梦瑶, 谢彧
作者信息 +

Author information +
文章历史 +
PDF

摘要

为了识别中文文本中的嵌套实体,并提高实体识别的准确度,本文提出一种基于多尺度卷积和数据增强的中文嵌套实体识别模型DAMCNER(Data Augmentation and Multi-scale Convolution based Named Entity Recognition).该模型首先利用预训练模型生成原始输入的嵌入表示并对嵌入特征进行语义增强,之后通过多头双仿射注意力机制构造跨度特征矩阵,并使用多尺度膨胀卷积层和基于内容的注意力机制对跨度特征矩阵进行进一步的特征提取,最后使用多层感知机进行跨度解码.此外,本文设计了数据增强模块强化数据样本的多样性,让模型具有更强的鲁棒性和泛化能力,并且进一步提升识别精确度.在三个公开的中文嵌套实体数据集上的实验结果表明,DAMCNER模型的性能优于现有基线模型,F1值平均提升了1.52%.实验证明DAMCNER模型在不同场景下均有较好效果,有效提升了中文嵌套实体识别的效果.

关键词

命名实体识别 / 嵌套实体 / 膨胀卷积 / 数据增强 / 对抗训练

Key words

引用本文

引用格式 ▾
融合多尺度卷积和数据增强的中文嵌套实体识别方法[J]. 小型微型计算机系统, 2025, 46(07): 1554-1561 DOI:10.20009/j.cnki.21-1106/TP.2024-0271

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

54

访问

0

被引

详细

导航
相关文章

AI思维导图

/