基于多特征融合和注意力机制的中文命名实体识别

陈奕全, 吴晓鸰, 占文韬, HEO Hoon

小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (02) : 339 -345.

PDF
小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (02) : 339 -345. DOI: 10.20009/j.cnki.21-1106/TP.2023-0496

基于多特征融合和注意力机制的中文命名实体识别

    陈奕全, 吴晓鸰, 占文韬, HEO Hoon
作者信息 +

Author information +
文章历史 +
PDF

摘要

近年来,基于字符级嵌入的BERT模型和基于词融合的模型都在中文命名实体识别领域取得了较好的效果,但目前这些模型从字符序列中提取出的特征信息还不够充分,模型性能还有一定的提升空间.因此本文提出了一种用于中文命名实体识别的多特征融合模型,首先将输入中文语句转换为字词对序列,通过RoBERTa-wwm预训练语言模型将字词对序列中的字符序列表征为字符向量,获得全局语义特征;然后把词序列转化为词向量,再将字符向量和词向量输入到基于双线性注意力机制的词汇适配器获得字词融合特征;同时将字符向量送入到双向长短时记忆网络(BiLSTM)获得包含字符方向信息的上下文特征;最后将词汇适配器的输出和BiLSTM的输出进行动态特征融合获得包含全局语义信息、词汇信息和方向信息的上下文特征,再通过CRF解码获得最优预测序列.在多个公共数据集的实验结果验证了该模型能提取到更充分的特征信息,提高了识别性能.

关键词

中文命名实体识别 / 多特征融合 / 词融合 / 预训练模型

Key words

引用本文

引用格式 ▾
基于多特征融合和注意力机制的中文命名实体识别[J]. 小型微型计算机系统, 2025, 46(02): 339-345 DOI:10.20009/j.cnki.21-1106/TP.2023-0496

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

49

访问

0

被引

详细

导航
相关文章

AI思维导图

/