融入拼音与词性特征的中文电子病历命名实体识别

陆鑫涛, 孙丽萍, 凌晨, 童子龙, 刘佳霖, 汤其宇

小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (02) : 330 -338.

PDF
小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (02) : 330 -338. DOI: 10.20009/j.cnki.21-1106/TP.2023-0548

融入拼音与词性特征的中文电子病历命名实体识别

作者信息 +

Author information +
文章历史 +
PDF

摘要

中文电子病历结构复杂,且相较英文具有更多的一字多音与一音多义现象,给命名实体识别任务带来了挑战.随着技术的成熟,当前主流的基于字形特征的命名实体识别方法难以获得较大提升,因此本文提出一种融入拼音与词性特征的中文电子病历命名实体识别方法,利用BERT预训练模型获取医学文本的动态向量表示,借助中文拼音特征对电子病历文本进行深度挖掘,并提取词性特征对拼音特征的不确定性加以约束.此外,对于这3种类型的特征,本文采用缩放点积注意力模块进行融合.在医疗领域数据集CCKS2018、CCKS2019,通用领域数据集Weibo上,F1值分别达到了98.66、87.25、73.41,相较基准模型BERT-BiLSTM-CRF分别提升了1.01、2.10、6.51.实验结果表明,与当前众多现有模型相比,本文方法展现出了更优越的性能,本研究为中文电子病历命名实体识别提供了新的思路.

关键词

命名实体识别 / 中文电子病历 / 注意力机制 / 特征融合 / 数据挖掘

Key words

引用本文

引用格式 ▾
陆鑫涛, 孙丽萍, 凌晨, 童子龙, 刘佳霖, 汤其宇. 融入拼音与词性特征的中文电子病历命名实体识别[J]. 小型微型计算机系统, 2025, 46(02): 330-338 DOI:10.20009/j.cnki.21-1106/TP.2023-0548

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

71

访问

0

被引

详细

导航
相关文章

AI思维导图

/