基于RBAC模型的中文医疗命名实体识别

张斌, 赵婷婷, 张碧霞, 陈亚瑞, 王嫄

天津科技大学学报 ›› 2024, Vol. 39 ›› Issue (05) : 56 -62.

PDF (804KB)
天津科技大学学报 ›› 2024, Vol. 39 ›› Issue (05) : 56 -62. DOI: 10.13364/j.issn.1672-6510.20230180

基于RBAC模型的中文医疗命名实体识别

    张斌, 赵婷婷, 张碧霞, 陈亚瑞, 王嫄
作者信息 +

Author information +
文章历史 +
PDF (823K)

摘要

中文医疗命名实体识别旨在从非结构化数据中抽取结构化实体,目前的主流研究都使用了大量的训练数据。针对中文医疗命名实体识别训练数据匮乏的问题,提出了基于联合分词的RBAC(RoBERTa-BiGRU-Attention-CRF)模型和基于语义搜索的命名实体识别数据增强方法。首先利用预训练模型和双向门控循环单元(BiGRU)提取文本的深度双向语义表示,再将该语义表示分别送入分词模块和命名实体识别模块。分词模块利用条件随机场(CRF)得到分词信息。命名实体识别模块利用BiGRU与多头注意力得到混合语义表示,再送入CRF得到命名实体识别的标签序列。在CCKS2019中文电子病历数据集上的实验结果表明,该方法在数据量较少的情况下F1达到90.5%,证明了该方法的有效性。

关键词

多任务学习 / 预训练模型 / 双向门控循环单元 / 多头注意力 / 条件随机场 / 数据增强

Key words

引用本文

引用格式 ▾
基于RBAC模型的中文医疗命名实体识别[J]. 天津科技大学学报, 2024, 39(05): 56-62 DOI:10.13364/j.issn.1672-6510.20230180

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF (804KB)

132

访问

0

被引

详细

导航
相关文章

AI思维导图

/