基于Bert-BiLSTM-CRF模型的中文命名实体识别

龙星全, 李佳

吉林大学学报(信息科学版) ›› 2025, Vol. 43 ›› Issue (02) : 384 -393.

PDF
吉林大学学报(信息科学版) ›› 2025, Vol. 43 ›› Issue (02) : 384 -393. DOI: 10.19292/j.cnki.jdxxp.2025.02.020

基于Bert-BiLSTM-CRF模型的中文命名实体识别

    龙星全, 李佳
作者信息 +

Author information +
文章历史 +
PDF

摘要

针对现有的中文命名实体识别算法没有充分考虑实体识别任务的数据特征,存在中文样本数据的类别不平衡、训练数据中的噪声太大和每次模型生成数据的分布差异较大的问题,提出了一种以BERT-BiLSTM-CRF(Bidirectional Encoder Representations from Transformers-Bidirectional Long Short-Term Memory-Conditional Random Field)为基线改进的中文命名实体识别模型。首先在BERT-BiLSTM-CRF模型上结合P-Tuning v2技术,精确提取数据特征,然后使用3个损失函数包括聚焦损失(Focal Loss)、标签平滑(Label Smoothing)和KL Loss(Kullback-Leibler divergence loss)作为正则项参与损失计算。实验结果表明,改进的模型在Weibo、Resume和MSRA(Microsoft Research Asia)数据集上的F1得分分别为71.13%、96.31%、95.90%,验证了所提算法具有更好的性能,并且在不同的下游任务中,所提算法易于与其他的神经网络结合与扩展。

关键词

中文命名实体识别 / BERT-BiLSTM-CRF模型 / P-Tuning v2技术 / 损失函数

Key words

引用本文

引用格式 ▾
基于Bert-BiLSTM-CRF模型的中文命名实体识别[J]. 吉林大学学报(信息科学版), 2025, 43(02): 384-393 DOI:10.19292/j.cnki.jdxxp.2025.02.020

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

107

访问

0

被引

详细

导航
相关文章

AI思维导图

/