基于双仿射机制的中文马铃薯病虫害命名实体识别

谢聪娇, 高静, 陈俊杰

内蒙古农业大学学报(自然科学版) ›› 2025, Vol. 46 ›› Issue (04) : 74 -83.

PDF
内蒙古农业大学学报(自然科学版) ›› 2025, Vol. 46 ›› Issue (04) : 74 -83. DOI: 10.16853/j.cnki.1009-3575.2025.04.009

基于双仿射机制的中文马铃薯病虫害命名实体识别

    谢聪娇, 高静, 陈俊杰
作者信息 +

Author information +
文章历史 +
PDF

摘要

本文针对马铃薯病虫害实体标注数据集缺失的问题,提出了基于大语言模型(LLM)的方法构建马铃薯中文病虫害实体标注数据集,有效减少了标注过程中的人工成本和时间成本;同时,针对中文马铃薯病虫害文本实体嵌套问题,构建了一套基于Ro BERTa_wwm-CNN-BiGRU-Biaffine的命名实体识别模型。首先,采用RoBERTa-wwm模型提取马铃薯病虫害文本的语义信息,获取动态词向量,解决词不完全识别的问题;然后,将CNN-BiGRU作为特征抽器获取实体的上下文信息;再基于双仿射机制识别实体的跨度信息;最后,通过softmax函数进行解码。引入焦点损失函数解决样本分布不均衡的问题。实验表明,该模型的马铃薯病虫害文本命名实体识别P、R、F1值分别达到91.50%、90.28%、90.89%。本文提出的模型在公有数据集MSRA上与RoBERTa_wwm、RoBERTa_wwm_LSTM_Biaffine、RoBERTa_wwm_CNN_Biaffine等模型进行了对比实验,并取得了最佳的实验结果,F1值达到96.67%。

关键词

马铃薯病虫害 / 命名实体识别 / 双仿射机制

Key words

引用本文

引用格式 ▾
基于双仿射机制的中文马铃薯病虫害命名实体识别[J]. 内蒙古农业大学学报(自然科学版), 2025, 46(04): 74-83 DOI:10.16853/j.cnki.1009-3575.2025.04.009

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

30

访问

0

被引

详细

导航
相关文章

AI思维导图

/