词元与上下文双路表征融合的小样本命名实体识别方法

曾鹏武, 谢志鹏

小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (03) : 513 -519.

PDF
小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (03) : 513 -519. DOI: 10.20009/j.cnki.21-1106/TP.2023-0554

词元与上下文双路表征融合的小样本命名实体识别方法

    曾鹏武, 谢志鹏
作者信息 +

Author information +
文章历史 +
PDF

摘要

现有的命名实体识别方法需要大量训练数据,在小样本场景下容易过拟合.针对该问题,提出一种基于预训练模型掩码预测的方法,引入上下文信息改善模型泛化能力.首先使用两路BERT(Bidirectional Encoder Representation from Transformers)预训练模型,通过掩码替换计算当前词汇的词元表征和上下文表征;随后计算两者在BERT词表上的概率向量,使用自适应门控机制加权求和获得融合概率.若预测概率最大的词为本文预定义的类别标签词,则将当前词元分类为实体,否则分类为非实体.在来自不同领域的CoNLL03、OntoNotes5.0以及MIT-Movie数据集上的实验结果表明,所提算法的平均F1值相较于基准方法提升了12%,相较于提示词方法提升了4%~11%,有效改善了小样本下的泛化性能,证明引入上下文信息的有效性.

关键词

小样本学习 / 命名实体识别 / BERT / 掩码预测

Key words

引用本文

引用格式 ▾
词元与上下文双路表征融合的小样本命名实体识别方法[J]. 小型微型计算机系统, 2025, 46(03): 513-519 DOI:10.20009/j.cnki.21-1106/TP.2023-0554

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

57

访问

0

被引

详细

导航
相关文章

AI思维导图

/