基于元学习的中文史料少样本命名实体识别研究

陈涛, 殷锋, 郭伟超

西南民族大学学报(自然科学版) ›› 2025, Vol. 51 ›› Issue (03) : 308 -314.

PDF
西南民族大学学报(自然科学版) ›› 2025, Vol. 51 ›› Issue (03) : 308 -314.

基于元学习的中文史料少样本命名实体识别研究

    陈涛, 殷锋, 郭伟超
作者信息 +

Author information +
文章历史 +
PDF

摘要

命名实体识别通过识别史料中的人名、地名、事件等实体,能够构建结构化知识库,促进历史信息的语义关联,助力历史事件的重构与分析.由于中文史料中标注语料稀缺,少样本问题较为突出.对此,在自适应裕度元学习三元组网络框架中集成数据增强技术,并使用针对中文的基于双向编码器表示的稳健优化的双向编码器表征预训练模型(robustly optimized bidirectional encoder representations from transformers pretraining approach for Chinese, Chinese-RoBERTa)优化中文长文本语义表征能力,提出融合数据增强的自适应裕度三元组网络命名实体识别方法.实验表明,本方法在少样本场景下表现显著,在5-way 1-shot任务和5-way 5-shot任务中F1值分别达到86.68%和92.78%,验证了其在低资源中文史料场景下的有效性.提出的方法解决了中文史料命名实体识别标注数据稀缺的少样本问题,同时为更广泛的低资源历史文本信息抽取任务提供有益参考.

关键词

元学习 / 少样本 / 数据增强 / 命名实体识别

Key words

引用本文

引用格式 ▾
基于元学习的中文史料少样本命名实体识别研究[J]. 西南民族大学学报(自然科学版), 2025, 51(03): 308-314 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

136

访问

0

被引

详细

导航
相关文章

AI思维导图

/