多任务特征交互的三元组抽取方法

徐新黎, 卢齐林, 杨旭华, 黄玉娇, 龙海霞, 马钢峰

小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (06) : 1333 -1341.

PDF
小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (06) : 1333 -1341. DOI: 10.20009/j.cnki.21-1106/TP.2024-0162

多任务特征交互的三元组抽取方法

    徐新黎, 卢齐林, 杨旭华, 黄玉娇, 龙海霞, 马钢峰
作者信息 +

Author information +
文章历史 +
PDF

摘要

从非结构化的文本中抽取实体关系三元组是构建大规模知识图谱的基础.由于实际抽取任务的数据标注往往是不平衡的,例如负样本的数量远超于正样本,或者简单样本的比例过高,导致模型训练易受到负样本或简单样本的支配.为了提高标注不平衡的三元组抽取性能,提出一个基于多任务交互特征提取的联合优化框架.该框架首先扩展切分网络(PFN)完成3个子任务(主语识别,宾语识别和主宾对齐)的特征提取,使得3个子任务既能互相交互,又能专注于自己的任务.其次引入改进的Dice损失以解决主宾关联矩阵不平衡的问题,同时在联合优化中引入均方差不确定性,以减少各个子任务噪声的影响.实验结果表明,所提方法在数据集NYT和WebNLG上取得了最好的综合性能.

关键词

三元组抽取 / 多任务交互 / 信息抽取 / 知识图谱

Key words

引用本文

引用格式 ▾
多任务特征交互的三元组抽取方法[J]. 小型微型计算机系统, 2025, 46(06): 1333-1341 DOI:10.20009/j.cnki.21-1106/TP.2024-0162

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

48

访问

0

被引

详细

导航
相关文章

AI思维导图

/