PDF
摘要
远程监督的标注方法在关系抽取任务中被广泛应用,其在减小人工标注负担的同时,也引入了大量噪声样本,影响了模型的训练.针对这个问题,提出了一种基于影响函数的去噪方法.通过影响函数衡量训练集中每一条训练样本对模型预测的影响,并在建立噪声样本与其的关系后,设计了1个判断样本是否是错误标注的打分函数.基于此打分函数的值,从初始的1个小的无噪声集合出发,通过自举法迭代式地获得最后的去噪数据集.该去噪方法作为一种对数据的前处理方法,在公开数据集上取得了良好的效果.
关键词
Key words
基于影响函数的远程监督关系抽取[J].
华东师范大学学报(自然科学版), 2022, 0(6): 79-86 DOI: