基于主题多视图表示的零样本实体检索方法

齐丹丹, 王长征, 郭少茹, 闫智超, 胡志伟, 苏雪峰, 马博翔, 李时钊, 李茹

广西师范大学学报(自然科学版) ›› 2025, Vol. 43 ›› Issue (03) : 23 -34.

PDF
广西师范大学学报(自然科学版) ›› 2025, Vol. 43 ›› Issue (03) : 23 -34. DOI: 10.16088/j.issn.1001-6600.2024092807

基于主题多视图表示的零样本实体检索方法

    齐丹丹, 王长征, 郭少茹, 闫智超, 胡志伟, 苏雪峰, 马博翔, 李时钊, 李茹
作者信息 +

Author information +
文章历史 +
PDF

摘要

零样本实体检索旨在将实体提及(mention)链接到训练阶段未见过的实体,在多种自然语言处理任务中起关键作用。然而现有方法依然存在2个问题:1)仅使用实体描述的前k个句子来构建实体的多视图表示,导致实体多视图语义冗余与缺失,很难充分学习提及与实体之间的匹配关系;2)仅以提及为中心构造正负例,对提及与实体之间的对比关系覆盖度较低,导致其匹配错误。针对以上2个问题,本文提出基于主题的多视图实体表示(Topic-MVER)方法。该方法基于主题构建实体的多视图表示,并使用对比学习建模提及与实体之间的3种关系,提升提及和实体对表示的匹配性。该方法在ZESHEL和MedMentions数据集上的Recall@1分别达到48.13%和73.86%,较基线模型分别提升2.73和1.21个百分点,验证了本文方法的有效性。

关键词

实体检索 / 零样本 / 长文本 / 主题多视图 / 对比学习

Key words

引用本文

引用格式 ▾
基于主题多视图表示的零样本实体检索方法[J]. 广西师范大学学报(自然科学版), 2025, 43(03): 23-34 DOI:10.16088/j.issn.1001-6600.2024092807

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

61

访问

0

被引

详细

导航
相关文章

AI思维导图

/