基于跨模态注意力哈希学习的视频片段定位方法

谭智方, 董飞, 卢鹏宇, 潘嘉男, 聂秀山, 尹义龙

山东大学学报(工学版) ›› 2025, Vol. 55 ›› Issue (01) : 58 -65.

PDF
山东大学学报(工学版) ›› 2025, Vol. 55 ›› Issue (01) : 58 -65.

基于跨模态注意力哈希学习的视频片段定位方法

    谭智方, 董飞, 卢鹏宇, 潘嘉男, 聂秀山, 尹义龙
作者信息 +

Author information +
文章历史 +
PDF

摘要

为提升视频片段定位的精度与检索效率,提出基于跨模态注意力哈希学习的视频片段定位方法。将查询语句和原始视频特征通过哈希学习模型转化成简洁的二值哈希码;使用软注意力模块对查询语句中的关键单词进行加权,将视频哈希码和查询语句哈希码输入一个增强的跨模态注意力模型中,挖掘视觉和语言之间的语义关系;设计一个得分预测和位置预测网络,对查询时刻的起始时间戳进行定位。在2个公开数据集上对所提方法进行试验验证,结果表明所提方法对检索效率提升约7倍。

关键词

视觉理解 / 视频片段定位 / 多模态检索 / 哈希学习 / 跨模态

Key words

引用本文

引用格式 ▾
基于跨模态注意力哈希学习的视频片段定位方法[J]. 山东大学学报(工学版), 2025, 55(01): 58-65 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

74

访问

0

被引

详细

导航
相关文章

AI思维导图

/