BseCS:结合协同注意力的双向语义扩充代码搜索模型

董以越, 金大海, 宫云战

小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (10) : 2531 -2540.

PDF
小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (10) : 2531 -2540. DOI: 10.20009/j.cnki.21-1106/TP.2024-0347

BseCS:结合协同注意力的双向语义扩充代码搜索模型

    董以越, 金大海, 宫云战
作者信息 +

Author information +
文章历史 +
PDF

摘要

开发者会使用大量时间检索可复用代码片段以提高整体开发效率.传统代码搜索引擎无法理解代码和查询间语义关联,对查询中关键词准确度要求极高.现有基于深度学习的代码搜索模型一定程度上可建立有效语义关联,但仍对关键词准确度有较高要求,且代码与查询间存在模态差异,不规范命名与模态差异对语义理解造成严重负面影响.本文提出双向语义扩充机制并构建代码搜索模型BseCS,使用协同注意力机制将代码结构信息与查询语句自然语言信息分别融入查询特征和代码特征,减少对关键词的过度依赖并增强代码段自然语言成分以弥合模态差异.在两个代码搜索数据集上进行了评估,BseCS在两数据集上平均倒数排名分别达到0.561/0.667,较最佳基线模型提升9.14%/19.96%.

关键词

代码搜索 / 协同注意力机制 / 双向语义扩充 / 代码表征

Key words

引用本文

引用格式 ▾
BseCS:结合协同注意力的双向语义扩充代码搜索模型[J]. 小型微型计算机系统, 2025, 46(10): 2531-2540 DOI:10.20009/j.cnki.21-1106/TP.2024-0347

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

55

访问

0

被引

详细

导航
相关文章

AI思维导图

/