基于预训练模型与BiLSTM-CNN的多标签代码坏味检测方法

刘海洋, 张杨, 田泉泉, 王晓红

河北工业科技 ›› 2024, Vol. 41 ›› Issue (05) : 330 -335.

PDF
河北工业科技 ›› 2024, Vol. 41 ›› Issue (05) : 330 -335.

基于预训练模型与BiLSTM-CNN的多标签代码坏味检测方法

    刘海洋, 张杨, 田泉泉, 王晓红
作者信息 +

Author information +
文章历史 +
PDF

摘要

为了提高多标签代码坏味检测的准确率,提出一种基于预训练模型与BiLSTM-CNN的多标签代码坏味检测方法DMSmell(deep multi-smell)。首先,利用静态分析工具获取源代码中的文本信息和结构度量信息,并采用2种检测规则对代码坏味实例进行标记;其次,利用CodeBERT预训练模型生成文本信息对应的词向量,并分别采用BiLSTM和CNN对词向量和结构度量信息进行深度特征提取;最后,结合注意力机制和多层感知机,完成多标签代码坏味的检测,并对DMSmell方法进行了性能评估。结果表明:DMSmell方法在一定程度上提高了多标签代码坏味检测的准确率,与基于分类器链的方法相比,精确匹配率提高了1.36个百分点,微查全率提高了2.45个百分点,微F1提高了1.1个百分点。这表明,将文本信息与结构度量信息相结合,并利用深度学习技术进行特征提取和分类,可以有效提高代码坏味检测的准确性,为多标签代码坏味检测的研究和应用提供重要的参考。

关键词

软件工程 / 代码坏味 / 预训练模型 / 多标签分类 / 深度学习

Key words

引用本文

引用格式 ▾
基于预训练模型与BiLSTM-CNN的多标签代码坏味检测方法[J]. 河北工业科技, 2024, 41(05): 330-335 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

18

访问

0

被引

详细

导航
相关文章

AI思维导图

/