面向点击率预测的自注意力深度域嵌入因子分解机

李广丽, 叶艺源, 许广鑫, 张红斌, 吴光庭, 吕敬钦

工程科学与技术 ›› 2024, Vol. 56 ›› Issue (05) : 287 -296.

PDF
工程科学与技术 ›› 2024, Vol. 56 ›› Issue (05) : 287 -296.

面向点击率预测的自注意力深度域嵌入因子分解机

作者信息 +

Author information +
文章历史 +
PDF

摘要

点击率(CTR)预测通过预测用户对广告或商品的点击概率,实现数字广告精准推荐。针对现有CTR模型存在原始嵌入向量未精化、特征交互方式偏简单的问题,本文提出自注意力深度域嵌入因子分解机(self-attention deep field-embedded factorization machine,Self-At DFEFM)模型。首先,通过多头自注意力对原始嵌入向量加权,精化出关键低层特征;其次,构建深度域嵌入因子分解机(FEFM)模块,设计域对对称矩阵以提升不同特征域之间的交互强度,为高阶特征交互优选出低阶特征组合;再次,基于低阶特征组合构建深度神经网络(DNN),完成隐式高阶特征交互;然后,围绕精化后的嵌入向量,联合多头自注意力与残差机制堆叠多个显式高阶特征交互层,通过自注意力捕获同一特征在不同子空间上的互补信息,完成显示高阶特征交互;最后,联合显式与隐式高阶特征交互实现点击率预测。在Criteo和Avazu两大公开数据集上,将Self-AtDFEFM模型与主流基线模型在AUC和LogLoss指标上进行对比实验;为Self-AtDFEFM模型调制显式高阶特征交互层层数、注意力头数量、嵌入层维度及隐式高阶特征交互层层数等参数;对Self-AtDFEFM模型进行消融实验。实验结果表明:在两大数据集上,SelfAtDFEFM模型的AUC、LogLoss均优于主流基线模型;Self-AtDFEFM模型的全部参数已调为最佳;各模块形成合力以促使Self-AtDFEFM模型性能达到最优,其中显示高阶特征交互层的作用最大。Self-AtDFEFM模型各模块即插即用,易于构建和部署,且在性能与复杂度之间取得平衡,具备较高实用性。

关键词

点击率预测 / 多头自注意力 / 特征交互 / 域嵌入因子分解机 / 深度神经网络

Key words

引用本文

引用格式 ▾
李广丽, 叶艺源, 许广鑫, 张红斌, 吴光庭, 吕敬钦. 面向点击率预测的自注意力深度域嵌入因子分解机[J]. 工程科学与技术, 2024, 56(05): 287-296 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

10

访问

0

被引

详细

导航
相关文章

AI思维导图

/