一种基于并行多尺度特征学习的招聘信息抽取模型

郭雯靓, 吕楠, 纪淑娟, 步朝晖, 王永政, 曹宁

山东科技大学学报(自然科学版) ›› 2025, Vol. 44 ›› Issue (03) : 97 -106.

PDF
山东科技大学学报(自然科学版) ›› 2025, Vol. 44 ›› Issue (03) : 97 -106. DOI: 10.16452/j.cnki.sdkjzk.2025.03.010

一种基于并行多尺度特征学习的招聘信息抽取模型

    郭雯靓, 吕楠, 纪淑娟, 步朝晖, 王永政, 曹宁
作者信息 +

Author information +
文章历史 +
PDF

摘要

随着网络招聘的普及,基于招聘广告的自动实体抽取,已成为职位和人才推荐等下游智能应用系统开发的重要基础。现有招聘广告实体抽取模型存在抽取内容分类覆盖不全面和超长文本序列语义稀释问题。本研究将招聘文本中的实体划分为四类,提出一种基于并行多尺度特征学习的招聘信息抽取模型(MUBLC)。首先,模型利用长短时记忆网络(LSTM)从原始数据中提取初始特征。然后,使用自注意力机制学习全局特征,采用动态深度卷积网络与自注意力共享投影的方式并行学习局部特征,同时在自注意力机制的每一层并行连接前馈神经网络,并行学习文本的逐点特征。最后,模型将并行学习得到的三种尺度特征进行向量融合,并输入条件随机场(CRF)获得预测的标签序列。实验结果表明,与现有最优模型相比,本研究所提模型的F1值提高了2.53%,表明并行学习三种特征能够有效缓解长序列语义稀释问题,显著提升招聘信息抽取性能。

关键词

网络招聘广告 / 招聘信息抽取 / 并行多尺度特征学习 / 动态深度卷积网络 / 命名实体识别

Key words

引用本文

引用格式 ▾
一种基于并行多尺度特征学习的招聘信息抽取模型[J]. 山东科技大学学报(自然科学版), 2025, 44(03): 97-106 DOI:10.16452/j.cnki.sdkjzk.2025.03.010

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

110

访问

0

被引

详细

导航
相关文章

AI思维导图

/