基于知识图谱与协同过滤的员工培训推荐研究

余江龙 ,  苏治文 ,  汪德超 ,  李海龙 ,  马正忠

云南民族大学学报(自然科学版) ›› 2025, Vol. 34 ›› Issue (05) : 590 -596.

PDF (1849KB)
云南民族大学学报(自然科学版) ›› 2025, Vol. 34 ›› Issue (05) : 590 -596. DOI: 10.3969/j.issn.1672-8513.2025.05.012
信息与计算机科学

基于知识图谱与协同过滤的员工培训推荐研究

作者信息 +

Research on employee training recommendation based on knowledge mapping and collaborative filtering

Author information +
文章历史 +
PDF (1893K)

摘要

针对电力系统职工培训内容泛化导致个性化推荐不足的问题,提出了一种基于知识图谱和协同过滤相结合的员工培训推荐算法.首先,根据培训岗位中的能力要求,将员工的知识点划分为6大类知识模块,计算员工的知识模块综合评分,构建员工 - 知识模块评分矩阵.同时,根据员工的职称对其进行分类,作为个性化推荐的重要标签.其次,利用培训评价一体化标准构建岗位知识图谱,并结合员工的职称和评分生成员工知识掌握图谱.最后,结合员工-知识模块评分矩阵、职称标签信息和知识掌握图谱,构建知识图谱和协同过滤相结合的员工培训推荐模型,对员工的培训内容进行个性化推荐,并利用实际培训数据进行验证.结果表明,与LDA主题模型相比,协同过滤推荐算法在各个职称人群推荐精确率、召回率和覆盖率均为最高,整体推荐精确率、召回率和覆盖率分别提升19.29、23.21和5.00个百分点,达到92.86%、94.48%和20.36%;所构建模型可有效解决数据稀疏性问题,实现对员工培训内容的个性化推荐.

Abstract

Aiming at the problem of insufficient personalized recommendation due to the generalization of staff training content in power system, a staff training recommendation algorithm based on the combination of knowledge map and collaborative filtering is proposed. First of all, according to the ability requirements of training posts, the knowledge points of employees are divided into six categories of knowledge modules, the comprehensive score of knowledge modules of employees is calculated, and the employee knowledge module scoring matrix is constructed. At the same time, employees are classified according to their professional titles as important labels for personalized recommendation.Secondly, the integrated training evalution standard is used to build a job knowledge graph, and employees' professional titles and scores are combined to generate an employee knowledge mastery graph. Finally, combined with the scoring matrix of employee knowledge module, title tag information and knowledge mastery map, an employee training recommendation model combining knowledge map and collaborative filtering was constructed, personalized recommendations were made for employee training content, and actual training data was used for verification. The results show that compared with LDA topic model, collaborative filtering recommendation algorithm has the highest recommendation accuracy, recall rate and coverage rate in each professional title group. The overall recommendation accuracy, recall rate and coverage rate are increased by 19.29, 23.21 and 5.00 percentage points, respectively, to 92.86%, 94.48% and 20.36%; The model can effectively solve the problem of data sparsity and realize the personalized recommendation of employee training content.

Graphical abstract

关键词

协同过滤 / 知识图谱 / 职称标签 / 员工培训 / 个性化推荐

Key words

collaborative filtering / knowledge mapping / title label / staff training / personalized recommendation

引用本文

引用格式 ▾
余江龙,苏治文,汪德超,李海龙,马正忠. 基于知识图谱与协同过滤的员工培训推荐研究[J]. 云南民族大学学报(自然科学版), 2025, 34(05): 590-596 DOI:10.3969/j.issn.1672-8513.2025.05.012

登录浏览全文

4963

注册一个新账户 忘记密码

随着智能电网的推进和建设,对从业人员的培训变得越来越重要.然而,当前电力系统员工培训中存在大量的培训课件以及信息碎片化的问题,不仅给培训过程带来了繁杂和不连贯的挑战,同时限制了培训的个性化程度.推荐系统可以有效解决个性化推荐不足的问题1,并在各个领域得到广泛应用.比如电影推荐2、新闻推荐3、商品推荐4和旅游推荐5等.将推荐系统引入电力系统职工培训中,可以提供个性化的培训推荐,使每个从业人员能够根据自身需求和兴趣获取到最适合的培训内容,有助于提高培训的效率和针对性,推动智能电网建设的进一步发展.
推荐算法作为推荐系统的核心,主要通过用户的历史行为和兴趣,预测用户可能感兴趣的物品或内容并推荐.常见的推荐算法包括基于内容的推荐方法、基于协同过滤的推荐方法和混合推荐方法6.基于内容的推荐算法是根据物品的特征和属性,推荐与用户历史兴趣相似的物品7;然而,有时候物品的特征描述可能并不充分,无法完全揭示物品的内在主题或概念.为了更好地理解物品之间的关联和提高推荐的准确性,可以引入主题建模技术,例如LDA主题模型.协同过滤推荐算法是根据用户历史行为和评价信息,发现用户之间的相似性和偏好,从而进行个性化的推荐;基于协同过滤的推荐方法往往存在冷启动以及稀疏性的问题8,研究者提出混合算法,把用户社交网络信息9和项目属性10等辅助信息组合起来,以进行混合推荐.知识图谱是一种用于表示和组织知识的图形化知识结构.它是由实体(如人、地点、事物)和它们之间的关系构成的网络11,将知识图谱作为一种含有丰富结构化语义知识的辅助信息12,可有效提高推荐结果的可解释性13.因此,将知识图谱与协同过滤算法相结合成为当前的研究热点.
知识图谱与协同过滤相结合主要包括3种应用方式:基于嵌入的方法、基于路径的方法和基于传播的方法14.徐孟奇等15在人岗推荐系统将知识图谱当作辅助信息,成功解决了数据稀疏性和数据冷启动问题.牛学磊等16针对推荐系统中的上述问题,在微地图推荐中引入知识图谱作为辅助信息,验证模型可推荐更感兴趣内容.金宇等17提出一种基于知识图谱的兴趣捕捉推荐算法,将语义信息和兴趣相结合,并设计实验验证该方法的有效性和可行性.张屹晗等18针对知识提取与语义结合的问题,设计了一种端到端的联合学习模型,并将结构化信息与历史偏好信息嵌入到统一的向量空间,最终实现了两者的有效结合.
上述方法在推荐系统中的应用为个性化推荐提供了更多的信息和技术支持,为推荐结果提供更多的可解释性.针对电力系统职工培训内容泛化导致个性化推荐不足的问题,本文提出一种将知识图谱与协同过滤相结合的算法,将员工知识点归整为知识模块,有效解决员工考评数据稀疏性.同时,将员工职称作为员工个性化推荐的重要特征,结合推荐结果与员工知识掌握图谱,实现员工培训内容的个性化推荐.

1 相关技术

1.1 协同过滤推荐

协同过滤推荐是一种基于用户历史行为数据的推荐算法,通过分析用户历史行为数据找到用户之间的相似性,并根据相似用户的行为给目标用户推荐物品.协同过滤推荐算法主要分为基于用户的协同过滤和基于物品的协同过滤19.

基于用户的协同过滤算法通过分析用户历史行为数据计算用户相似度,然后根据相似用户的行为为目标用户推荐物品.基于物品的协同过滤算法分析物品相似度,根据用户历史喜欢的物品推荐相似物品给目标用户.两者侧重点不同,前者注重用户相似性,后者注重物品相似性.电力系统员工培训往往依据员工历史培训及考评数据确定内容.因此,本文以员工考评数据作为用户的历史行为数据,构建基于用户的协同过滤推荐算法.基于员工考评数据的协同过滤推荐如图1所示.

1.2 LDA主题模型

在推荐系统领域,LDA是一种重要的概率生成模型,被广泛应用于主题建模任务,从而有效地挖掘隐藏信息.通过LDA模型,系统能够在保持信息精简的前提下,更深入地理解用户和物品之间的相关性,从而提供更为精准的推荐服务.相较于协同过滤推荐算法,LDA能够更全面地考量用户和物品之间的关联,提升推荐系统的准确性和个性化水平.

为此,将协同过滤推荐和LDA主题模型相对比,分别从以下2个角度进行推荐.协同过滤推荐算法基于员工考评数据中员工之间的相似性和评价历史,为员工推荐合适的培训内容;而LDA主题模型则从员工考评数据中挖掘潜在的主题信息,为员工提供更深入、个性化的推荐.

1.3 知识图谱

知识图谱是一种以图形化方式表示知识的结构.作为一个语义网络,用于描述现实世界中的实体、概念和它们之间的关系.知识图谱通过将知识元素(实体、属性、关系)以节点和边的形式进行建模,形成一个结构化的知识库.知识掌握图谱是在知识图谱的基础上在教育领域进行应用的一种技术20.知识掌握图谱可以帮助教师和学生更好地理解学科知识的结构和内在关联,辅助教学和学习过程中的知识组织、评估和个性化指导.一个简单的知识图谱及知识掌握图谱结构表征如图2所示.

图2中网状结构表示知识点之间的关系,绿色知识点表示通过,红色知识点表示未通过,需要推荐学习.当将知识掌握图谱应用于员工培训领域时,它可以帮助培训者和学员更好地理解培训内容的结构和内在关联,提供个性化的培训指导和支持.结合知识掌握图谱和协同过滤算法的推荐流程如下.

1) 数据收集:收集员工的考评数据,包括评分、学习记录、考核结果以及员工个人基本信息等.

2) 数据预处理:在数据收集完成后,对数据进行清洗,得到较为完整的考评数据.

3) 知识模块划分:根据培训岗位中的能力要求,将员工的知识点划分为6大类知识模块,并对员工的知识点综合得分进行计算,构建员工 - 知识模块评分矩阵,并利用矩阵分解技术对矩阵进行降维分析.

4) 职称分类:通过员工的职称对员工进行分类,作为个性化推荐的重要标签.

5) 岗位知识图谱构建:利用培训评价一体化标准构建岗位知识图谱.

6) 员工知识掌握图谱构建:结合员工的职称和员工 - 知识模块评分矩阵生成员工知识掌握图谱.

7) 相似度计算:利用修正的余弦相似度来计算员工之间的相似度.

8) 推荐生成:结合员工 - 知识模块评分矩阵、职称标签信息和知识掌握图谱,构建知识图谱和协同过滤相结合的员工培训推荐模型,对员工个性化推荐.

9) 推荐结果评估:利用精准率、召回率、覆盖率等评价指标评估推荐结果的质量,验证所提算法有效性.

2 框架构建

2.1 员工评分矩阵构建

依据现有培训评价一体化标准体系,将知识点评分划分为6大模块,包含安全知识(KSe)、基础知识(KB)、专业知识(KS)、安全技能(SSe)、基本技能(SB)、专业技能(SS),并依据职称将员工划分为初级、中级、高级3类.不同职称员工所需掌握知识点不同,不同职称员工知识模块综合得分计算式亦不同.以专业技能知识模块为例,3类员工综合得分计算式如式(1) ~ (3)所示.

XSS1=XSS-1-01+XSS-3-01.
XSS2=XSS-1-01+XSS-2-01+XSS-3-01.
XSS2=XSS-1-01+XSS-2-01+XSS-2-02+XSS-2-03+XSS-3-01.

式中,XSS1表示初级职称员工在该模块综合评分;XSS2表示中级职称员工在该模块综合评分;XSS3表示高级职称员工在该模块综合评分;其余表示均为专业技能模块下细分知识点,如XSS1-1-01表示模块下的知识点.

依据每个员工知识模块评分数据构建员工 - 知识模块评分矩阵,m个员工评分矩阵如式(4)所示.

X11X16Xm1Xm6.

式中,X11表示1号员工知识模块1处综合得分;X16表示1号员工知识模块6处综合得分;Xm1表示m号员工知识模块1处综合得分;Xm6表示m号员工知识模块6处综合得分;其余表示以此类推.

2.2 矩阵分解

矩阵分解是将一个矩阵分解为多个子矩阵的乘积,以便更好地理解和处理原始矩阵的信息.在推荐系统中,通过矩阵分解来降低数据的维度并提取出潜在的特征.潜在特征可以用于衡量员工之间的相似性和评价历史,进而为员工推荐适合其喜好的培训内容,提高推荐的准确性和个性化程度.矩阵分解比较常用的方法如奇异值分解.

奇异值分解(singular value decomposition,SVD)是一种重要的矩阵分解技术,主要将原始矩阵分解为左奇异矩阵、奇异值对角矩阵和右奇异矩阵3个部分.其中,左奇异矩阵包含了原始矩阵的行空间信息,右奇异矩阵包含了原始矩阵的列空间信息,而奇异值对角矩阵则包含了原始矩阵的重要特征.

SVD数学计算式式(5)所示.

A=U \ SigmaV^T.

式中,A表示原始矩阵;U表示左奇异矩阵;\Sigma表示奇异值对角矩阵;V^T表示右奇异矩阵.

2.3 修正余弦相似度

余弦相似度是一种常用的相似度度量方法,其核心是将2个向量看作是在高维空间中的2个点,它们之间的夹角越小,相似度越高.但当两个向量的分量具有不同的重要性时,余弦相似度可能会导致计算结果不准确.为解决上述问题,修正余弦相似度在余弦相似度的基础上进行修正,考虑到不同向量的分量可能具有不同的重要性,从而提高相似度的准确性.

在应用中,员工的属性信息较为稀疏,在同一部门或同一职位的员工之间,也存在很大的差异.如果使用简单的余弦相似度计算员工相似度,可能会导致计算结果不准确,从而影响员工相似度的评估.而修正余弦相似度可以有效地处理数据的稀疏性问题,并且可以考虑到不同向量分量的重要性,从而提高员工相似度的准确性.余弦相似度和修正余弦相似度计算式如式(6) ~ (7)所示.

similarity1=i=1n(Xi*Yi)/i=1n(Xi2)*i=1n(Yi2).
similarity2=i=1n(Xi-μx)*(Yi-μy)/i=1n(Xi-μx)2*i=1n(Yi-μy)2.

式中,similarity1表示余弦相似度;similarity2表示修正余弦相似度;n表示向量的维度;XiYi分别表示向量XY在第n维上的取值;μxμy分别表示向量XY在所有维度上的平均值.

2.4 知识掌握图谱构建

依据现有培训评价一体化标准体系,构建员工知识掌握图谱,知识掌握图谱构建体系如图3所示:

图3为依据员工评分矩阵结合现有考核评价体系构建的知识图谱,对知识点进行颜色标记,构建知识掌握图谱,其中绿色表示知识点已通过,红色表示知识点需要培训.

3 实验分析

3.1 数据来源

实验数据来自云南省某市供电局,数据包含员工考评数据以及该班组的KS体系岗位胜任能力培训评价一体化标准.考虑所提供数据的考评信息存在部分缺失情况,最终筛选出数据较为完整的班组员工140人.包含初级职称员工58人、中级职称员工48人以及高级职称员工34人.由于员工职称不同,所需培训内容亦存在差异,将员工职称作为员工个性化推荐的重要特征.

3.2 实验验证

实验验证流程如图4所示.

数据筛选完毕后,通过式(1) ~ (3)计算140个员工的6大知识模块评分,将评分数据汇总得到员工 - 知识模块评分矩阵.同时,参考现有培训评价一体化标准体系设定员工分数阈值为85分,用以划分员工知识模块结果是否通过.再通过SVD矩阵分解对员工 - 知识模块评分矩阵进行降维到1维、2维、3维、4维、5维进行分析,最终确定原维度保留特征最多,推荐效果最好.

在此基础上,将数据按照8∶2的比例划分训练集和测试集,并分别输入协同过滤推荐算法和LDA主题模型.其中,协同过滤算法利用修正余弦相似度计算同职称标签员工相似度,并相互推荐,输出推荐结果;LDA主题模型将同类职称标签员工输入,设定主题数量为1后,输出推荐结果.最终,将输出推荐结果利用评价指标计算,评价模型性能.

3.3 评价指标

协同过滤推荐主要利用精准率、召回率和覆盖率来评价效果.面向员工培训推荐,精准率、召回率和覆盖率计算公式定义如式(8) ~ (10)所示.

precision=TP/TP-FP.
recall=TP2+FP2/TP1-FP1.
coverage=T1/T2.

式中,precision表示精准率;recall表示召回率;coverage表示覆盖率;TP表示推荐完全准确的人数;FP表示推荐不完全准确的人数;TP1表示该人群掌握知识点总数;FP1表示该人群未掌握知识点总数;TP2FP2表示该人群所有实际推荐知识点总数;T2表示人均推荐知识模块数;T1表示知识模块总数.

3.4 实验结果对比

分别将协同过滤推荐算法和LDA主题模型推荐结果,用以计算的评价指标如表1 ~ 3所示.

将评价指标可视化如图5所示.

4 结语

提出了一种基于知识图谱和协同过滤相结合的员工培训推荐算法,根据培训岗位的能力要求将员工知识点划分为6大类知识模块,并综合考虑员工的知识点评分,结合员工的职称、评分矩阵和知识掌握图谱,实现员工培训内容的个性化推荐.结果表明,该算法能够有效解决数据稀疏性并实现精准推荐,整体推荐精确率、召回率和覆盖率达到92.86%、94.48%和20.36%.为解决电力系统职工培训内容泛化导致个性化推荐不足的问题提供了有效方法,对于提高培训的效率和针对性具有重要意义,并为相关领域的进一步研究提供参考.

未来拟从以下几个方面展开研究.

1) 考虑引入时间因素,对员工的知识掌握情况进行实时动态的更新,通过监测员工的学习进度以进一步优化推荐策略和评估指标,提高推荐的个性化程度和准确性.

2) 考虑引入员工的学习习惯、兴趣爱好、年龄、学历等多种因素,对员工进行更加细致的分类,以提升推荐算法的个性化程度和准确性.

3) 针对大规模的员工培训评价数据,后续研究考虑对不同班组进行一级标签,在同一班组内再对员工进行职称标签,最后结合不同岗位知识图谱进行推荐,以提高算法的可扩展性和适应性.

参考文献

[1]

孙传明,周炎,涂燕.基于混合协同过滤的个性化推荐方法研究[J].华中师范大学学报(自然科学版)202054(6):956 - 962.

[2]

YUAN ZLEE J HZHANG S. Optimization of the hybrid movie recommendation system based on weighted classification and user collaborative filtering algorithm[J].Complexity2021(1):4476560.

[3]

WANG HZHANG FXIE Xet al. DKN: deep knowledge - aware network for news recommendation[c]//WWW 2018 (Proceedings of the 2018 World Wide Web Conference)2018:1835 - 1844.

[4]

陈婷,朱青,周梦溪,.社交网络环境下基于信任的推荐算法[J].软件学报201728(3):721 - 731.

[5]

CHANG J LLI HBI J. Personalized travel recommendation: a hybrid method with collaborative filtering and social network analysis[J].Current Issues in Tourism202125:2338 - 2356.

[6]

ADOMAVICIUS GTUZHILIN A. Toward the next generation of recommender systems: a survey of the state - of - the - art and possible extensions[J]. IEEE transactions on knowledge and data engineering200517(6):734 - 749.

[7]

SUN ZGUO QYANG Jet al. Research commentary on recommendations with side information: a survey and research directions[J]. Electronic Commerce Research and Applications201937:100879.

[8]

MOONEY R J.Content - based book recommending using learning for text categorization[C]//Proc Acm Conference on Digital Libraries.ACM Press, 2000:195 - 204.

[9]

FAN WMA YLI Qet al. Graph neural networks for social recommendation[C]//The world wide web conference.2019:417 - 426.

[10]

DONG BZHU YLI Let al. Hybrid collaborative recommendation of co - embedded item attributes and graph features[J]. Neurocomputing2021442: 307 - 316.

[11]

SSINGHAL A. Introducing the knowledge graph: things, notstrings[EB/OL]. Google, (2012 - 05 - 16) [2024 - 03 - 04].

[12]

罗承天,叶霞.基于知识图谱的推荐算法研究综述[J].计算机工程与应用202359(1):49 - 60.

[13]

WANG HZHANG FWANG Jet al. Ripplenet: Propagating user preferences on the knowledge graph for recommender systems[C]//Proceedings of the 27th ACM international conference on information and knowledge management. 2018: 417 - 426.

[14]

赵晔辉,柳林,王海龙,.知识图谱推荐系统研究综述[J].计算机科学与探索202317(4):771 - 791.

[15]

徐孟奇,熊熙,李斌勇,.基于知识图谱的人岗推荐系统构建[J].计算机应用研究202239(1):194 - 198.

[16]

牛雪磊,杨军,闫浩文.融合知识图谱与协同过滤的微地图推荐[J].地球信息科学学报202426(4):967 - 977.

[17]

金宇,陈红梅,罗川.基于知识图谱的兴趣捕捉推荐算法[J].计算机科学202451(1):133 - 142.

[18]

张屹晗,王巍,刘华真,.基于知识图嵌入的协同过滤推荐算法[J].计算机应用研究202138(12):3590 - 3596.

[19]

焦富森,李树青.基于物品质量和用户评分修正的协同过滤推荐算法[J].数据分析与知识发现20193(8):62 - 67.

[20]

李艳燕,张香玲,李新,.面向智慧教育的学科知识图谱构建与创新应用[J].电化教育研究201940(8):60 - 69.

基金资助

中国南方电网有限责任公司科技项目(YNKJXM20230135)

AI Summary AI Mindmap
PDF (1849KB)

118

访问

0

被引

详细

导航
相关文章

AI思维导图

/