基于距离度量的癌症预测分类算法研究

殷丽凤, 刘浩琦

大连交通大学学报 ›› 2025, Vol. 46 ›› Issue (02) : 106 -112.

PDF
大连交通大学学报 ›› 2025, Vol. 46 ›› Issue (02) : 106 -112. DOI: 10.13291/j.cnki.djdxac.2025.02.015

基于距离度量的癌症预测分类算法研究

作者信息 +

Author information +
文章历史 +
PDF

摘要

为了提高分类算法的效率及准确性,提出一种基于距离度量的二分类算法模型并应用于癌症识别领域。首先,利用k-means聚类找到数据集的聚类中心,计算每个样本点到聚类中心的曼哈顿距离、余弦相似度和马氏距离。其次,采用距离度量替换原有属性放入GBM和XGBoost分类器进行学习的方式来压缩数据属性,以减少分类器的训练压力、提高训练效率,并用训练好的模型对测试集进行预测。最后,设计3组不同训练方式进行对比试验,用分类评估标准评估模型性能,并控制参数从多个角度验证TCDM的合理性。试验结果表明,TCDM相较于其他分类模型在癌症识别领域中有更高的性能和准确率。

关键词

分类算法 / 余弦相似度 / 马氏距离 / 曼哈顿距离 / k-means聚类

Key words

引用本文

引用格式 ▾
殷丽凤, 刘浩琦 基于距离度量的癌症预测分类算法研究[J]. 大连交通大学学报, 2025, 46(02): 106-112 DOI:10.13291/j.cnki.djdxac.2025.02.015

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

101

访问

0

被引

详细

导航
相关文章

AI思维导图

/