面向不平衡多组学癌症数据的特征表征算法

吉林大学学报(工学版) ›› 2025, Vol. 55 ›› Issue (06) : 2089 -2096.

PDF
吉林大学学报(工学版) ›› 2025, Vol. 55 ›› Issue (06) : 2089 -2096. DOI: 10.13229/j.cnki.jdxbgxb.20231196

面向不平衡多组学癌症数据的特征表征算法

作者信息 +

Author information +
文章历史 +
PDF

摘要

针对癌症疾病数据结构复杂、预测困难、数据不平衡和患者隐私保护等一系列的问题,提出了一种特征表征算法ImFeatures,解决了癌症数据的不平衡问题,丰富了样本结构。联合癌症转录组和甲基化2种组学数据作为真实样本,通过逻辑回归(LR)和随机森林(RF)2种特征选择后,得到的负样本被随机划分并结合等量的正样本,输入本文提出的特征表征模型,生成学习到关键特征信息的表征样本,以提高模型预测能力。实验结果表明,在经过特征表征后的11种常见癌症数据集上,本文提出的结合特征筛选和特征表征的算法的准确率(Acc)均超过了80.00%,其中有5种癌症的预测准确率超过了95.00%,可以有效提升癌症疾病的预测准确率。

关键词

计算机应用技术 / 特征表征 / 生物信息学 / 多组学数据 / 特征筛选 / 机器学习

Key words

引用本文

引用格式 ▾
面向不平衡多组学癌症数据的特征表征算法[J]. 吉林大学学报(工学版), 2025, 55(06): 2089-2096 DOI:10.13229/j.cnki.jdxbgxb.20231196

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

48

访问

0

被引

详细

导航
相关文章

AI思维导图

/