PDF
摘要
随着机器学习和生物信息学的快速发展,癌症亚型分类成为当前研究热点之一.根据亚型的分类,可以指导癌症的治疗和预后.近年来,许多监督学习方法被用于癌症亚型分类.考虑到高维、样本数量少和数据不均衡等特点,本文首先利用LDA进行降维,其次利用SMOTE算法均衡数据,再利用Extra-Trees模型对癌症亚型进行分类,最后基于TCGA中9种癌症25种癌症亚型的3 296个样本来验证模型的有效性.实验结果表明,利用给出的模型进行癌症亚型分类具有很好的效果.
关键词
癌症亚型
/
分类
/
极端随机树
/
线性判别分析
/
SMOTE算法
Key words
基于基因表达谱的癌症亚型分类模型研究[J].
数学建模及其应用, 2021, 10(03): 23-29 DOI:10.19943/j.2095-3070.jmmia.2021.03.03