PDF
摘要
目的 介绍多元函数型混合模型(multivariate functional mixed model, MFMM)的基本原理,对多元函数型数据降维得到的主成分的可解释性提供了方法学依据。方法 MFMM对函数内的均值函数、自协方差函数和互协方差函数进行非参数化建模,明确地将所有指标共有的共享潜在过程与每个指标特有的特定的潜在过程分离开。实例分析中,以云南省肿瘤医院结直肠癌数据为例,使用MFMM提取术后12个月内纵向癌胚抗原(carcinoembryonic antigen, CEA)和糖链抗原125(carbohydrate antigen 125,CA125)的共同和特异性主成分,并结合随机生存森林预测模型对其进行解释。结果 MFMM识别出2个CEA和CA125共同主成分、5个CEA特异性成分和5个CA125特异性成分。基于所提取主成分构建的随机生存森林预测模型相比基线模型有更高的预测准确性。变量重要性分析显示,CEA第一特异性成分是仅次于临床基础变量的重要预测变量,而CA125特异性成分的重要性低于CEA,这与目前结直肠癌共识一致。结论 MFMM能较好地处理纵向测量的内部相关性和多个指标之间的相关性,捕获多个纵向测量指标随时间变化的共享过程与特异性过程,增强了模型的可解释性,具有理论和实践上的优势。
关键词
纵向数据
/
多元函数型模型
/
主成分
/
可解释性
/
结直肠癌
Key words
多元函数型混合模型及其应用[J].
中国卫生统计, 2025, 42(04): 491-495 DOI: