时变关联及遗传变异在癌症预后中的研究及价值

余亚军 ,  马露 ,  李迎腊 ,  杨兵 ,  万英 ,  杨艳 ,  邓艳

西南医科大学学报 ›› 2025, Vol. 48 ›› Issue (03) : 335 -342.

PDF (1033KB)
西南医科大学学报 ›› 2025, Vol. 48 ›› Issue (03) : 335 -342. DOI: 10.3969/j.issn.2096-3351.2025.03.019
综述

时变关联及遗传变异在癌症预后中的研究及价值

作者信息 +

Time-Varying Associations and Genetic Variations in Prognostic Studies of Cancer

Author information +
文章历史 +
PDF (1057K)

摘要

目前医学上最常用于研究疾病预后的模型是Cox比例风险(proportional hazards,PH)模型。此模型依赖于PH假设,即因子对疾病预后的效应随着时间的推移一直保持不变。但实际情况中并不是所有的研究因子都满足PH假设。已有文献报道一些临床及遗传因子并不满足PH假设,即它们具有时变关联(time-varying associations)。本文主要介绍时变关联以及其检测和研究方法,比较易混淆的时变关联变量与时变协变量(time-varying covariates)之间的差异,并总结了时变关联相关研究在发现与癌症预后相关遗传变异位点中的现状,同时探讨了其在癌症治疗和疾病管理中的价值。具时变关联的遗传变异位点可作为时变预后(如早期和/或晚期预后)的标志物。目前相关研究主要集中在结直肠癌中,在其他癌症中鲜有报道,因此结直肠癌中遗传变异的时变关联研究对其他癌症的相关研究具有指导意义。后续研究可进一步加深对遗传变异影响疾病预后机制的理解,也将有助于癌症的个性化治疗和科学管理。

Abstract

The most widely used method for prognostic data analysis is the Cox proportional hazards (PH) model. This model has the proportional hazards assumption, which is a key assumption that assumes the effect of the variable of interest remains constant over time. However, in real practice, such an assumption cannot always be satisfied. Some clinical and genetic variables have been reported to violate the PH assumption, and thus they are the variables with time-varying associations. In this manuscript, we described the time-varying associations, and briefly introduced the methods for checking the PH assumption and the models that can be used to accommodate time-varying associations. We then compared the differences between variables with time-varying associations and time-varying covariates as they are easily-confused but different terms. We further summarized the progress of studies on time-varying associations for the identification of genetic prognostic factors in cancer and discussed their values in cancer treatment and management. Studies on time-varying associations were mainly performed in colorectal cancer, and rare in other types of cancer. Future investigations on time-varying associations in other types of cancer will increase our understanding of disease prognosis and their underlying mechanisms, and contribute to personalized treatment and better management of cancer patients.

Graphical abstract

关键词

癌症 / 预后 / Cox比例风险模型 / 比例风险假设 / 时变关联

Key words

Cancer / Prognosis / Cox proportional hazards model / Proportional hazards assumption / Time-varying associations

引用本文

引用格式 ▾
余亚军,马露,李迎腊,杨兵,万英,杨艳,邓艳. 时变关联及遗传变异在癌症预后中的研究及价值[J]. 西南医科大学学报, 2025, 48(03): 335-342 DOI:10.3969/j.issn.2096-3351.2025.03.019

登录浏览全文

4963

注册一个新账户 忘记密码

准确预测患者的预后对于疾病的有效管理至关重要[1]。目前绝大部分的预后因子是不随时间变化的稳定效应因子,使用这些因子不能有效预测患者的动态预后。具时变关联(time-varying associations)的因子是一类对疾病预后的效应在不同时间点/段上不同的因子[2-3],可用于预测患者动态预后并指导疾病管理,但目前对这类因子的研究并不多,值得深入研究。在研究方法层面,目前医学领域中常用的预后分析模型--Cox比例风险(proportional hazards,PH)模型[4-6]并不适用于研究具时变关联的因子与疾病预后间的关联[7]。模型的不当使用可导致错失发现新的具时变关联的因子,或对因子效应值的估计出现偏差,从而得出错误的结论。本文介绍了时变关联的相关概念,并总结了可进行时变关联分析的模型及特点。
当前,影响癌症预后的遗传因素并未完全阐明[8-9],仍然存在着“遗传力缺失”的现象[10-11]。造成这种现象的原因包括某些遗传变异尚未被发现[12]、对结构性遗传变异的研究较少[13-14]、样本量不足以及表观遗传的作用未完全阐明[11,15]等。此外,未使用正确的模型/方法对遗传变异因子进行时变关联分析,也是造成遗传力缺失的隐蔽原因之一。本文就遗传变异在癌症预后中时变关联的研究现状进行了总结,同时探讨了其在癌症相关科学研究、疾病治疗和管理中的价值。

1 PH假设与时变关联

1.1 PH假设

PH假设是Cox比例风险模型的关键假设之一。它表示某个变量的两组间风险比(hazard ratio,HR)一直维持不变,即变量与预后之间的关联一直保持不变,与随访时间无关。在数学上,Cox比例风险模型可表示为:h(t|x)=h0(t)eb1x1+b2x2+...+bmxm。其中h(t|x)是风险(hazard)函数,表示病患在时间t时预后事件(如死亡)发生的风险; h0(t)是基线风险(baseline hazard)函数,它从研究数据直接估计而来,可用于表示患者在基线水平时预后事件的瞬时风险;X1, X2,…, Xm是模型中的变量;b1, b2, …, bm为相应变量的系数。

在Cox比例风险模型中,变量与预后的关联强度的评价指标(或效应值)是风险比HR。对于给定的一个变量Xn来说,在其他变量取值不变的情况下,其对疾病预后的HR = h(t|x)/h0(t) = exp(bn)。由于exp(bn)是一个与时间无关的常量,因而变量Xn与疾病的关联是一个恒定的效应量,这也意味着h(t|x)与h0(t)的比值一直保持不变,即它们是比例风险。PH假设也因此得名。

1.2 PH假设检验用于发现具时变效应的候选因子

在实际情况中,有些因子与疾病预后的关联并非一直保持不变。由于Cox比例风险模型的使用要求满足PH这一关键假设,因此可利用此模型,对所研究因子的PH假设进行检测,从而判断此因子是否可能具有时变效应。在R语言中,可使用cox.zph函数对PH假设进行统计检验(图1)。cox.zph函数使用的是一种基于Schoenfeld残差的Goodness-of-fit检验,检验的是残差与生存时间之间的相关性[2,16-17]。当两者之间不相关时,则表明满足PH假设;若相关,则不满足PH假设。除此之外,也可以使用图形方法直观地进行检测,如log[-log(S(t))]图形法(图2)以及基于Schoenfeld残差的图形法(图3)(仅需将cox.zph函数对象作为plot函数的输入即可获得,但此法本质上与cox.zph函数的Goodness-of-fit检验方法并无二致,因而不再加以讨论)。这些检测后不满足PH假设的因子,则为具时变效应的候选因子。

2 具时变效应的因子与时变协变量

医学统计学中,具时变效应的因子(factors with time-varying associations)也通常被称为具时变效应的变量(variables with time-varying associations)。一个与具时变效应的变量容易混淆的概念是时变协变量(time-varying covariates或time-dependent covariates)。二者虽然在字面上相似,但却是完全不同的概念。前者是指一个仅含单次测量值的变量,其在随访的不同时间里与疾病预后的关联程度不同;而时变协变量是在不同时间点多次测量得到含多个测量值的变量,是一个时间序列的变量,通常其与疾病预后的关联程度保持不变(与时间无关)[2-3]。因此,二者是截然不同的变量类型,在分析和研究中需注意区分。目前,大部分时变相关的研究集中在时变协变量上,对具时变关联变量的相关研究较少。

目前部分研究在变量不满足PH假设时仍然可以通过将其构建成时变协变量的方式来应对,如CANDIDO-DOS-REIS等[19]发现在乳腺癌中BRCA1BRCA2基因的突变不满足PH假设,故而在数学上将其构建成时变协变量的形式,但实际上还是BRCA1BRCA2的突变状态与疾病预后的关联随时间的变化而变化,即它们仍然属于具时变关联的变量。由于具时变关联的变量与时变协变量的意义完全不同,在使用模型分析后,对结果的解释也是完全不同的。不过,它们都将效应或变量的变化考虑在模型之内,因而二者都有助于更精准地预测疾病的预后风险模式。

两种变量对应解释疾病预后变化的原因是不同的。具时变关联的变量本身取值不发生变化(如性别),其与疾病预后的关联随时间的变化而变化。部分原因是这些变量在疾病进展的不同阶段产生/发挥的效应不同,或者是被研究群体本身随着时间推移其预后相关性质在发生改变(如年龄在随访不同时间段里与疾病预后的关联程度不同,可能是由于随着预后时间的增加,所研究群体的年龄也在增加,其对预后的效应也随之发生改变[20])。当然,具体导致时变关联的原因还有待进一步探索和阐明。与具时变关联的变量不同,时变协变量与疾病预后的关联通常保持不变,疾病预后的变化通常是由于在不同时间阶段变量本身发生变化所致的。它们作为预后标志物时,具时变关联的变量经一次检测/测量便可对疾病预后做出判断,而时变协变量通常进行多次测量,随时根据测量值对预后风险进行评估[21]。不过,二者都有助于更为精准地预测疾病预后。

3 生存分析中可用于研究时变关联的模型

当某个因子经PH检测可能为具时变关联的因子后,需使用合适的模型研究其与疾病预后间关联。在此种情况下Cox比例风险模型不再为合适的模型,需选用其他的模型进行分析。这些备选模型可大致分为非参数、半参数和参数模型3类。本文将对这3类常见模型进行简要介绍。此外,还将简要介绍近年来发展迅速的人工智能模型。

3.1 非参数模型:Aalen加性模型

Cox比例风险模型是一种乘法模型,而Aalen加性模型是一种适应时变关联性质的加性模型(additive model with time-varying associations)[22-24]。在此模型中的效应值是风险差(risk difference),而不是风险比(hazard ratio or risk ratio)。Aalen加性模型如下:

h(t) = b0(t) + b1(t)x1 + …+ bm(t)xm

在此模型中,因子的系数bi(t),i = 0, 1, 2, 3, …,m为时间的函数,可随时间的变化而变化。因此该模型可用于对PH假设不满足因子的建模。

还有一些模型结合了Cox比例风险模型和Aalen加性模型[25],或者是Cox比例风险模型与Logistic模型[26],用这种方式来分析PH假设不满足因子与疾病预后间的关系。不过这些模型不再是非参数模型,而且这些模型也将会变得更加复杂。

3.2 半参数模型:改进的Cox比例风险模型

改进的Cox比例风险模型主要包括分层Cox PH模型(stratified Cox PH model)[27-28]和具时变参数的Cox PH模型(Cox PH model with time-varying coefficients)[3,29]。与Cox比例风险模型一样,它们仍然是半参数模型。

分层Cox PH模型只适用于分类因子(变量)。简而言之,此模型将不满足PH假设的因子在模型中分层。对于这个因子的不同层(strata),给予不同的基线风险函数[即h0(t)],但是对于其他满足PH假设的因子来说,它们与疾病预后的关联在不同的层中保持一致[27-28]。这个模型的主要缺点之一是对分层的因子不能进行其与疾病关联效应量(即HR)的估计;另外,对于连续型变量来说也不适用,除非将连续型变量依据某个规则转换成分类变量,但这种操作容易导致部分变量信息的丢失。

具时变参数的Cox PH模型是Cox比例风险模型的另一个变体。在此模型中,对不满足PH假设的变量Xn的系数看成是一个时间的函数[3,29],如bn*f(t)。此时,HR = ebn*f(t)也成了一个关于时间的函数,以拟合变量Xn与疾病预后关联的变化[3,29]。特别地,当f(t)是一个以时间点T分隔的函数时

bn*f(t) = b1,t<Tb2,tT

此时,

HR(t) = HR1,t<THR2,tT

表示在时间点T之前,Xn与疾与病预后关联的风险比为HR1;在时间点T及之后,Xn与疾病预后关联的风险比为HR2。换言之,Xn在不同时间段内与疾病预后有着不同程度的关联。

当f(t)为连续型函数时,则HR = bn*f(t)也是一个连续型函数[3,29]。此时,可计算在任意时间点T上对应的Xn与疾病预后关联的效应值。

此外,前文提到的结合了Cox比例风险模型和Aalen加性模型[25],或是结合了Cox比例风险模型与Logistic模型的mixture cure模型[26]在一定意义上也属于半参数的改进Cox比例风险模型。需要注意的是,PH假设不满足的因子在混合模型里也未必一定能满足PH假设。因此,基于Cox比例风险模型的混合模型并不能保证可作为PH假设不满足后的备选模型。

3.3 参数模型:加速失效时间模型

不同于Cox比例风险模型及其改进模型,加速失效时间模型(accelerated failure time model,AFT模型)是完全的参数模型[30]。在AFT模型中,基线风险函数h0(t)是依据特定理论分布的,如exponential、Weibull、log-logistic以及lognormal分布[30-31]表1)。通常情况下,AFT模型不依赖于PH假设,因此会被当成PH假设不成立时的备选模型。但是,并非所有AFT模型均可成为备选模型,比如在exponential和Weibull的模型中,当AFT假设满足时,也自动满足了PH假设[32]。AFT假设是AFT模型中的关键假设之一,它表示特定因子对生存时间的加速和减速是一个固定的量,这个量通常被称为加速失效因子(accelerated failure factor)[32-33]。使用加速失效时间模型的难点之一是选择生存时间的合适分布,这也决定了其基线风险函数h0(t)[34]。通常认为这种选择需要具备一定的关于所研究疾病病人生存时间的知识[35],虽然通过goodness-of-fit检验也能够比较出具体哪个分布更为合适,但真实分布如何却不易判断[35-36]。总体而言,虽然AFT模型在稳健性上稍逊于半参数的Cox比例风险模型(因参数模型的假设更多),但在PH假设不满足时可不受影响进行分析,是主要的备选模型之一。

3.4 人工智能模型

近年来随着人工智能的发展,疾病预后相关研究有了新的方法[37-38]。人工智能,尤其是支持向量机、随机森林生存模型以及神经网络等模型不依赖于特定的某个理论分布,因此相对而言模型依赖的假设更少,因而在处理特定问题上更有优势。在PH假设不满足时,人工智能模型可用于预后数据的分析[39-41]。常见的可用于生存分析的人工智能模型包括支持向量机、朴素贝叶斯、生存树、集成学习模型和神经网络(包括深度学习)[40-42],见表2

支持向量机的基本原理在于找到一个超平面将不同类别的数据最大程度地分开[43]。基于支持向量机的生存分析方法可以预测预后风险或生存时间(可使用R语言中的survivalsvm包实现)[44]。朴素贝叶斯是一种基于贝叶斯定理的分类方法,其中某些变体,如删失朴素贝叶斯(censored naive bayes)能够处理删失数据,因而可用于进行生存分析及预后风险预测[45]。生存树是一种可处理预后数据中删失数据(censored data)的决策树,可从复杂数据中总结出决策规则并以树状图展示出来[46]。集成学习模型利用基本模型单元(如生存树)集成式地进行最优模型的确定,其在生存分析中常用的模型有随机生存森林模型和极致梯度提升机(xGboost)。随机生存森林模型通过生成一系列独立的生存树,再经个体树加权表决出最终的预测结果[47]。不同于随机生存森林模型,极致梯度提升机则能串联多个生存树,且每棵树基于前一棵树的残差训练生成(逐步减少残差),从而达到提升模型预测精度的目的[48]。神经网络是人脑神经网络的一种计算机模拟,通过不同层的信号传导和自动特征提取,最终获得包含大量参数的高准确性预测模型[49-50];深度学习是神经网络的一种,通常指具有4层以上的神经网络[49,51]

以上人工智能模型在算法上均可探索非线性相关性,也都不依赖于PH假设[52-54]。虽然有报道在某些情况下(如数据量较小时)传统统计模型并不逊色甚至优于人工智能模型[55-56],但通常认为人工智能模型在预测能力上强于传统模型[41,57-58]。但是,人工智能模型也存在缺点,目前尚不能完全替代传统的生存分析方法(如Cox比例风险模型)。例如,人工智能模型,尤其是深度学习模型参数众多,输入因子与疾病预后之间的关联方式异常复杂因而极难被理解与解释(“黑匣子”)[59]。因此,虽然人工智能模型的预测效果通常较传统统计模型更佳,但其解释性更差,这对许多人(包括临床医生)来说是一种困扰或担忧,且人工智能相关的医学伦理等方面的内容仍有待完善。就疾病预后分析这一特定领域而言,虽然很多人工智能模型可以规避PH假设,但目前大多人工智能模型应用于生存结局的预测,而不是变量与预后关联模式的发现[60]。因此,某个特定因子(如遗传变异位点)与疾病预后的时变关联可能并不易被人工智能模型很好地揭示出来。因此,短期内,传统统计模型仍将持续在疾病预后相关研究中存在和使用。但人工智能作为一项新的迅速发展的技术,突破了传统统计模型各类假设的限制,可自行学习数据背后潜在的关联模式,且能处理常规统计模型较难处理的高维度以及具复杂相互作用的数据,在疾病预后分析和预测领域前景广阔。如上述不足,尤其是模型在解释性方面的缺陷,能得到进一步改善甚至是彻底解决,人工智能模型极有可能成为未来研究时变关联的主要工具之一。目前,已有研究开发了具可解释性的人工智能深度学习技术,以研究不同临床因子与疾病预后间的关联[40,61]。当PH假设不满足时可选用的部分备选模型及其特点总结如表2所示。

4 遗传变异位点在癌症预后中的时变关联研究及其价值

在许多复杂疾病中,包括散发性的癌症,目前发现的遗传变异因子不能完全解释遗传对于疾病预后的影响,这种现象被称为遗传力缺失[10-11]。部分原因可能是表观遗传对于疾病预后的影响尚未完全阐明;另一方面,一些具有时变关联的遗传变异因子也常常因PH假设检验的不满足而被GWAS等研究忽略[62],导致它们未被发现,其对疾病预后的影响和作用也未得到阐明。因此,对遗传变异因子时变关联的研究对于解释遗传力缺失具有重要意义。同时,也有助于深入了解影响疾病的预后机制,助力于疾病管理和药物研发。

目前有不少癌症相关研究使用前文所述的不同模型探索临床因子与疾病预后的时变关联[3,7,20,63-70],但在遗传变异因子方面,目前通常仅使用具时变参数的Cox PH模型进行分析(表3),尚缺乏更多、更新的探索。

已有几项关于结直肠癌的研究发现了部分具有时变关联的遗传变异位点。PAVELITZ等[71]发现体细胞突变与疾病预后具有时变关联;WERDYANI等[72]发现了3个结构性遗传变异位点在疾病诊断约3 ~ 4年之内与结直肠癌预后具有显著关联(之后关联方向改变或没有相关性);此外,PENNEY等[73]发现的遗传变异位点rs5749032与结直肠癌预后不符合PH假设,采用mixture cure模型分析发现它们之间具有显著关联性;YU等[74]的全基因组关联性研究也发现部分SNP不满足PH假设,并且其中一些SNP可能具有时变关联(5年之内和之后与疾病预后的关联不同)。由于5年后预后事件数目较少,因而这种时变关联有待在更大的数据中进一步验证。除结直肠癌外,在卵巢癌和头颈癌中,也有遗传变异位点被发现具有时变关联(表3)。值得注意的是,这些遗传变异位点中,有些是使用传统的Cox比例风险模型不能鉴定和发现的。如rs5749032与MFS在使用Cox比例风险模型分析时P值大于0.05[HR = 1.09 (95% CI: 0.57 ~ 2.10), P = 0.80],显示无相关性,但实际上使用合适的模型后发现它们之间是具有相关性的[73]。研究表明,对PH假设进行检验以及使用正确的模型有助于发现新的与疾病预后相关的遗传变异位点。这有利于进一步增强对遗传力缺失的解释,发掘新的可用于精准预测预后的标志物,同时也有助于深入了解影响疾病的预后机制,进而利于治疗药物的开发和设计。

对遗传变异时变关联的研究除了能找到新的与预后关联的位点及加深对疾病预后的认识和了解外,在其他领域也具有十分重要的意义。如在近年热点孟德尔随机试验中,作为随机分组基础和依据的遗传变异因子在许多设计中默认其与暴露因素间的关联一直保持不变[76]。但这种假设并非完全符合实际,故而可能会影响试验设计本身的合理性和结论的可靠性。因此,已有一些研究提出遗传变异的时变关联可能对孟德尔临床试验产生影响[77-78]。尽管相关研究不多,但已然凸显了时变关联在相关研究和试验设计中的重要性。此外,除了遗传变异位点以外,基因的表达与癌症预后也具有时变关联[79-81]

5 小结与展望

时变关联在包括癌症在内的疾病管理中具有重要作用。癌症患者在术后的不同时间(如早期和晚期)的预后事件风险可由具时变关联的因子/标志物来进行预测。目前对遗传因子和癌症预后的关联研究大部分仍集中于简单的恒定关联性研究,对于时变关联的研究较少,未来其在相关领域具有广阔的研究空间。本文强调了在使用Cox比例风险模型进行生存分析前检测PH假设的重要性及介绍了具体的检测方法,并总结了当PH假设不满足时进行时变关联研究的方法及相应的使用条件和注意事项。此外,在癌症预后方面总结了当前不同癌症中遗传因子的时变关联研究结果,表明在不同癌症的不同预后类型中,遗传因子的时变关联都是存在的,并指出了其在预后的精准预测及孟德尔随机化试验设计中的作用。未来除了可继续研究遗传因子与癌症的时变关联及其作为预后标志物的价值外,其他类型的变量如基因的表达和可变剪接等也有待进一步开展其与癌症预后间非恒定关系的研究。当前对遗传因子的研究可用于指导这些变量的时变关联研究,从而发现和鉴定更多具时变关联的因子,这将有助于患者疾病的个性化治疗和有效的疾病管理。此外,阐明时变关联的相关机制和原理有助于加深对疾病预后的认识和理解,最终为疾病的预后预测和药物的开发设计提供理论基础。因此,对遗传因子/变异在癌症预后中的时变关联研究意义重大,具有现实的理论及临床价值。

参考文献

[1]

常紫薇, 刘辉, 张秋萌, . 胃肠道癌症预后预测模型研究进展[J]. 华北理工大学学报(医学版), 2020, 22(5): 416-420.

[2]

THERNEAU T, CROWSON C, CLINIC M. Using time dependent covariates and time dependent coefficients in the cox model[J]. Red, 2012.

[3]

ZHANG ZH, REINIKAINEN J, ADELEKE KA, et al. Time-varying covariates and coefficients in Cox regression models[J]. Ann Transl Med, 2018, 6(7): 121.

[4]

张若昕, 叶紫岚, 翁俊勇, . 高龄与Ⅱ期结直肠癌患者预后不良的相关性研究[J]. 中国癌症杂志, 2024, 34(5): 485-492.

[5]

赵欢欢, 张国川. 基于GEO数据库鉴定ADIPOQ为脂肪肉瘤预后良好的生物标志物[J]. 数理医药学杂志, 2024, 37(5): 341-348.

[6]

COX DR. Regression models and life-tables[J]. J R Stat Soc Ser B Methodol, 1972, 34(2): 187-202.

[7]

BELLERA CA, MACGROGAN G, DEBLED M, et al. Variables with time-varying effects and the cox model: some statistical concepts illustrated with a prognostic factor study in breast cancer[J]. BMC Med Res Methodol, 2010, 10: 20.

[8]

和昱辰, 刘家云. 基因位点检测在老年常见复杂疾病风险评估及个体化干预中的应用[J/OL]. 中国医学前沿杂志(电子版), 2024, 16(1): 84-91.

[9]

吕智涵, 姬云熙. 复杂疾病遗传学研究综述[J]. 黑龙江医学, 2022, 46(7): 884-888.

[10]

杨胜杰. 非亲缘HapMap个体中全基因组eQTL和基因表达水平的遗传力分析[D]. 上海: 复旦大学, 2012.

[11]

MANOLIO TA, COLLINS FS, COX NJ, et al. Finding the missing heritability of complex diseases[J]. Nature, 2009, 461(7265): 747-753.

[12]

张洁, 胡伟国, 宋启斌. 单核苷酸多态性的遗传变异与结直肠癌相关性研究进展[J]. 肿瘤学杂志, 2023, 29(8): 646-651.

[13]

戴莉莉, 曹毅, 吕桂芬. 基于癌症基因组图谱数据库探索直肠癌拷贝数变异驱动基因及其功能通路[J]. 海军医学杂志, 2019, 40(6): 526-529.

[14]

童昕, 王涛, 黄永周, . 胃的胃肠间质瘤患者基因突变状态及预后分析[J]. 肿瘤, 2022, 42(10): 673-680.

[15]

PETERS U, BIEN S, ZUBAIR N. Genetic architecture of colorectal cancer[J]. Gut, 2015, 64(10): 1623-1636.

[16]

THERNEAU TM, GRAMBSCH PM. Modeling survival data: extending the Cox model[M]. New York: Springer, 2000.

[17]

GRAMBSCH PM, THERNEAU TM. Proportional hazards tests and diagnostics based on weighted residuals[J]. Biometrika, 1994, 81(3): 515-526.

[18]

CHEN YT, SHAO ZY, CHEN W, et al. A varying-coefficient cox model for the effect of CA19-9 kinetics on overall survival in patients with advanced pancreatic cancer[J]. Oncotarget, 2017, 8(18): 29925-29934.

[19]

CANDIDO-DOS-REIS FJ, SONG HL, GOODE EL, et al. Germline mutation in BRCA1 or BRCA2 and ten-year survival for women diagnosed with epithelial ovarian cancer[J]. Clin Cancer Res, 2015, 21(3): 652-657.

[20]

YU YJ, CAREY M, POLLETT W, et al. The long-term survival characteristics of a cohort of colorectal cancer patients and baseline variables associated with survival outcomes with or without time-varying effects[J]. BMC Med, 2019, 17(1): 150.

[21]

邹霞, 张磊, 凌莉. 应用含时依协变量Cox回归模型探讨美沙酮维持治疗者HCV阳转危险因素[J]. 中国卫生统计, 2015, 32(3): 390-392.

[22]

AALEN O. A model for nonparametric regression analysis of counting processes[M]//Mathematical Statistics and Probability Theory. New York, NY: Springer New York, 1980: 1-25.

[23]

BAŞAR E. Aalen’s additive, cox proportional hazards and the cox-aalen model: application to kidney transplant data[J]. Sains Malays, 2017, 46(3): 469-476.

[24]

XIE XH, STRICKLER HD, XUE XN. Additive hazard regression models: an application to the natural history of human papillomavirus[J]. Comput Math Methods Med, 2013, 2013: 796270.

[25]

SCHEIKE TH, ZHANG MJ. An additive–multiplicative cox–aalen regression model[J]. Scand J Stat, 2002, 29(1): 75-88.

[26]

AMICO M, VAN KEILEGOM I. Cure models in survival analysis[J]. Annu Rev Stat Appl, 2018, 5: 311-342.

[27]

KLEIN JP, MOESCHBERGER ML. Refinements of the semiparametric proportional hazards model[M]//Survival Analysis. New York, NY: Springer New York, 2003: 295-328.

[28]

KLEINBAUM DG, KLEIN M. The stratified cox procedure[M]//Survival Analysis. New York, NY: Springer New York, 2011: 201-240.

[29]

THOMAS L, REYES EM. Tutorial: survival estimation for cox regression models with time-varying coefficients UsingSASandR [J]. J Stat Soft, 2014, 61(Code Snippet 1): 1-23.

[30]

KLEIN JP, MOESCHBERGER ML. Inference for parametric regression models[M]//Survival Analysis. New York, NY: Springer New York, 2003: 393-423.

[31]

VAN WIJK RC, SIMONSSON USH. Finding the right hazard function for time-to-event modeling: a tutorial and Shiny application[J]. CPT Pharmacometrics Syst Pharmacol, 2022, 11(8): 991-1001.

[32]

KLEINBAUM DG, KLEIN M. Survival analysis: a self-learning text[M]. 3rd ed. New York, NY: Springer, 2012.

[33]

JAMES I. Accelerated Failure-time Models[M]//Balakrishnan N, Colton T, Everitt B, et al. Wiley StatsRef: Statistics Reference Online. Chichester, UK: John Wiley & Sons, Ltd, 2014: stat06002.

[34]

ORBE J, FERREIRA E, NÚÑEZ-ANTÓN V. Comparing proportional hazards and accelerated failure time models for survival analysis[J]. Stat Med, 2002, 21(22): 3493-3510.

[35]

HOSMER DW, LEMESHOW S, MAY S. Parametric Regression Models[M]//Applied Survival Analysis: regression modeling of time-to-event data. Hoboken, NJ, USA: John Wiley & Sons, Inc., 2011: 244-285.

[36]

BALAKRISHNAN N, CHIMITOVA E, GALANOVA N, et al. Testing goodness of fit of parametric AFT and PH models with residuals[J]. Commun Stat Simul Comput, 2013, 42(6): 1352-1367.

[37]

高凯绩, 王一豪, 曹海坤, . 机器学习模型和Cox回归模型预测食管胃结合部腺癌预后的效能[J]. 南方医科大学学报, 2023, 43(6): 952-963.

[38]

张圣海. 基于医学影像--基因人工智能模型的生存分析[D]. 中国科学院大学, 2021.

[39]

CHI CL, NICK STREET W, WOLBERG WH. Application of artificial neural network-based survival analysis on two breast cancer datasets[J]. AMIA Annu Symp Proc, 2007, 2007: 130-134.

[40]

WANG ZW, LEE JW, CHAKRABORTY T, et al. Survival modeling using deep learning, machine learning and statistical methods: a comparative analysis for predicting mortality after hospital admission[EB/OL]. 2024: 2403.06999.

[41]

WIEGREBE S, KOPPER P, SONABEND R, et al. Deep learning for survival analysis: a review[J]. Artif Intell Rev, 2024, 57(3): 65.

[42]

ADEOYE J, HUI LL, KOOHI-MOGHADAM M, et al. Comparison of time-to-event machine learning models in predicting oral cavity cancer prognosis[J]. Int J Med Inform, 2022, 157: 104635.

[43]

GUIDO R, FERRISI S, LOFARO D, et al. An overview on the advancements of support vector machine models in healthcare applications: a review[J]. Information, 2024, 15(4): 235.

[44]

FOUODOCJK, KÖNIGIR, WEIHSC, et al. Support vector machines for survival analysis with R[J]. R J, 2018, 10(1): 412.

[45]

WOLFSON J, BANDYOPADHYAY S, ELIDRISI M, et al. A Naive Bayes machine learning approach to risk prediction using censored, time-to-event data[J]. Stat Med, 2015, 34(21): 2941-2957.

[46]

BOU-HAMAD I, LAROCQUE D, BEN-AMEUR H. A review of survival trees[J]. Statist Surv, 2011, 5: 44-71.

[47]

ISHWARAN H, KOGALUR UB, BLACKSTONE EH, et al. Random survival forests[J]. Ann Appl Stat, 2008, 2(3): 841-860.

[48]

CHEN TQ, GUESTRIN C, CHEN TQ, et al. XGBoost[C]//Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. August 13 - 17, 2016, San Francisco, California, USA. ACM, 2016: 785-794.

[49]

CHOI RY, COYNER AS, KALPATHY-CRAMER J, et al. Introduction to machine learning, neural networks, and deep learning[J]. Transl Vis Sci Technol, 2020, 9(2): 14.

[50]

DEVORE R, HANIN B, PETROVA G. Neural network approximation[J]. Acta Numer, 2021, 30: 327-444.

[51]

SARKER IH. Deep learning: a comprehensive overview on techniques, taxonomy, applications and research directions[J]. SN Comput Sci, 2021, 2(6): 420.

[52]

RAJULA HSR, VERLATO G, MANCHIA M, et al. Comparison of conventional statistical methods with machine learning in medicine: diagnosis, drug development, and treatment[J]. Medicina (Kaunas), 2020, 56(9): 455.

[53]

BENDER A, RÜGAMER D, SCHEIPL F, et al. A general machine learning framework for survival analysis[M]//Machine Learning and Knowledge Discovery in Databases. Cham: Springer International Publishing, 2021: 158-173.

[54]

KANTIDAKIS G, HAZEWINKEL AD, FIOCCO M. Neural networks for survival prediction in medicine using prognostic factors: a review and critical appraisal[J]. Comput Math Methods Med, 2022, 2022: 1176060.

[55]

KOLASSERI AE, B V. Comparative study of machine learning and statistical survival models for enhancing cervical cancer prognosis and risk factor assessment using SEER data[J]. Sci Rep, 2024, 14(1): 22203.

[56]

KANTIDAKIS G, PUTTER H, LITIÈRE S, et al. Statistical models versus machine learning for competing risks: development and validation of prognostic models[J]. BMC Med Res Methodol, 2023, 23(1): 51.

[57]

STEELE AJ, DENAXAS SC, SHAH AD, et al. Machine learning models in electronic health records can outperform conventional survival models for predicting patient mortality in coronary artery disease[J]. PLoS One, 2018, 13(8): e0202344.

[58]

WANG P, LI Y, REDDY CK. Machine learning for survival analysis: a survey[J]. ACM Comput Surv, 2019, 51(6): 1-36.

[59]

LONDON AJ. Artificial intelligence and black-box medical decisions: accuracy versus explainability[J]. Hastings Cent Rep, 2019, 49(1): 15-21.

[60]

刘玥, 刘启玲, 苏海霞, . 机器学习法在生存分析中的应用研究[J]. 预防医学, 2024(6): 496-500.

[61]

YANG CH, MOI SH, HOU MF, et al. Applications of deep learning and fuzzy systems to detect cancer mortality in next-generation genomic data[J]. IEEE Trans Fuzzy Syst, 2021, 29(12): 3833-3844.

[62]

任南, 吕雪洁, 何陈周, . 胃癌预后全基因组关联分析[J]. 中国公共卫生, 2023, 39(2): 151-157.

[63]

BAULIES S, BELIN L, MALLON P, et al. Time-varying effect and long-term survival analysis in breast cancer patients treated with neoadjuvant chemotherapy[J]. Br J Cancer, 2015, 113(1): 30-36.

[64]

NATARAJAN L, PU MY, PARKER BA, et al. Time-varying effects of prognostic factors associated with disease-free survival in breast cancer[J]. Am J Epidemiol, 2009, 169(12): 1463-1470.

[65]

GRAY RJ. Flexible methods for analyzing survival data using splines, with applications to breast cancer prognosis[J]. J Am Stat Assoc, 1992, 87(420): 942-951.

[66]

ROGOZ B, DE L’AULNOIT AH, DUHAMEL A, et al. Thirty-year trends of survival and time-varying effects of prognostic factors in patients with metastatic breast cancer-a single institution experience[J]. Clin Breast Cancer, 2018, 18(3): 246-253.

[67]

RAKOVITCH E, SUTRADHAR R, HALLETT M, et al. The time-varying effect of radiotherapy after breast-conserving surgery for DCIS[J]. Breast Cancer Res Treat, 2019, 178(1): 221-230.

[68]

MAZROUI Y, MAUGUEN A, MATHOULIN-PÉLISSIER S, et al. Time-varying coefficients in a multivariate frailty model: Application to breast cancer recurrences of several types and death[J]. Lifetime Data Anal, 2016, 22(2): 191-215.

[69]

ATAEE DIZAJI P, VASHEGHANI FARAHANI M, SHEIKHALIYAN A, et al. Application of additive hazards models for analyzing survival of breast cancer patients[J]. J Res Med Sci, 2020, 25: 99.

[70]

朱晶晶, 余勇夫, 许慧琳, . 高血压患者中基线体质量指数对癌症发病的时变影响[J]. 中国医院统计, 2021, 28(3): 193-199.

[71]

PAVELITZ T, RENFRO L, FOSTER NR, et al. MRE11-deficiency associated with improved long-term disease free survival and overall survival in a subset of stage Ⅲ colon cancer patients in randomized CALGB 89803 trial[J]. PLoS One, 2014, 9(10): e108483.

[72]

WERDYANI S, YU YJ, SKARDASI G, et al. Germline INDELs and CNVs in a cohort of colorectal cancer patients: their characteristics, associations with relapse-free survival time, and potential time-varying effects on the risk of relapse[J]. Cancer Med, 2017, 6(6): 1220-1232.

[73]

PENNEY ME, PARFREY PS, SAVAS S, et al. A genome-wide association study identifies single nucleotide polymorphisms associated with time-to-metastasis in colorectal cancer[J]. BMC Cancer, 2019, 19(1): 133.

[74]

YU YJ, WERDYANI S, CAREY M, et al. A comprehensive analysis of SNPs and CNVs identifies novel markers associated with disease outcomes in colorectal cancer[J]. Mol Oncol, 2021, 15(12): 3329-3347.

[75]

ZHONG SL, NUKUI T, BUCH S, et al. Effects of ERCC2 Lys751Gln (A35931C) and CCND1 (G870A) polymorphism on outcome of advanced-stage squamous cell carcinoma of the head and neck are treatment dependent[J]. Cancer Epidemiol Biomarkers Prev, 2011, 20(11): 2429-2437.

[76]

陈鹏宇, 黄荷, 朱兴旺, . 饮食习惯与日本人群肝癌风险的因果关系[J]. 西部医学, 2023, 35(6): 910-915.

[77]

LABRECQUE JA, SWANSON SA. Interpretation and potential biases of mendelian randomization estimates with time-varying exposures[J]. Am J Epidemiol, 2019, 188(1): 231-238.

[78]

JACHNO K, HERITIER S, WOLFE R. Are non-constant rates and non-proportional treatment effects accounted for in the design and analysis of randomised controlled trials? A review of current practice[J]. BMC Med Res Methodol, 2019, 19(1): 103.

[79]

BROËT P, KUZNETSOV VA, BERGH J, et al. Identifying gene expression changes in breast cancer that distinguish early and late relapse among uncured patients[J]. Bioinformatics, 2006, 22(12): 1477-1485.

[80]

CHEN QX, YANG YZ, LIANG ZZ, et al. Time-varying effects of FOXA1 on breast cancer prognosis[J]. Breast Cancer Res Treat, 2021, 187(3): 867-875.

[81]

ZENG ZH, GAO YP, LI JL, et al. Violations of proportional hazard assumption in Cox regression model of transcriptomic data in TCGA pan-cancer cohorts[J]. Comput Struct Biotechnol J, 2022, 20: 496-507.

基金资助

四川省科技厅青年基金项目(2023NSFSC1894)

四川省科技计划联合创新专项(2022YFS0614)

西南医科大学重点项目(2023 ZD006)

大学生创新创业训练计划项目(2023411)

AI Summary AI Mindmap
PDF (1033KB)

389

访问

0

被引

详细

导航
相关文章

AI思维导图

/