子宫内膜异位症(EMs)是一种育龄期女性常见且易复发的妇科疾病,其特征是子宫内膜样组织在子宫以外部位生长
[1]。近年来子宫内膜异位症的发病率呈上升趋势,根据流行病学调查显示,子宫内膜异位症的发病率为10%~15%,40%~50%的子宫内膜异位症患者患有不孕症,显著影响女性的身体和生殖健康以及生活质量
[2, 3]。
尽管关于子宫内膜异位症的研究众多,但其发病及不孕机制尚未完全阐明,EMs导致不孕可能涉及盆腔结构改变
[4]、腹腔炎性环境
[5]、子宫内膜容受性下降
[6]等。对于部分子宫内膜异位症患者来说,药物保守治疗和腹腔镜检查等常规治疗后仍难以实现怀孕,辅助生殖技术(ART)已成为子宫内膜异位症不孕患者的核心治疗选择,为这些家庭带来了新的生育希望
[7, 8]。
近年来,针对子宫内膜异位症患者妊娠率预测模型的研究进展迅速,涵盖机器学习
[9, 10]、临床指标的整合
[11, 12]、基因检测
[13]、图像诊断技术
[14]、多学科合作等多个领域。相关报道揭示了影响子宫内膜异位症患者ART临床结局的多种因素,包含年龄、AMH、ART治疗次数、不孕年限、ASRM分期、手术干预、优质胚胎移植数量以及是否患有深部浸润性子宫内膜异位症等
[11, 12]。然而,值得注意的是,并非所有上述因素都已被证实与子宫内膜异位症不孕患者的妊娠结局有明确关联。目前关于接受ART治疗的子宫内膜异位症不孕患者新鲜胚胎移植临床妊娠率预测模型的相关研究仍相对有限
[15]。
鉴于子宫内膜异位症的高发率和复杂性,ART治疗中新鲜胚胎移植策略能够缩短患者等待时间及减少胚胎冷冻损伤,我们需要深入探究子宫内膜异位症对ART结局的影响,开发一个ART治疗新鲜胚胎移植妊娠率的预测模型。构建一个有效的临床预测模型不仅能准确预测子宫内膜异位症不孕患者的妊娠结局,还能根据每个患者个体特征来推断其妊娠可能性,从而促进最佳治疗方案的遴选,实现个性化医疗护理。
本研究构建子宫内膜异位症患者新鲜胚胎移植的临床妊娠率的Nomogram预测模型,并对模型进行了内部验证。该研究提高我们对子宫内膜异位症相关不孕症患者临床妊娠率的理解,同时为医疗专业人员和寻求治疗的个人提供全面的指导。
1 资料和方法
1.1 研究对象
收集2017年5月1日~2023年11月8日在广州医科大学附属第三医院就诊的接受ART治疗的患者,根据预先确定的纳入和排除标准共有464例子宫内膜异位症新鲜胚胎移植患者被纳入(
图1)。纳入标准:子宫内膜异位症的诊断需腹腔镜检查或手术诊断;对于没有手术史的病例,需要由经验丰富的超声医生通过超声检查诊断;行IVF/ICSI-新鲜胚胎移植。所有入组患者不孕因素为单纯子宫内膜异位症。排除标准:女性年龄>40岁;合并其他不孕因素:如男性不育、排卵障碍疾病、盆腔和输卵管异常、卵巢反应不良、卵巢储备功能减弱、不明原因、子宫腺肌症、子宫粘连、反复着床失败等其他影响生育的疾病。所有参与研究的夫妇都完全理解了该方案,并提供了签署的知情同意书。
样本量估计:根据临床预测模型建立“10 EPV”规则,通常认为每个变量至少需要纳入10个事件
[16]。本研究的预测模型共纳入9个因素,则需要应变量发生的事件为90例。参考本中心新鲜胚胎移植临床妊娠率的数据约为50%,所需要的总样本量为90例/50%=180例,该项研究训练集纳入279例。
1.2 ART程序
根据本中心的临床方案对患者进行监测和管理,医生根据年龄、BMI、卵巢储备等指标,选择适合每个患者的控制性超促排卵方案。受精方式根据精液特征和既往受精失败史来选择IVF或ICSI。ART治疗程序遵循本中心的标准操作程序:HCG皮下注射35~36 h后经阴道超声引导下取卵术,卵泡液立即运送到实验室,IVF/ICSI受精在取卵后4~6 h进行。受精后16、68、116 h分别进行原核、卵裂胚、囊胚的观察和质量评估。根据胚胎情况选择第3天(Day 3)或第5天(Day 5)的胚胎进行移植,并予以黄体支持。
1.3 胚胎质量及妊娠的评估
本研究中胚胎实验室观察的关键参数包括受精率、2PN率、Day 3可用胚胎率、Day 3优质胚胎率、囊胚形成率等。受精率以出现PN卵子数/受精或注射卵子总数计算;Day 3可用胚胎率是指Day 3符合特定标准的胚胎/卵裂胚胎总数:包括卵裂球数量5~12,碎片≤20%,卵裂球无明显大小差异(大小差异≤25%);Day 3优质胚胎率是指Day 3优质胚胎/2PN来源卵裂胚胎:卵裂球数量7~9,卵裂球无明显大小差异,没有明显的碎片
[17]。根据Gardner标准对囊胚进行评估,根据囊胚腔扩张程度、内细胞团细胞数量和滋养层细胞数量以及排列紧密程度判断囊胚评分。胚胎移植后14 d检测到血清ß-hCG>50 IU/L,移植后4~6周的超声评估中可见孕囊定义为临床妊娠
[18]。
1.4 机器学习方法
本次研究使用3种机器学习的方法进行模型构建,包括多层感知器(MLP)、极端梯度增强(XGBoost)、梯度提升机(GBM)(
图2)。这3种机器学习的方法各具特点。MLP可以有效地提高模型泛化能力并减少方差;XGBoost是经改进的梯度提升决策树(GB-DT)算法,能加快梯度收敛速度并避免模型过拟合;GBM通过逐步优化损失函数来构建模型;每一个新模型都是在前一个模型的基础上,通过学习其残差来改进预测结果,这种方法可以有效减少模型的偏差。
1.5 Stacking集成学习方法
集成学习通过多种结合策略综合多个学习模型的结果,形成最终的集成学习器。相比单一的机器学习模型,集成学习方法将这些基础模型的预测结果作为新的特征,输入到一个称为元学习器(meta-learner)的模型中。元学习器通过学习这些基础模型的预测结果,生成最终的预测结果,避免单一模型因选择失误而导致预测不准确。堆叠法是一种典型的异质集成学习算法。
1.6 统计学分析
使用SPSS 27.0统计软件和R软件进行统计分析。对于正态分布的连续变量,采用均数±标准差描述,分类变量以计数和百分比表示。采用T检验比较组间的差异,卡方检验比较分类变量之间的差异,P<0.05认为差异有统计学意义。多因素分析采取二分类Logistic回归分析;将单因素分析中P<0.1的变量纳入LASSO模型进行变量筛选,通过LASSO构建子宫内膜异位症患者新鲜胚胎移植临床妊娠率预测模型并用列线图呈现;采用ROC曲线下面积(AUC)评估模型的区分度,采用Hosmer-Lemeshow检验预测模型校准度,决策曲线评估模型临床实用性。
2 结果
2.1 单因素分析
本研究共纳入464例接受IVF/ICSI新鲜胚胎移植的子宫内膜异位症相关不孕患者。妊娠组患者女性年龄(32.19±3.58
vs 33.70±4.43),基础FSH水平(5.92±2.44
vs 6.54±3.06),Gn起始剂量(190.25±60.69
vs 211.22±67.40)以及ART周期次数(1.33±0.68
vs 1.55±1.07)较低;而妊娠组获卵数(9.09±3.92
vs 8.19±4.31),冷冻胚胎数(2.08±2.05
vs 1.58±1.91)和移植胚胎数量(1.65±0.48
vs 1.48±0.50)高于未妊娠组(
P<0.001,
表1)。
2.2 多因素Logistic回归分析
多因素回归分析结果显示(
表2),女性年龄(OR=0.928,95%
CI=0.881-0.977,
P=0.005),Gn启始用量(OR=0.997,95%
CI=0.993-1,
P=0.034),ART周期(OR=0.781,95%
CI=0.617-0.989,
P=0.04),胚胎移植数量(OR=2.311,95%
CI=1.561-3.422,
P<0.001)为子宫内膜异位症患者新鲜胚胎移植临床妊娠的显著影响因素。
2.3 Nomogram预测模型构建
将11个潜在影响因素纳入LASSO模型开展筛选,构建系数分布图和10倍交叉验证图(
图3)。
图3A中,随着横轴惩罚系数λ的逐渐增大,纵轴变量系数图在惩罚项下持续趋近于零;
图3B中,两条虚线为交叉验证后的两次最佳λ的取值,在本研究中λ=0.006438551。最终纳入9个变量:年龄,基础FSH,Gn用药总时间,Gn启动用量,ART次数,获卵数,移植胚胎个数,HCG日内膜厚度,HCG日P。
基于LASSO回归筛选构建妊娠率预测模型,Logit(P)=(-0.0387)×Age+(-0.0135)×FSH+(0.0382)×Gn用药总天数+(-0.0025)×Gn启动用量+(-0.1547)×ART次数+(0.0282)×获卵数+(0.7749)×移植胚胎个数+(0.0554)×HCG日内膜厚度+(-0.1161)×HCG日P。基于Lasso模型结果构建列线图,通过将预测指标垂直投影到点段上,得到相应的个体得分;随后对每个指标的个体得分进行综合汇总,得到一个累积分数;最后通过映射总点段上的累积分数,并将其投影到预测值段上,可以确定预期的概率值(
图4)。
2.4 Nomogram模型的验证及临床实用性
利用LASSO模型绘制ROC,曲线显示训练集AUC面积为0.642(95%
CI:0.605-0.679),测试集AUC面积为0.652(95%
CI:0.600-0.704)(
图5A、B);Hosmer-Lemeshow测试训练集和测试集的校准度并绘制校准曲线,校准图显示测试集平均绝对误差为0.019,均方误差为0.00066,绝对误差的0.9分位数为0.041;训练集平均绝对误差为0.02,均方误差为0.00056,绝对误差的0.9分位数为0.041,预测概率接近实际结果显示拟合良好(
图5C、D);当决策曲线中的阈概率值在21%~99%时,使用该列线图预测子宫内膜异位症患者新鲜胚胎移植妊娠率效果较高,该预测模型具有良好的临床实用性(
图5E、F)。
2.5 应用集成多种机器学习算法提高模型性能
本研究按照60%训练集、40%测试集,分别使用GBM、XGBOOST、MLP三种算法建立子宫内膜异位症妊娠率预测模型,并使用Stacking堆叠集成算法,对上述模型的预测结果进行集成,并选取逻辑回归模型作为元模型(
图2)。
集成学习方法可以提高模型的性能:训练集中,模型准确性为0.725(95%
CI:0.680-0.770);测试集中,模型准确性为0.718(95%
CI:0.675-0.761)(
图6A、B);校准图显示:训练集平均绝对误差为0.014,均方误差为0.00029,绝对误差的0.9分位数为0.028;测试集平均绝对误差为0.014,均方误差为0.00027,绝对误差的0.9分位数为0.028,预测概率接近实际结果显示拟合良好(
图6C、D);当决策曲线中的阈概率值在15%~99%时,该预测模型具有良好的临床实用性(
图6E、F),集成后模型效果和稳定性均有提高。
比较各预测指标在各模型中的重要性得分(图7)。年龄在3种算法中重要性得分都靠前;对于FSH水平,在XGBOOST算法中重要性得分最高(100分,图7A),在GBM算法中重要性得分靠前(59.50分,图7C)。
3 讨论
子宫内膜异位症与不孕症密切相关且发病率较高,目前IVF/ICSI-ET被认为是帮助子宫内膜异位症不孕患者受孕最有效的方法之一
[19-21]。在这项跨度为6年的回顾性分析中,行ART治疗患者中约有5.15%患者患有子宫内膜异位症,其中约有41.47%患者选择新鲜胚胎移植。子宫内膜异位症患者ART结局影响因素暂无定论,卵巢储备
[22],疾病的分期
[23],病灶大小及位置
[24],临床促排卵方案
[25],腹腔镜手术史
[26]等可能对子宫内膜异位症患者ART结局有影响。
关于子宫内膜异位症不孕症患者新鲜胚胎移植妊娠结局预测模型的研究尚未充分展开,目前仅有1个可供参考的子宫内膜异位症患者妊娠率预测模型被报道:该研究利用多因素logistic回归分析构建了预测新鲜胚胎移植子宫内膜异位症患者临床妊娠率的模型,该模型纳入了女性年龄,ASRM分期,术后至体外受精持续时间,窦卵泡数,AMH水平,促排方案,获卵数、高质量卵裂胚胎数和移植胚胎数等多个因素
[15]。这项研究为临床方案的选择和医疗决策提供了重要参考,具有较高的学术价值和临床应用前景。
本研究通过LASSO分析筛选构建Nomogram模型,我们纳入以下变量:女方年龄,FSH水平,Gn天数,Gn启动用量,ART次数,获卵数,移植胚胎数,HCG日内膜厚度和P水平。该模型与已报道的模型
[15]都强调了年龄和卵巢储备的重要性,提示早期干预对于子宫内膜异位症不孕患者至关重要;我们的模型还突出了内膜厚度对临床妊娠率的影响,除了考虑子宫内膜异位症本身对在位内膜的影响外
[27],在新鲜胚胎移植周期中,早期促排卵药物和高激素水平可能会影响子宫内膜雌激素和孕激素受体的表达,并显著影响其成熟,导致与体外培养胚胎缺乏同步性
[28]。因此,需要更加关注子宫内膜异位症患者内膜状态。
本预测模型训练集AUC面积为0.642,测试集AUC面积为0.652,模型的区分度一般,模型的性能可能受到研究纳入数据量和变量个数的影响。纳入数据量受限于严格纳入标准,我们排除了子宫内膜异位症合并其他不孕因素,如男性不孕、卵巢储备功能减退、卵巢低反应等,将子宫内膜异位症作为唯一的不孕因素进行分析。在变量纳入中,与以往子宫内膜异位异位症新鲜胚胎移植预测模型相比
[15],我们增加了内膜厚度,FSH,Gn的天数及启动用量等因素,为临床方案的选择提供了更多参考。当然对于临床预测模型,不同的研究任务,最佳的预测模型往往不同;即使同一个任务,也需要纳入多个预测模型进行对比。在这里我们提供了子宫内膜异位症新鲜胚胎移植患者临床妊娠率可接受的模型,虽然该模型区分度一般,但是校准度和临床实用性表现良好。
逻辑回归模型的预测效果可能受到数据中复杂非线性关系的影响。为提升模型预测性能,我们采用了GBM,XGBOOST,MLP三种基础模型,并将它们的预测概率作为输入特征进行堆叠式集成学习
[29]。通过使用基础模型对训练数据或测试数据进行预测,得到各个基础模型的预测概率,并以此构建新特征来训练元模型,最后利用元模型对新数据进行预测。这种方法能够有效地整合多个模型优势,从而提高整体准确性和稳定性。
本回顾性研究跨度6年,纳入标准中子宫内膜异位症为单一的不孕因素,没有合并其他不孕因素,排除其他干扰,最后纳入464例新鲜胚胎移植患者。基于单因素、多因素回归、Lasso回归分析,建立EMs患者IVF/ICSI-fresh ET临床妊娠率的预测模型,有助于生殖医学临床医生对EMs患者方案制定。本研究的局限性:本研究是回顾性研究,不可能完全避免选择偏倚。本研究采用严格的纳入标准,在不孕因素里排除了其他不孕因素,准确反映子宫内膜异位症对临床妊娠结局的影响;本研究使用的数据来自一个单独的中心,需要进一步的前瞻性多中心调查来评估和验证该预测模型;预测模型里缺乏有关子宫内膜异位症患者ASRM分期、手术史和病灶位置等因素,这些因素可能对临床妊娠结局有显著影响。因此,将预测模型整合到常规临床实践中仍然有限。
综上,本研究在LASSO回归分析基础上构建Nomogram预测模型,能够准确预测接受新鲜胚胎移植的子宫内膜异位症不孕症患者的临床妊娠率。我们的预测模型可作为ART治疗期间临床医生优化临床方案的有价值的工具,此外该模型还能提供个性化咨询,帮助患者根据个人情况客观、准确地了解ART治疗结果,并减轻不孕症患者的心理负担。