男性乳腺癌死亡风险预测模型的构建及外部验证研究

田林 ,  朱荔 ,  张丽萍 ,  孙嘉鸿 ,  王建东

解放军医学院学报 ›› 2025, Vol. 46 ›› Issue (08) : 784 -791.

PDF (2224KB)
解放军医学院学报 ›› 2025, Vol. 46 ›› Issue (08) : 784 -791. DOI: 10.12435/j.issn.2095-5227.24122502
临床研究论著

男性乳腺癌死亡风险预测模型的构建及外部验证研究

作者信息 +

Construction and external validation of a mortality prediction model for male breast cancer

Author information +
文章历史 +
PDF (2276K)

摘要

背景 男性乳腺癌(male breast cancer,MBC)在临床上罕见,但其年发病率近年来有所增加,且预后不佳。 目的 构建预测MBC患者预后的临床预测模型并进行外部验证。 方法 选取1990 — 2019年SEER数据库中MBC患者,按照7∶3的比例随机分为训练集和验证集,以5年病死率作为结局指标,使用Lasso回归、单因素、多因素Cox比例模型筛选相关预测特征,采用ROC曲线、校准曲线评估MBC临床预测模型的区分度和校准度,采用列线图对临床预测模型进行可视化,并以解放军总医院第一医学中心的病例进行外部验证。 结果 本研究模型构建纳入SEER数据库中1 614例患者,将其分为训练集(n=1 129)与验证集(n=485),随访期间训练集和验证集中分别有274例和111例患者死亡。LASSO回归筛选出9个与死亡风险相关联的临床特征——诊断时年龄、组织学分级、T分期、N分期、M分期、骨转移、是否接受手术、ER状态和PR状态,多因素Cox风险比例模型分析确定这9个指标与死亡独立关联(P<0.05),基于此构建的预测模型在训练集预测1年、3年、5年死亡风险的ROC曲线下面积分别是0.895、0.853和0.829,C-index值为0.811;内部验证集1年、3年、5年死亡风险预测模型的ROC曲线下面积分别为0.858、0.858、0.848,验证集的C-index值为0.798。对解放军总医院第一医学中心的44例MBC患者进行外部验证,5年死亡风险的AUC为0.731,10年死亡风险的AUC为0.797。 结论 本研究建立了基于诊断年龄、组织学分级、T分期、N分期、M分期、骨转移状态、手术干预状态、ER状态和PR状态预测模型,对MBC患者死亡风险具有较高预测价值,为临床医师精准评估提供了重要参考。

Abstract

Background Male breast cancer (MBC) is clinically rare, but its annual incidence has increased in recent years and the prognosis is poor. Objective To develop a clinical prediction model for prognosis in male breast cancer patients and externally validate it using data from MBC patients at our institution. Methods Patients with MBC from the SEER database from 1990 to 2019 were selected and randomly divided into a training set and a validation set at a ratio of 7:3. The overall 5-year death of MBC patients was used as the outcome indicator. Lasso regression, univariate, and multivariate Cox proportional hazards models were employed to screen for predictive features. The discriminative ability and calibration of the clinical prediction model were evaluated using receiver operating characteristic (ROC) curves, calibration curves, and external validation analysis. A nomogram was constructed to visualize the clinical prediction model. Results This study included 1 614 patients from the SEER database as the study subjects and divided them into a training set (n=1 129) and a validation set (n=485). Follow-up results showed that 274 died in the training set and 111 patients died in the validation set. LASSO regression identified 9 clinical features: age at diagnosis, histological grade, T stage, N stage, M stage, bone metastasis status, surgical intervention status, estrogen receptor (ER) status, and progesterone receptor (PR) status. Univariate Cox proportional hazards model analysis revealed that all variables were significantly associated with risk of death in MBC (P<0.05). Multivariate Cox proportional hazards model analysis demonstrated that age, tumor grade, T stage, N stage, M stage, and bone metastasis were independent risk factors for risk of death. At the same time, surgical intervention, ER positivity, and PR positivity served as protective factors (P < 0.05). In the development set, the AUC values for the 1-, 3-, and 5-year risk of death prediction models were 0.895, 0.853, and 0.829, respectively, with a C-index of 0.811. In the validation set, the corresponding AUC values were 0.858, 0.858, and 0.848, with a C-index of 0.798. External validation was performed on 44 patients with MBC in our hospital. The AUC for 5-year risk of death was 0.731, and the 10-year risk of death was 0.797. Conclusion This study establishes a prediction model based on diagnostic age, histological grading, T staging, N staging, M staging, bone metastasis status, surgical intervention status, ER status, and PR status, which has high predictive value for risk of death in MBC patients and provides a reliable tool for clinical doctors.

Graphical abstract

关键词

男性 / 乳腺癌 / 临床预测模型 / 机器学习 / 列线图 / 预后 / 死亡

Key words

male / breast cancer / clinical prediction model / machine learning / nomogram / prognosis / death

引用本文

引用格式 ▾
田林,朱荔,张丽萍,孙嘉鸿,王建东. 男性乳腺癌死亡风险预测模型的构建及外部验证研究[J]. 解放军医学院学报, 2025, 46(08): 784-791 DOI:10.12435/j.issn.2095-5227.24122502

登录浏览全文

4963

注册一个新账户 忘记密码

男性乳腺癌(male breast cancer,MBC)在临床上很罕见,约占所有乳腺癌病例的1%,近年来其年发病率有所增加[1-2]。由于MBC的发病率远低于女性乳腺癌,大多数乳腺癌临床研究只包括女性,几乎没有前瞻性数据可指导MBC的临床治疗。尽管近年来乳腺癌患者的死亡率有所下降,但远处转移的乳腺癌患者预后仍较差,5年死亡率为73%[3]。一些研究表明,与女性相比,MBC患者的预后更差,这可能是由于诊断时期较晚、诊断时年龄较大,或是不良预后的亚型,如三阴性乳腺癌[4-7]。因此,开发一种用于预测MBC患者死亡风险的工具/模型,将有助于提高对癌症预防的认识。在过去几年中,医学领域广泛利用机器学习进行多种预测,如癌症发病率预测[8]、癌症检测[9]、癌症死亡预测[10]和骨转移风险预测[11]。本研究旨在构建疾病预测模型以预测MBC患者的死亡风险,并分析该模型的预测能力,为MBC进行危险分层提供依据,以指导个体化治疗。

1 对象与方法

1.1 数据来源

建模样本提取自美国国立癌症研究所监测、流行病学及结局项目数据库(Surveillance,Epidemiology and End Results Program,SEER)。该数据库是公认的癌症信息的权威信息源库,覆盖了美国约34.6%的人口。基于估计发生第二原发癌症(second primary malignancy,SPM)的风险,本研究使用SEER*Stat 8.4.1版本。采集过程中,以国际肿瘤学疾病分类第3版(ICD-O-3)的专用站点代码C50(包括C50.1 ~ C50.9)来识别/标记乳腺恶性肿瘤。设置3个关键变量——诊断年份、序列号、患者原位/恶性肿瘤总数,以确定SPM的状态。

收集1990 — 2019年的MBC患者,纳入标准:(1)男性;(2)诊断为乳腺癌;(3)至少具备5年随访数据。排除标准:(1)初诊2个月又诊断为SPM同步癌症;(2)第一原发恶性肿瘤并非乳腺恶性肿瘤。

外部验证集样本来自2001 — 2019年解放军总医院第一医学中心的MBC患者。纳入及排除标准同建模数据集。本研究在入组前已获得全部受试者的知情同意,并经解放军总医院第一医学中心医学伦理委员会批准(伦审第S2024-202-01号)。

1.2 研究方法

建模样本被随机分为训练队列(70%)和内部验证队列(30%),用于开发和验证预后预测风险模型。另外收集解放军总医院第一医学中心2001 — 2019年的MBC患者用于外部验证。

本研究选择的结局指标是1年、3年、5年死亡风险。根据乳腺癌NCCN指南[12],结合SEER数据库,筛选可能对MBC患者预后产生影响的临床指标,包括年龄、肿瘤位置、组织学分级、雌激素受体(estrogen receptor,ER)、孕激素受体(progesterone receptor,PR)、HER2、侵犯神经、脉管浸润、淋巴结阳性个数、Ki-67、淋巴结转移情况和病理分期。使用Lasso回归、单因素、多因素Cox比例模型筛选相关预测特征

SEER数据库将组织学类型分为浸润性导管癌、腺癌、其他。激素受体(hormone receptor,HR)状态分为HR阳性[ER和(或)PR阳性]和HR阴性(ER和PR均为阴性)。补充分析中,SEER数据库将TMN分期调整为第6版AJCC分期,记录SPM的部位和诊断时间。

1.3 统计学方法

采用SPSS 27.0、R 4.1.3软件、Python 3.9.7和MedCalc 19.0.7进行数据分析。分类变量以例数(百分比)表示,连续变量以M(IQR)表示。使用非参数检验分析组间连续变量差异,χ2检验分析分类变量组间差异。采用Lasso回归、单因素和多因素Cox回归筛选模型预测特征。根据训练集中多变量Cox回归分析的结果构建了诺莫图。使用训练集、验证集和外部验证集的AUC和一致性指数(C-index)评估区分度。校准通过校准曲线进行评估。以P<0.05为差异有统计学意义。

2 结果

2.1 样本一般资料(训练集 vs 验证集)

SEER数据库单原发病灶的男性乳腺癌病例共计9 470例,死亡原因不明2 685例,临床病理资料缺失5 032例,乳腺癌分期缺失133例,生存时间缺失或者为0者6例,最终1 614例纳入后续分析。

1 614例MBC患者按7∶3的比例,随机分为训练集(n=1 129)和验证集(n=485)。两组年龄、婚姻状态、种族、初始肿瘤大小、肿瘤等级、肿瘤T分期、肿瘤N分期、肿瘤M分期、骨转移情况、肝转移情况、肺转移情况、肿瘤治疗方法、肿瘤亚分期、ER、HER2等差异无统计学意义(P>0.05)。见表1

2.2 训练集生存/死亡两组相关资料比较

1 129例的训练集中,5年生存(生存组)855例,死亡(死亡组)274例。对比两组人口学特征及肿瘤相关因素,年龄、婚姻状况、种族、肿瘤分级、TNM分期、肿瘤转移状态、是否手术治疗、是否化疗、肿瘤亚分型、ER、PR、HER2等指标的差异有统计学意义(P<0.05)。内部验证集中死亡111例,生存374例,两组比较结果与训练集基本一致。见表2

2.3 死亡结局预测模型特征筛选

Lasso回归初筛选出年龄、肿瘤组织学分级、T分期、N分期、M分期、骨转移情况、是否手术、ER状态、PR状态等9个因素,见图1。单因素Cox回归结果发现9个因素全部有统计学差异,与MBC患者死亡风险显著关联(P<0.05)。多因素Cox回归结果亦发现9个因素全部具有统计学差异(P<0.05),见表3

2.4 MBC预后预测模型效能评估

ROC分析显示,由训练集所构建的1年、3年、5年死亡预测模型的ROC曲线下面积分别为0.895、0.853、0.829,对应的C-index值为0.811;由内部验证集所构建的1年、3年、5年死亡预测模型的ROC曲线下面积分别为0.858、0.858、0.848,对应的C-index值为0.798。见图2。

参考文献

AI Summary AI Mindmap
PDF (2224KB)

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/