PDF
摘要
目的:中国人群肢端型黑色素瘤高发且预后不良,目前尚缺乏多模态高质量研究数据。本研究旨在构建具有中国人群代表性的多模态专病队列,为解析疾病特征及预后机制提供数据基础。方法:采用单中心前瞻性研究设计,连续纳入中南大学湘雅医院2016年4月至2024年9月经病理学检查确诊的黑色素瘤患者为研究对象,排除未成年人、妊娠期及哺乳期女性。基于国际标准构建包含16个核心模块的标准化数据集。数据治理采用自动化抽取-转换-加载(extract-transform-load,ETL)流程与人工智能(artificial intelligence,AI)相结合的混合架构,利用基于Transformer的自然语言处理(natural language processing,NLP)模型提取病理文本特征等,并结合深度学习模型处理医学影像等像素级数据。采用临床与工程双重校验机制保证数据质量,随访结局评估遵循实体瘤疗效评价标准1.1版和常见不良事件评价标准5.0版。结果:多模态专病队列共纳入1 036例黑色素瘤患者,男514例(49.61%),女522例(50.39%),年龄为(60.2±13.7)岁。在898例具有明确临床分型的患者中,肢端型黑色素瘤606例(67.48%),为主要亚型。在拥有完整Breslow厚度数据的678例患者中,Breslow厚度中位数值为3.25 mm。在612例具有明确Clark分级数据的患者中,Clark分级Ⅳ患者277例(45.26%),为主要分级。在880例具有明确临床TNM(clinical TNM,cTNM)分期数据的患者中,Ⅱ期患者329例(37.39%),比例最高。驱动基因检测结果显示,B-Raf原癌基因丝氨酸/苏氨酸蛋白激酶V600E突变(B-Raf proto-oncogene serine/threonine kinase,BRAFV600E)检出率为21.79%(61/280),干细胞生长因子受体(stem cell growth factor receptor,c-KIT)突变检出率为9.46%(7/74)。在治疗模式上,全队列有217例(20.95%)患者接受免疫治疗,59例(5.69%)患者接受靶向治疗。在完成系统随访的372例患者中,共记录死亡事件129例(34.68%),复发/转移事件86例(23.12%);肢端型、Clark分级Ⅳ及cTNM分期Ⅲ~Ⅳ患者为死亡、复发/转移的主要群体。队列整合了8 536张数字病理全切片图像(whole slide images,WSI)及5 084例次符合医学数字成像与通信(digital imaging and communications in medicine,DICOM)标准的原始影像数据等深层多模态数据,结构化数据点超35万个,数据库总数据量达20.5 TB。结论:该多模态专病队列整合了中国人群特异的临床、影像、病理和分子信息等数据资源,为开展真实世界研究、挖掘预后生物标志物,以及开发AI辅助诊疗模型提供了重要的数据基础。
关键词
黑色素瘤
/
多模态专病队列
/
数据治理
/
真实世界研究
/
人工智能
Key words
[Author(id=1243176084771033422, tenantId=1045748351789510663, journalId=null, articleId=1242880967241507143, orderNo=null, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=null, email=null, emailSecond=null, emailThird=null, correspondingAuthor=null, authorType=null, ext={}, companyList=null)]
.
面向黑色素瘤研究的多模态专病队列:构建、治理与初步报告[J].
中南大学学报(医学版), 2025, 50(11): 1979-1989 DOI: