肝病是全球公共卫生的沉重负担之一,其疾病谱复杂、病程漫长且结局多样
[1-2]。尽管人工智能、多组学和大语言模型等新兴技术快速发展,但临床大数据缺少系统性整合策略和质量控制体系,造成了数据孤岛和质量低下,导致“技术与数据脱节”的应用断层
[3]和“高价值数据难以转化为高质量循证证据”的现实落差
[4]。随着精准医学和个体化诊疗理念的深入推进,在临床实践和学科建设中如何实现肝病全周期内实现个体化风险评估、精准干预与动态随访管理成为亟待解决的问题
[5-6]。因此,笔者团队提出了医学数字活检(medical digital biopsy,MC-Biopsy)的技术框架,旨在依托标准化治理的多模态医学数据库,综合运用机器、深度学习、知识图谱和医学大语言模型等人工智能技术,对检验、影像、治疗、随访及多组学等数据进行系统性地整合,构建可持续、可解释、可迭代的“疾病数字孪生体”,为肝病诊疗、临床研究和学科建设提供可靠的数据支撑。本文将结合笔者团队的实践经验,总结MC-Biopsy在肝病高危人群管理、肿瘤诊断分期、疗效评估与预后预测等场景中的经验,最后探讨其对临床研究、肝病学科建设及人才培养的意义和未来标准化建设与临床转化的关键方向。
1 MC-Biopsy的概念与技术体系
1.1 总体构想与功能定位
近年来,人工智能与医疗大数据的结合在疾病风险预测、预后评估和辅助决策等方面不断拓展应用,相关研究
[7-10]已显示出其在辅助临床实践具有重要价值。然而,在多数医疗机构中,临床数据治理仍在很大程度上依赖人工录入与清洗,底层数据多以“项目化”“局部库”的形式存在,并且不同医疗中心之间乃至同一中心内部各信息系统之间普遍存在“数据孤岛”现象,使得多源数据难以实现高效的互联互通,限制了研究成果向日常诊疗流程的嵌入与推广
[11]。所以,需要面向真实世界场景的技术体系,对医疗大数据进行持续、规范和可复用的治理与挖掘,将零散的被动管理转变为可支撑临床决策、科研创新和学科发展的统一数据与知识底座。MC-Biopsy正是基于这一现实需求提出的总体构想:以标准化、多模态、高质量的专病数据库为核心,联通“数据采集—治理整合—知识建构—智能应用”的关键环节,为后续肝病精准诊疗和学科建设提供技术基础。
1.2 核心技术构架
围绕上述总体构想与功能定位,MC-Biopsy在技术路径上构建了“多源系统对接—原始数据采集—标准化治理与质量控制—多模态融合与智能应用”的一体化技术架构。首先,通过统一对接医院信息系统(hospital information system,HIS)、检验信息系统(laboratory information system,LIS)、电子病历系统(electronic medical record,EMR)、医学影像归档与通信系统(picture archiving and communication system,PACS)以及多组学平台等异源信息系统,自动采集原始数据。其次,以标准数据集和统一术语体系为基础,对采集数据开展结构化、时序化治理,并同步嵌入完整性、规范性、临床逻辑一致性和溯源审计等质控规则,确保数据“可用、可信、可追溯”。最后,对结构化指标、文本病历、医学影像及组学特征等多模态信息进行整合,构建覆盖疾病全周期的纵向数据库和多模态特征集群,并借助自然语言处理、计算机视觉和多模态学习等方法
[12-14],形成面向高危人群识别、风险预测、疗效评估和临床决策支持等场景的应用体系(
图1)。
1.3 MC-Biopsy与传统病理活检的定位与价值延展
病理活检是疾病诊断、分型与分期的金标准,也是获取基因组、转录组、蛋白质组等信息的重要途径,能够为精准医疗提供关键证据
[15-16]。随着人工智能,尤其是计算机视觉技术的快速发展,数字化病理切片成为重要的研究对象
[17]。大量研究通过系统性整合病理影像、放射影像、多组学及临床资料,构建疾病预测、预后评估等多种风险模型,为疾病的精准医疗提供了有力支持
[18]。
MC-Biopsy是对传统病理活检价值的延展与应用拓展。病理信息是数字活检体系中的重要锚点,将病理诊断信息与影像学检查、实验室检测、多组学数据及全病程临床资料进行深度融合,使病理证据从单次、局部、终末的“结果性信息”,转变为贯穿诊断、治疗决策与随访管理全过程的核心要素。一方面,病理诊断及相关定量指标可作为高质量标注信息,与影像、实验室和多组学特征联合使用,为多模态临床模型提供可靠的训练基准和特征参照;另一方面,在病理图像完成数字化、结构化处理之后,可在风险预测、疗效评估、疾病分层等多个环节实现持续利用与多场景复用,提升病理信息的量化能力与可解释能力。从临床实践与学科协同发展的角度看,以MC-Biopsy为核心的数据联合算法的应用构架,有助于将传统病理学的作用从“终末诊断环节”前移至全病程管理之中:既能在风险评估、决策支持和随访中持续发挥作用,也为影像学、分子分型和转化研究等多学科的深度融合提供共同的证据平台
[19],从而在肝病精准诊疗和学科建设中实现对病理活检价值的跃升。
然而,将传统病理纳入MC-Biopsy与多模态数据库框架也伴随一系列现实挑战:其一,数字病理建设依赖高通量切片扫描设备与存储中心,对基础设施与运维成本较高
[20];其二,不同机构在标本制备、染色方案、扫描参数及命名规范等方面缺乏统一标准,增加了跨中心数据标准化与应用的难度
[21];其三,多模态深度学习模型在引入高维数字病理模态后,如何兼顾可解释性、泛化能力与部署可行性,仍然是MC-Biopsy技术走向规模化临床应用的关键技术瓶颈
[22]。总体而言,MC-Biopsy并非对传统病理活检的替代,而是在充分利用“金标准”地位的前提下,通过系统性数据治理和多模态融合,实现对病理证据的放大利用与临床价值的延伸,从而在更大范围内促进各个学科的协同发展。
2 MC-Biopsy在肝病诊疗中的应用及证据体系
2.1 肝癌高危人群中的无创评估与风险分层
病毒性肝病、酒精性肝病及非酒精性脂肪性肝病等慢性肝病是肝细胞癌发生的主要疾病基础。传统无创评估工具多围绕肝纤维化程度和肝功能储备构建,如基于血液学指标以及瞬时弹性成像等“肝硬度测定”技术,在纤维化/肝硬化筛查方面具有良好的可及性和重复性
[23-25],但在预测远期发生肝癌的风险、区分“低危稳定”与“需强化监测”人群方面仍有限
[26]。已经有研究
[27]表明,基于大型队列研究构建的肝癌风险评分将患者信息,实验室检查及影像报告等指标整合为统一模型,用以量化未来3~5年的肝癌发生风险,其中以aMAP评分(age-Male-ALBi-Platelets score)为代表的工具仅依赖常规实验室指标,即可在不同病因和人群中获得较好的区分度,为建立“风险分层驱动的监测策略”提供了可操作的量化基础。
本中心已经借助MC-Biopsy技术,可将诸如aMAP等风险预测模型前置嵌入EMR前端,通过实时数据的提取与处理,帮助临床医生在有限就诊时间内快速把握患者的中长期发生肝癌的风险水平,使其成为肝癌高危人群管理流程的一部分,从而将“风险分层-驱动的监测策略”真正落地于日常诊疗场景。同时,肿瘤高危人群的风险分层并不局限于血液学指标,还可在数字活检平台内整合超声弹性成像、CT/MRI多期增强定量参数等影像学信息,以及长期随访中反复测量的肝功能、病毒学与代谢指标,构建基于多源时序数据的综合风险图谱
[28]。通过对数据进行动态分析,系统能够识别“进展缓慢的稳定高危人群”和“短期内风险迅速攀升的隐匿高危人群”,为优化筛查起始年龄、检查间隔和检查方式提供依据。在实际运行过程中,该模式有助于提升高危人群识别的连续性和前瞻性,使部分既往未被重点关注的隐匿高危个体提前进入强化监测流程,同时避免对风险长期稳定人群的过度检查,从而在保障筛查安全性的同时,提高临床资源配置的合理性;同时结合真实世界随访结局对模型进行持续校准,可逐步形成适应本地区病因构成和医疗资源格局的本土化早筛策略。由此,MC-Biopsy在肿瘤高危人群管理阶段,实现了从传统静态评分到可迭代风险引擎的升级,为后续在肝恶性肿瘤诊断、分期及生物学行为评估中的深度应用奠定了人群基础和数据基础。
2.2 肝恶性肿瘤的诊断、分期及生物学行为评估
肝细胞癌及肝内胆管癌的诊断与分期主要依赖多期增强CT、动态对比增强MRI等影像学检查,以及术中/术后标本和少量穿刺标本的病理学评估。现行指南中,典型强化模式、肝脏影像报告和数据系统等结构化评价体系以及BCLC、CNLC、AJCC等分期标准为临床决策提供了理论基础
[29]。但在真实世界中,影像报告的描述方式和详略程度在不同中心、不同医师之间存在明显差异,结节数目、最大径、包膜情况、门静脉癌栓等关键信息难以系统汇总
[30];病理报告亦多以终点性文字结论呈现,难以与影像特征、肿瘤标志物和分子分型实现一体化分析
[31],从而限制了对肿瘤生物学行为的精细刻画。
本中心在MC-Biopsy框架下,将患者相关的影像、病理及临床资料等信息统一汇入同一数据底座,经标准化与结构化处理后形成可检索、可视化的“数字表型”库,已经实现了患者多模态信息的全面覆盖。一方面,MC-Biopsy对接CT与MRI,将病灶数目、最大径、强化模式、肿瘤-肝组织界面等关键信息通过结构化报告或半自动量测录入系统,转化为清晰直观的量化指标,既便于快速回顾影像要点,也支持在队列层面按病因、分期、治疗方式等维度进行分层统计和对比分析。另一方面,HE染色及多色免疫组化等结果可被整理并转化为分化程度、微血管侵犯情况及代表性免疫标志物表达强度等定量或半定量条目,与影像特征和实验室指标一并集成到同一患者视图中,便于从宏观层面把握不同亚型肿瘤的形态学和微环境的特征分布。通过对上述“数字表型”进行统计汇总与可视化分析,临床团队可以直观了解在一定时间跨度内不同分期、不同治疗路径患者的影像与病理特征谱系,初步识别与预后较差、复发率较高相关的特征组合,为多学科诊疗讨论、诊疗路径优化以及后续更深入的建模研究提供高质量真实世界数据支撑,为后续研究创造条件。
2.3 疗效评估与预后预测
在肝病尤其是肝恶性肿瘤的管理中,疗效评估与预后预测不仅关系到个体化随访计划的制定和再次干预时机的选择,也是优化诊疗路径和评价新技术、新药物真实世界效果的关键环节。然而在真实世界中,随访时间点不统一,影像报告缺乏结构化,用药和不良反应记录分散于不同系统,疗效信息多停留在单次就诊的“点状判断”,难以形成可计算、可比较的全程证据
[32-34]。
依托MC-Biopsy技术,患者从初诊到随访的“治疗-随访-再干预”过程可被整合成一体化视图。既可视化展示完整“疗程-病程”轨迹,也可在队列层面按病因、分期和治疗路径自动抓取缓解率和病情控制率等关键指标。需要强调的是,MC-Biopsy并非重新构建预测算法,而是优先将已在高水平研究中得到验证的风险分层模型进行流程化落地与系统集成,临床医生不仅可以结合术前肿瘤负荷、肝功能储备以及随访过程中影像学与实验室检查结果的动态变化的同时,调用嵌入其中的预测模型,对患者开展基于“时间-事件”的个体化预后评估,从而实现高水平研究证据与真实临床决策场景的衔接。以肝细胞癌为例,与微血管侵犯相关的预后评估模型和列线图工具已被嵌入临床工作流
[35],作为预后评估和术后随访分层的辅助工具,为临床医生向患者进行风险告知、随访频率设定及管理策略选择提供依据。
MC-Biopsy在良性肝病与肿瘤高危人群管理、肝恶性肿瘤诊断分期以及疗效评估与预后预测中的应用,正推动肝病管理模式由单一指标的静态判断,迈向依托多源时序数据的全周期风险管理,由经验主导的粗略分层,迈向可量化、可追溯的精准分层决策。其核心不在于推翻既有非侵袭性评分和分期标准,而在于以标准化数据治理和智能算法为基础,实现证据的系统整合与动态迭代,为后续肝病诊疗路径优化和高质量临床研究提供统一的数字底座和稳定的证据支撑。
3 多模态数据融合与肝病研究范式重构
3.1 肝病研究范式的纵向演进
肝病研究范式的演进,本质上是疾病认知维度与数据利用深度不断拓展的过程。早期研究主要依赖单中心、小样本的临床观察和少量实验室指标,聚焦“有无疾病”及严重程度评估,呈现“单时间点-单指标-单结局”的线性特征
[36-37]。随着循证医学和随机对照试验的兴起,标准化诊疗路径和分期分型体系逐步建立,研究范式由经验总结走向规范化证据,但仍主要基于结构化临床数据和有限影像,难以揭示肝病显著的生物学异质性。
进入大数据与人工智能时代,多中心协作队列、真实世界登记研究及多组学技术迅速发展,推动研究从“单模态-单终点”转向覆盖生存、并发症、功能状态和生活质量等多维结局的综合评估,并从人群平均效应迈向个体化风险分层
[38-40]。与此同时,数据来源由传统信息系统延伸至影像组学、病理组学及多组学等多源异构信息,对“海量-动态-多模态”数据的系统整合与智能分析提出了新的要求
[41]。在此背景下,以MC-Biopsy为代表的新一代技术框架,为肝病研究从“单一证据链”走向“多维证据网络”、从事后验证迈向全周期预测与干预提供了关键支撑,为重构肝病研究范式奠定了基础。
3.2 多模态融合策略与肝病“数字孪生体”构建
在既有数据标准化基础上,多模态融合的核心不在于简单“汇总信息”,而在于通过统一表征,将临床指标、影像特征、病理形态及多组学信号共同转换为可计算的高维疾病状态,从而实现对肝病进程的整体刻画。以此为支点构建的多模态数据库,不仅产生了人群尺度的统计规律,也保留了个体纵向演化的完整轨迹,成为连接传统临床研究与分析模型的中枢底座
[42]。
肝病“数字孪生体”可被视为多模态数据库在个体层面的具体化表达:以单个患者为单位,将基础肝病类型、肝功能状态、肿瘤负荷及关键信号通路等要素整合为可随时间更新的动态模型,既能够重现真实病程并识别高危节点,又可再推演不同治疗策略的潜在结局,从而为个体化决策和案例分析提供量化评估与情景推演的支撑。
3.3 MC-Biopsy在临床研究与真实世界研究中的应用
在大数据背景下,MC-Biopsy不再只是临床信息化工具,而是承载临床研究与真实世界研究的基础设施。依托多模态专病数据库与可计算表型,MC-Biopsy可以在同一技术框架内完成病例筛选、基线分层和结局判定,将传统高度依赖人工查阅病历的流程,重构为规则与模型驱动的半自动化过程,大幅降低建库成本并提升研究可复制性。
在临床试验和前瞻性研究方面,MC-Biopsy一方面利用队列数据,对不同分层策略和终点设置进行模拟与可行性评估,优化样本量和事件率预估;另一方面,通过持续接入影像、病理和多组学等多模态信息,有助于识别获益亚群和高危亚群,支撑伴随诊断标志物和精准干预策略的开发
[43]。
在真实世界研究与真实世界证据生成方面,MC-Biopsy通过对患者长期诊疗路径和用药模式的系统记录,构建贴近实际临床场景的自然队列,可用于评估指南执行情况、不同策略对预后和资源利用的影响
[44]。例如,Tang等
[45]基于3万余例慢性乙型肝炎患者的多中心EMR,评估了在未满足2025年欧洲肝脏研究协会强推荐指征人群中启动核苷(酸)类似物治疗对肝硬化和肝细胞癌风险的影响,证实高质量真实世界数据能够为治疗阈值评价和指南更新提供关键依据。由此,临床试验与真实世界研究不再是割裂的两条路径,而是在MC-Biopsy的支撑下形成“试验-实践-再评价”的闭环,推动肝病领域迈向持续生成证据的学习型医疗体系。
4 MC-Biopsy推动肝病临床实践及人才培养
在肝病专病多模态数据库和MC-Biopsy平台初步建成的基础上,学科建设正从“数据和工具的准备阶段”迈向“临床实践-科研转化-人才培养”一体化发展的新阶段。MC-Biopsy的独特价值在于,它同时作用于三条主线:一是嵌入日常诊疗流程,助力病情评估、治疗选择和随访管理的精细化;二是以真实世界数据为基础,降低临床研究门槛,促进问题导向的转化医学研究;三是通过“平台即课堂”的方式,重构肝病专科人才的培养路径,使年轻医师在解决真实临床问题的过程中自然形成数据思维与智能工具。
在临床实践层面,MC-Biopsy的核心作用不在于新增检查项目,而在于借助结构化信息推动诊疗流程再设计。通过在门急诊首诊、住院评估、围手术期管理和随访复查等关键节点嵌入统一的肝病病例视图与风险评估组件,可将既有指南、专家共识与本地人群证据有机整合,形成相对稳定的决策路径模板,减少单纯经验驱动带来的差异。MC-Biopsy自动记录关键决策与随访结局,可用于持续观测抗病毒策略、并发症预防等环节的执行与获益情况,为修订个体化诊疗路径提供数据支撑。对于慢性乙型肝炎和代谢相关脂肪性肝病等人群,基于纵向数据形成的分层管理策略,有助于在既定资源约束下优化筛查间隔和检查组合,对高危人群进行更有针对性的监测与干预。
在人才培养层面,MC-Biopsy为塑造“临床思维-数据思维”的复合能力提供了具体载体。可利用MC-Biopsy中的脱敏病例和病程轨迹开展情境化教学,使学习者在单一界面下同步理解临床经过、影像与病理信息及结局,强化完整证据链意识
[46-47]。本中心已经依托数字活检平台实现在住院医师规范化培训和专科医师培训阶段,可将结构化病历录入、随访方案制定及基于真实世界数据的简单分析纳入轮转任务和考核指标,引导年轻医师在日常工作中养成规范记录和基于数据反思决策的习惯。面向在职医师及信息、数据团队,则通过联合培训分别补齐数据素养与临床理解,逐步形成支撑MC-Biopsy持续运行与迭代优化的学习型专科队伍。
总之,以肝病专病多模态数据库为支撑的MC-Biopsy,实现了临床实践优化与人才培养模式重塑的协同推进:一方面,通过诊疗流程再设计和嵌入式风险评估工具,促进肝病诊疗的标准化与精细化;另一方面,以MC-Biopsy为载体构建分层递进的教学与培训体系,培育兼具临床决策能力与数据素养的复合型专科队伍。随着数据持续积累与算法迭代,MC-Biopsy有望联通真实世界证据生成与学科内涵式发展,为肝病防治体系提供可持续的技术支撑与人才保障。
5 前景及展望
展望未来,MC-Biopsy有望在肝病领域完成从“技术样板”向“体系变革”的跨越。一方面,随着多中心高质量数据的持续积累及国家层面标准规范的逐步完善,以MC-Biopsy为代表的数字活检平台有望由单中心示范拓展为区域乃至全国协同网络,在肝病分级诊疗、患者管理、长期随访和真实世界研究等环节形成可复制、可评价、可推广的整体解决方案;另一方面,大模型、联邦学习、隐私计算等新一代信息技术的应用,将提升复杂时序数据的解析能力和模型可解释性,为肝癌早筛、预后评估及个体化干预提供更加精细的风险刻画与决策支持。
同时,MC-Biopsy的发展也对学科交叉人才提出了更高要求。未来应在现有临床与科研培养体系基础上,系统融入数据科学、人工智能与医学信息学训练,通过联合培养、交叉学位项目和多学科团队实践,塑造一批既“懂临床、会科研”,又“懂数据、会算法”的复合型骨干力量。可以预期,随着技术体系的持续迭代和人才梯队的逐步完善,MC-Biopsy将在推动肝病诊疗模式重塑、促进临床科研一体化以及提升外科专科内涵建设等方面,释放出更大的临床与社会价值。