在医疗健康行业,人工智能发展面临着数据资源短缺、算力条件不足、协同支撑匮乏等问题,这极大地制约了医学人工智能发展,亟须寻找破局之道,推动行业整体创新。2020年国家工信部推出“产业技术基础公共服务平台”项目,面向医疗健康行业建设人工智能筛查和辅助诊断公共服务平台,包括数据资源治理、算力平台构建、模型算法研制以及工作流程优化等。解放军总医院牵头承担该项目,联合各成员单位,建设了一个主要采用国产软硬件设备的大型医学人工智能公共服务平台,为医院提供人工智能数据治理、模型训练、测试验证及推理应用等公共服务,进一步推动人工智能在医疗卫生领域的深度应用。
1 医学人工智能公共服务发展现状
随着大数据、人工智能等技术的飞速进步,国内外围绕医学人工智能的数据治理、算力建设、以及平台服务开展工作,有力推动了医疗健康领域创新发展。
1.1 数据治理现状
当前人工智能仍以数据驱动为主,数据的质量、数量、多样性等直接影响AI模型的可靠性、准确性和泛化性。制作数据集成为一种加强数据治理、推进共享使用的有效方法。主要数据集包括重症电子病历MIMIC-Ⅲ
[1]、放射影像MURA
[2]、CT影像CTPelvic1K
[3](骨盆)、CTSpine1K
[4](脊柱)、RibSeg V2
[5](肋骨分割)、医学影像分割Medical Segmentation Decathlon
[6]、多模态影像 MedMNIST V2
[7]、医学视觉问答数据集PMC-VQA
[8]、多模态数据集MedMD
[9]、3D医学图像通用分割SAM-Med3D
[10]等,见
表1。此外,还包括生物医学基准数据集、中文医学知识图谱以及中英文医学语料库
[11]等。
1.2 算力建设现状
在医学领域,大规模智能计算需要大算力支撑,用于开展生命组学
[12]、医学影像和电子病历等数据的融合分析
[13]。2020年11月美国发布《引领未来先进计算生态系统战略计划》
[14],将构建覆盖政、产、学、研的先进计算生态系统。2021年3月欧盟在《2030数字罗盘:欧盟数字十年战略》
[15]中计划部署1万个边缘计算节点,为75%的欧盟企业提供云计算、大数据和人工智能服务。我国对算力建设倍加关注、抓紧布局
[16],呈现“人-机-物”三元融合
[17]、“网-算-存”一体化发展
[18]以及“通信-感知-计算”持续赋能等趋势
[19]。北京、上海、四川等地智算中心陆续开工
[20],加速提升人工智能产业支撑实力。
1.3 国内平台服务现状
2013年,中国医学科学院、军事医学科学院等单位研究人员撰文
[12],提议建设国家跨组学信息工程大设施,加强国家生命科学基础设施建设。“十三五”以来,为加快完善产业技术基础体系,提升应用基础能力,保障产业创新发展,国内启动建设面向行业的医疗AI公共服务和面向医疗机构/患者的医疗AI应用服务两类医疗人工智能平台,并提供相关服务,见
表2。
面向行业的公共服务平台是聚焦医疗AI行业发展需求,支持和吸引第三方医疗AI企业加入,使得平台能够提供种类更多、范围更广、技术先进的医疗AI创新服务。2017年11月,科技部启动首批4个国家新一代人工智能开放创新平台建设工作。其中,腾讯公司承担医疗影像国家新一代人工智能开放创新平台,以及科技创新2030“新一代人工智能”项目,2024年4月通过综合绩效评价。2018年10月,阿里健康宣布面向医疗AI行业启动第三方人工智能开发平台,12家医疗AI公司首批入驻。该平台与系列医疗人工智能产品一起,面向科研人员和开发者提供支持。2020年12月,金域医学承建广东省“临床检验与病理诊断广东省新一代人工智能开放创新平台”,2023年9月上线。此外,为推动我国人工智能技术创新和产业发展,2019年8月科技部制定了《国家新一代人工智能开放创新平台建设工作指引》,为平台建设提供政策指南。
面向医疗机构/患者的医疗AI应用服务平台则部署推广各种常见病的诊断、治疗与康复智能辅助系统。科大讯飞智联网医疗平台(
https://www.iflytek.com/health),为居民提供线上线下全过程便捷智能就医服务,为医护人员提供AI工具提升诊疗质效,促进优质医疗资源下沉基层服务大众。百度AI智能医疗开放平台(
https://ai.baidu.com/industry/health-care)提供临床辅助决策、眼底影像分析等产品,百度灵医智惠“眼底照片眼部疾病辅助诊断软件”入选“人工智能医疗器械创新任务”。阿里云
[21]、万里云
[22]、医渡云
[23]、医真云
[24]等打造一站式医学影像SaaS平台,赋能各级医疗机构,助力实现信息化升级与智能化转型。
1.4 现有平台建设主要问题
在医疗健康领域,人工智能技术仍然面临医疗数据共享难、数据质量标准低、优质AI系统少、支撑平台资源缺等突出问题。第一,经过多年信息化建设,国内医院普遍积累丰富的临床医疗数据,但由于隐私保护及信息安全等原因,数据难以出院进行有效共享,使得大量医疗AI企业缺少优质充足的数据,从而阻碍医疗AI模型算法的研发与应用。第二,基于数据驱动的人工智能技术对数据标准、数据质量要求较高,但多源异构的医疗数据却在编码、格式、内容等方面存在较大差异,增大了数据治理、数据标注、训练推理的难度,在一定程度上桎梏医疗健康AI行业的融合发展。第三,针对常见病、多发病以及重要疾病的诊疗、防治等重大需求,缺乏高质量的样本数据、高性能的网络框架和高效率的模型算法,直接导致功能强大、性能优异的医疗健康AI系统非常稀缺,人工智能赋能与反哺乏力。最后,在医疗机构之间,以及医疗机构与AI企业之间难以有效共享算力、数据和模型,“信息孤岛”“服务壁垒”等问题亟待解决,亟须构建面向医疗健康行业,开放共享、高质高效的人工智能筛查和辅助诊断公共服务平台。
因此,建设开源共享的新一代人工智能公共服务平台将有效破解行业痛点,加快培育智慧医疗生态,有力推动面向医疗健康行业的人工智能产业新模式发展。
2 医学人工智能公共服务平台架构
针对医疗数据共享难、数据质量标准低、优质AI系统少、支撑平台资源缺等问题,我们围绕医疗健康行业AI筛查和辅助诊断系统研发与应用,提出基于“云-网-边-端”架构的平台建设方案,在解放军总医院建设人工智能公共服务总云平台,在联合体首都医科大学附属北京天坛医院、北京大学第一医院、北京肿瘤医院、北京同仁医院、郑州大学第一附属医院、中国食品药品检定研究院等成员单位分别建设人工智能公共服务子平台,通过训推异构兼容和智能联邦学习,大力推进医疗数据、基础算子、高端算力与模型算法的深度融合与优化共享,充分适配算法研究、模型训练、系统验证与平台推理等多种应用场景,致力于实现数据分布式存储、模型跨平台训练、系统多中心应用。
2.1 网络拓扑
平台部署共分A、B、C三部分,三者之间物理隔离,平台整体满足等保三级要求,平台拓扑见
图1。其中,A部分用于数据库建设和算法模型训练,包含牵头单位的总云平台及其他5家成员单位的子平台。B部分用于模型推理,面向社会基层医疗机构提供公共服务,主要为建设模型更新库服务,基层医疗机构的应用推理系统可从中获取最新模型。C部分用于牵头单位子平台辅助诊断后端服务系统建设,面向牵头单位各医学中心提供AI辅助诊断及数据训练等相关服务。
2.2 系统设计
针对医疗AI的能力生成与服务支撑等需求,基于“多域融合+云边协同”理念,提出“云-网-边-端”先进架构(
图2),实现医疗数据、计算资源和应用服务在云、边、端之间的优化配置与高效协同。
(1)云侧:提供人工智能训练和公共服务,包括汇集“高端算力、高阶算子、存储云服务”等优质资源,承载多模态生物医学数据库,多源异构数据整合分析工作流,以及模型训练、测试、验证和临床评价等核心功能。其中,总云平台由160余台服务器和网络防护设备构成,安装华为云平台底座HCS Online系统,分为管理、安全、计算、存储、核心和接入6个功能区,依托云端实现数据、算子、算力的高效聚合和集中赋能。
(2)网侧:基于5G专网,提供大带宽、低时延、高性能的网络互联与安全防护。通过“5G医疗专网+有线网络”互联,实现相关数据在各子平台与总云平台之间的在线传输、汇聚提交、分布存储,助力开展医疗人工智能模型训练、测试、验证和产品研制等任务,见
图3。同时,通过专线、长城互联网等多种方式,实现240家基层医疗机构人工智能筛查和辅助诊断模型产品的定期更新与在线服务。
(3)边侧:对接各成员医院子平台,既可为医院提供“高效算力、优质算子及冷热存储”等先进资源,支撑各医院进行针对性的模型训练和推理,又可通过联邦学习机制与总平台及其他子平台开展分布式、并行化的模型联合训练和基于异构平台的应用推理等研究。
(4)端侧:连接各子平台的各类工作站系统,为数据标注、模型调试、算法优化以及量化推理等应用提供安全接入和可靠服务,不断推进平台功能扩展和服务延伸。
3 平台功能特点
医疗AI公共服务平台构建是一项理工医信交叉融合,集科学研究、技术研发与工程实施于一体的创新实践,具有技术密集、知识富集和资源集中等典型特征。医疗AI模型研发涉及数据遴选、标注审核、模型开发、训练测试、验证部署等多个环节,需要医学专家、算法专家、工程技术和项目管理等多学科人员密切协作,聚力攻关。
3.1 主要功能
(1)数据预处理与标注:平台提供全面的数据预处理功能,包括数据清洗、归一化、去重、特征工程等,以确保数据质量。同时,平台集成了半自动化标注工具,利用机器学习算法预测标注结果,辅助人工审核,大幅提高标注速度和准确性,尤其适用图像、语音等复杂数据的标注任务。
(2)一站式开发平台:支持数据预处理、半自动化标注、在线开发调试、大规模分布式训练以及云-边-端模型部署等,能够帮助用户快速创建和部署模型,有效管理全周期AI工作流。
(3)大规模分布式训练:平台采用高效的分布式训练架构,支持在多台机器上并行训练大型模型,能够处理大规模数据集,加速模型训练过程,同时保证训练结果的稳定性和可靠性。
(4)模型自动生成:平台集成了自动化机器学习(AutoML)技术,能够根据数据特性寻找合适的模型架构和超参数。AutoML技术可以显著减少模型调优的工作量,帮助开发者快速找到最优模型,提高模型性能和开发效率。
(5)云-边-端部署:平台支持将模型部署到移动设备、边缘服务器和云计算平台等。通过灵活的部署策略,满足不同场景的应用需求,如在移动设备上实现低延迟推理、在云端实现大规模数据处理等。
(6)支持自研框架:平台不仅支持Tensorflow、MXNet等主流开源AI框架,还提供接口支持开发者使用自研算法框架。这种灵活性使得平台能够适应不同的开发需求和创新,支持开发者构建定制化的AI解决方案。
3.2 主要特点
3.2.1 云边协同
公共服务平台基于华为HCS Online底座系统以及ModelArts、EIhealth等服务和联邦学习机制,实现云边协同。(1) EIhealth服务:医疗智能体(EIHealth)平台是基于华为云AI和大数据技术优势,为基因组分析、药物研发和临床研究等领域提供的医疗AI研发专业平台,有模型、算法、数据等资源模块和应用组件供平台使用。(2) ModelArts服务:ModelArts是面向AI开发者的一站式研发平台,提供数据预处理、数据半自动化标注、大规模分布式训练以及模型部署等能力,帮助用户快速创建和部署模型,管理全周期AI工作流。(3)联邦学习算法:联邦学习是一种模型跨域训练方案,无需将涉及安全和隐私保护的数据进行统一存储和集中训练,而是依托各数据所在方的算力、算子等局部资源进行分布式模型训练,同时基于训练同步、参数共享等策略共同生成一个完整模型。在医疗AI领域,联邦学习算法可在数据安全和隐私保护等前提下,实现“数据不出院,模型集中训”的目标。平台联邦学习算法流程见
图4。发起方登陆平台后,创建联邦用于医疗AI模型的跨平台协同训练,创建内容包括指定训练参与方,整理样本数据、编写训练脚本、设置模型参数以及预订启动时间等。然后,一方面将创建联邦命令加入联邦训练的作业队列等待启动运行,另一方面将联邦任务链接等信息在线分享给各预定参与方。当满足启动条件时,平台启动联邦,发起方和各参与方依次开始联邦训练,训练时长根据任务要求所定。期间,任何一个参与方发生异常,该方都将会自动退出联邦,否则持续参与训练直至训练结束,并生成最终模型。在面向实际应用场景时,联邦学习还需进一步解决若干问题,包括努力降低各参与方因样本数据分布不均、数量不等、质量不一等对模型精度和训练效率的影响,以及如何规避平台网络拥塞、抖动、迟延等不利因素,保持模型训练的稳定性和高效性。值得注意的是,各参与方都有各自独立的算力、算子和训练样本等资源,在训练过程中各方只共享模型参数和同步信号等有限信息,无需共享和传输样本数据,从而有效保障医疗数据安全和个人隐私。
3.2.2 异构兼容
通过提高平台软硬件的异构兼容性能,不仅可以有效增强平台的可靠性、适用性和扩展性,还能够促进国产软硬件的产品完善与品牌跃升,推动建立全行业、全周期、全栈式的自主创新生态链、产业链和价值链。
在硬件层面,平台集成国产服务器与x86服务器两类异构硬件,努力提高系统兼容共享能力。软件层面,平台既支持Tensorflow、PyTorch、MindSpore等AI开源框架,也支持开发者自研算法,基于面向对象、面向服务等理论,通过抽象、继承和重载等技术,实现联邦学习框架与具体AI算法的解耦,使平台能够兼容、集成更多创新算法。主要工作包括:(1)将在GPU上运行的医疗AI模型训练程序,迁移到国产服务器和加速卡上进行重新训练,主要包括脚本转化、算子优化、环境配置,以及代码调试等内容,大力扩展模型算法的适用范围。(2)将在GPU上训练生成的医疗AI模型,适配到国产服务器上进行应用推理,主要包括环境修改、模型转换、解压编译以及推理测试等内容,努力提高模型精度和性能。(3)扩展联邦学习算法的调用接口,使其支持FedAVG、FedAMP等多种聚合算法,以及单机多卡、多机多卡等并行训练方式,进一步提高平台兼容性能。
3.2.3 网信安全
项目按照三级等保要求,遵循高扩展、高稳定、智能化、可追溯的原则,编牢织密平台安全防护网络。高扩展:部署具有高扩展性的安全设备,推动人工智能筛查和辅助诊断公共服务平台迅速发展,满足业务发展需求;高稳定:安全设备采用冗余架构,进行分区隔离部署,具有良好的应变、容错和纠错等能力,确保整个网络安全基础设施运行稳定可靠;智能化:各种协议和应用部署日趋复杂,对运维要求也越来越高,为此,需借助智能化工具进行主动预警、快速定位、及时处置等;可追溯:针对身份鉴别、用户行为、安全风险、数据操作等敏感事件进行申请审批、信息留痕以及日志记录等处理,实现重要操作可追溯,有效防范安全风险,确保平台正常运行。
同时,为加强对平台网信安全管理,杜绝各类安全隐患,根据国家《网络安全法》《数据安全法》《个人信息保护法》等法律法规要求,结合平台实际情况,制定了《平台安全管理规定》,基本建立了子平台属地化管理、平台资源使用申请、平台用户分级授权及平台软硬件加强维护等多项制度,切实提高平台规范化管理水平,有力推进平台持续快速发展。
3.2.4 自主可控
项目组聚焦医疗健康AI领域,通过自主研发集成EIhealth医疗智能体、Modelarts一站式AI开发平台、智能联邦学习算法以及MindSpore建模框架等先进功能,致力于高阶算子、平台底座、先进模型、高端算法
[25]以及云网边端整体架构的原创性探索与系统化应用,不断提高抗风险能力,提升可持续发展水平,增强安全防护实力,全面夯实自主可控、高质量发展的基石。
依托服务平台在医疗人工智能模型算法方面进行多项重要创新,主要包括基于实数阶总变差算子构建新损失函数,进而提出一种高分辨率能量匹配分割(HrEmS)框架用于高清3DCT影像的血管分割
[26];研制DenseNet-264模型用于新冠肺炎病灶的快速准确识别
[27];利用深度学习提取心脏超声彩色多普勒信号特征,自动进行心脏疾病辅助分类
[28]。通过协同创新,有效提升公共服务平台支撑能力和医疗人工智能产品的质量。
4 服务能力
医学人工智能公共服务平台主要提供了多模态数据、人工智能算力、AI模型研发等服务。
4.1 数据服务
针对多模态医学数据治理效率低、智能编码难度高等问题,以病种为导向,以患者为单位,按照时间轴线将数据进行集成与整合,研发医学数据分析工作流、工具软件等。同时,根据各成员医院的专科特色、技术优势进行病种分工,完成多模态医学数据标注,推动更多数据赋能人工智能。
4.2 算力服务
公共服务平台总算力约64.6 P(FP16)。面对不断增长的算力、安全、可持续发展等需求,围绕国产自主软硬件系统的兼容适配、平台底座系统的性能增强以及智能联邦学习机制的丰富完善,持续加大研发力度,不断提高计算平台建设质量和应用成效。
4.3 模型研发
依托公共服务平台,项目组研发了系列医学影像人工智能医疗器械产品,包括心脏超声、胸部CT、腹部CT、腹部超声、头颅MRI、冠脉CTA、妇科超声、骨折CT等系统;形成了“研究方向、研究方案、伦理审查、数据治理、标注审核、算法模型、测试产品、临床实验、知识产权”标准化研发模式、工程化实现流程、规范化临床评价,符合医疗行业特征、AI技术特性、产品监管要求;基本形成了科学规范、模态齐全、性能卓越的覆盖主要器官和重要疾病的人工智能筛查
[27]、辅助诊断
[28]与临床决策产品。
4.4 服务成效
医疗人工智能软件产品推广到全国7大区域20多个省市240家医疗机构。其中,统计46家医疗机构累计服务患者超过371万人次,240家医院预计上千万人次。同时,对接万里云医学影像远程平台,月均完成数万人次的AI影像辅助诊断,积极赋能广大基层医院,助力解决区域医疗资源分布不均、诊疗水平地区差异较大、传统服务模式效能不高等难题。此外,还联合国内知名高等院校和科研机构研制多个人工智能医疗器械行业标准
[29-34],有力推动医疗AI行业的整体发展。
5 小结
当前,人工智能技术发展正由数据驱动转向“数据+知识”双轮驱动,平台建设亟待加强,医疗AI向新而行。项目实施以来,我们严格遵守《网络安全法》《个人信息保护法》《数据安全法》等相关法律法规要求,围绕平台建设目标与服务内容,体系布局、整体规划、顶层设计、分步实施,坚守网络安全底线思维,发挥数据要素乘数效应,不断提升平台应对网信安全风险能力,持续增强平台在数据汇聚、治理分析、算法研究、模型构建以及应用推理等方面的服务支撑。
与国内现有平台相比,该项目采用“云-网-边-端”架构、自主可控平台系统、异构兼容训推算法、智能联邦学习机制、标准化流程化研发、公共服务创新模式等全新理念与方案,建成面向医疗健康行业的人工智能公共服务平台,探索解决医疗数据治理难、共享难、应用难等问题,实现数据不出院条件下模型跨平台训练、系统云边端推理、产品多中心应用难题,努力攻克多项软硬件基础核心技术,有力推动了我国医疗健康行业的人工智能高水平建设和高质量发展。
建设面向医疗健康行业的人工智能筛查和辅助诊断公共服务平台,不仅有利于进一步整合联合体各成员医院优质稀缺的专家团队、诊疗技术和医疗数据等资源,为广大人民群众提供更为优质、便捷的医疗服务,同时还有利于高标准、高质量地履行好医疗救治、健康保障等使命职责,持续增强技术研发实力和产业服务能力,助推新质生产力的快速跃升。
工业和信息化部科技司2020年产业技术基础公共服务平台项目(2020-0103-3-1)