近年来,人工智能(artificial intelligence,AI)技术在医疗领域的应用日益广泛,各国均重视其发展并制定相关政策,标志AI的发展迈入全新战略发展阶段
[1]。在我国,医学AI已成为国家人工智能发展战略的关键组成部分。电子病历、健康监测、智能诊疗等技术已深度融入日常医疗,推动医疗服务向信息化、智能化转型
[2],医学决策也逐渐由经验和指南转向大数据分析指导。
随着应用范围扩大,现阶段对AI相关的医学复合型人才的需求激增。教育部部长怀进鹏表示,将AI技术深入教育教学和管理全过程,加强高层次复合型人才培养,提升科学创新能力,加快平台建设
[3]。然而,我国在该领域的人才储备尚不足以满足AI的发展趋势
[4]。近年来,国内各类学科虽陆续进行AI融合的教育改革,开设相关多元化课程,但鲜少有专门面向医学生的技术课程。有研究
[5-6]显示,医学生普遍缺乏人工智能基础知识,且培养方案存在定位不明确、不完善等问题。
现有研究
[7]表明,准备度是人才培养效果的重要影响因素。该指标能对技术定位、能力提升、培养方案优化起到重要作用
[8],精准评估医学生在人工智能领域的发展情况,有助于决策者制定更加精准的培养计划,实现因材施教。在全球AI研究不断深入的背景下,关于人工智能准备度的探讨已从通用领域延申至多个专业语境,如公共服务治理
[9]、法律教育
[10]、教师教育
[11-12]以及中小企业可持续发展
[13]等,初步揭示了技术接受度、“任务-技术”匹配、伦理认知等因素对特定群体AI准备度的影响机制。与上述领域相比,医学生群体具有更强的专业特殊性与实践导向性,其AI准备度不仅涉及技术掌握和态度倾向,更直接关系到临床决策的准确性、医疗流程的安全性以及患者结局的改善
[14]。因此,本研究聚焦医学生群体,旨在厘清其AI准备度的现状及关键影响因素,为医学AI教育体系的构建提供学科依据与参考。本研究中,AI准备度被定义为医学生对人工智能技术的应用意愿与能力水平。本研究将对医学生的AI准备度现状及其影响因素展开研究,以期为优化人才培养提供科学依据。
1 对象与方法
1.1 调查对象
选取北京市某重点高等医学院校在校本科生作为研究对象,包括临床医学、临床药学、护理学等专业。纳入标准:①本科在读;②具备使用手机或电脑等设备进行填答问卷的能力;③已知情同意。根据样本量应为测量量表条目数量的5~10倍的原则
[15],本研究问卷量表共包含41条条目,因此所需样本量至少为205例。
1.2 调查工具
本研究采用问卷调查法进行数据收集,问卷分为3部分:医学生的基本信息、对人工智能的准备度以及相关影响因素。其中,准备度使用了医学生医学人工智能准备量表(medical artificial intelligence readiness scale for medical students,MAIRS-MS)
[16],该量表由土耳其的研究团队研究开发并验证,具有良好的信效度。量表包括22个项目,采用五级李克特量表(非常不同意1分,不同意2分,不确定3分,同意4分,非常同意5分),对学生在人工智能准备度的4个领域进行评分:认知(8题,总计40分)、能力(8题,总计40分)、愿景(3题,总计15分)和道德(3题,总计15分)。相关影响因素部分同样使用五级李克特量表,基于任务技术匹配理论和技术接受模型两个理论框架
[17-18],从任务技术匹配(7题)、感知有用性(4题)、感知易用性(3题)3个维度进行调查,共70分,具体内容详见
表1。
1.3 数据收集与质量控制方法
本研究通过发放电子问卷,首先在小范围内进行预调查,以评估问卷设计的适宜性及医学生对问卷各项条目的理解程度。根据预调查的结果,对问卷内容进行了相应的调整,以确保问卷的质量。根据预调查样本量应占总体样本量的20%~30%原则,本研究的预调查样本量设定为45例。对问卷进行信效度检验,结果显示Cronbach’s α系数>0.7,说明问卷信度良好;描述性统计量KMO值大于0.6,Barteltt球形检验显著性<0.001,拒绝虚无假设,表明各观测变量间存在相关性,适合因子分析。2024年6月,采用方便抽样方法,由“问卷星”小程序发放网络问卷至该校本科医学生。在正式调查调查结束后,逐一核查每份回收问卷,剔除不合格问卷。剔除标准为:①问卷填写不完整、漏填或错填;②问卷存在逻辑错误。完成所有数据录入后,进行随机抽样检验,以保证数据与原始问卷的一致。本研究共发放问卷300份,剔除不合格问卷35份,最终纳入有效问卷265份,有效回收率为88.3%。
1.4 统计学方法
采用Excel建立数据库,使用SPSS 26.0软件进行统计分析与处理。计数资料采用例数(百分比)[
n(%)]表示,采用卡方检验进行比较分析;计量资料采用均值±标准差($\bar{x}$±
s)表示,以理论中值衡量其得分情况,采用
t检验和方差分析进行比较。其中,理论中值
[16]是在以往研究中被广泛使用的指标
[20],即为在缺少常模参照的情况下,用于评估量表得分水平的值:(最低分+最高分)÷2÷项目数,结合平均值能够更好地说明数据的分布情况。最后,以感知有用性、感知易用性和任务技术匹配3个因素分别作为自变量,以医学生医学人工智能准备度量表总分作为因变量,将性别、年级、专业、是否使用过人工智能作为控制变量,使用多元线性回归分析对任务技术匹配、感知有用性、感知易用性等因素进行影响因素分析。以
P<0.05为差异有统计学意义。
2 结 果
2.1 医学生基本情况
在265例有效样本中,医学生基本情况详见
图1。其中,男生93名、女生172名,而男生中使用过人工智能的有80名,占使用过人工智能总人数的38.3%;女生中使用过人工智能的有129名,占使用过人工智能总人数的61.7%(
P<0.05)。样本中男女性别比例与该校在校医学生女多男少的分布特点一致。
从年级分布来看,大四年级人数最多,共77名(29.1%),其中55名(26.3%)使用过人工智能;大五年级人数最少,仅6名(2.9%),但该年级学生均使用过人工智能(P<0.05)。
2.2 医学生人工智能准备度情况
在医学生人工智能准备度量表的得分中,各维度得分如下:认知维度为(26.76±8.20)分,能力维度为(29.44±7.00)分,均高于理论中值24分;愿景维度为(11.17±2.70)分,道德维度为(12.51±2.50)分,均高于理论中值9分。量表总得分为(79.88±18.00)分,各维度平均值均显著高于理论中值(
P<0.01)。这表明医学生在人工智能准备度方面整体表现良好,具备一定的认知基础和应用能力(
表2)。
从性别来看,男生的平均得分为(84.34±14.14)分,高于女生的(77.46±19.45)分,提示男生在人工智能准备度方面整体表现优于女生(
表3)。在年级分布中,大五年级医学生的准备度得分最高,为(94.33±17.76)分;大一年级得分最低,为(71.36±19.18)分(
表4)。在专业层面,儿科专业学生的得分最高,为(99.4±7.13)分;眼视光医学专业学生的得分最低,为(65.6±19.78)分(
表5)。
2.3 影响因素分析
多元线性回归分析结果表明,感知易用性和任务技术匹配均对医学生的人工智能准备度产生显著正向影响。感知易用性的回归系数为1.883,任务技术匹配的回归系数为1.074,差异有统计学意义(P<0.01)。这表明在相同条件下,感知易用性对医学生人工智能准备度的提升作用更为显著,其影响程度高于任务技术匹配。
3 讨 论
3.1 医学生AI使用普遍但认知不足,应加强系统性课程建设
本研究结果表明,大多数受调查医学生均已接触并使用过人工智能,各年级与专业中超过半数的学生具备使用经验,这一趋势与相关文献一致
[21-22]。近年来,人工智能在医学领域的应用范围迅速扩大,特别是在重症医学、全科医学、检验医学及公共卫生等领域,显著推动了研究的精准化与高效化。在此背景下,医学生接触人工智能的机会显著增加。这也凸显出加强医学生人工智能教育的迫切需求,通过提升医学生的人工智能素养,不仅能够支持其在医学细分领域的临床实践和科研工作,还有助于进一步推动人工智能技术的优化与应用,从而加速医学科技的进步与发展。对AI教育的迫切需求并非我国独有,在其他国家的医学教育中也同样显现,如黎巴嫩的研究显示96.20%的医学生认为应接受AI教育
[23],这与本研究中较高的AI使用率共同表明,加强医学人工智能教育是一项受到广泛认可的迫切需求。
与此同时,医学生对人工智能的认知与应用能力仍有待增强。为此,本研究建议医学院校将人工智能课程系统化、常态化,将相关知识体系有机融入医学教育的各个阶段。特别是在基础医学与临床实践的这两个关键环节,增设人工智能相关内容的教学模块,涵盖数据分析、算法应用及医学图像处理技术等,以提升学生的认知水平
[24];同时,还应特别关注医学伦理教育,着重引导学生探讨我国人工智能伦理与法律框架内可能存在的空白区域,并引导其形成科学的道德思辨能力。
鉴于医学生专业知识内容的复杂性和专业性,笔者建议医学院校单独增设医学人工智能相关专业,辅助临床医学生使用人工智能。两类人才协同工作,将促进医学与人工智能技术融合,发挥更大效能。
3.2 医学生AI能力与伦理素养相对薄弱,需深化课程内涵并贯通伦理教育
本研究中,医学生人工智能准备度量表各项得分从整体上看均高于理论中值,表明其准备状况较为理想。然而,不同维度得分存在显著差异。其中,能力维度和道德维度的得分低于认知维度与愿景维度,与国外同类研究
[20]结果相符。能力维度得分较低可能缘于医学生课业负担沉重,导致其缺乏足够时间和精力深入探索人工智能技术
[25]。而道德维度得分相较低则可能归因于国内医学人工智能立法的不完善与伦理监管的滞后性。医学人工智能技术快速迭代,也给道德规范的制定带来挑战。大五年级学生的准备度得分在所有年级中得分最高,这一结果可能由于其已完成医学主要课程学习,且具备一定计算机相关知识基础,对人工智能的理解较为深入。而儿科学学生的准备度得分在所有专业中呈现最高。但考虑到本研究纳入的儿科专业医学生样本量可能相对较小,所选样本均拥有医学人工智能的使用经历,故而对人工智能的了解较为充分。
已有相关研究为医学生“能力与道德维度得分较低”这一问题提供更具体的线索。如在阿曼虽已在医学预科阶段设置AI课程,但学生在认知维度依然得分最低
[26],这表明课程能否有效提升学生能力,关键在于与临床实践结合的深度,而非仅仅开设了课程。而在印度研究
[27]中,高年级医学生的伦理意识呈现出减弱的反常现象,则警示了伦理教育若未能与专业成长同步深化,其影响力可能随着专业技术学习的深入而衰减。这些发现共同表明,未来的医学人工智能课程设置要与临床实践紧密结合,并贯穿道德伦理教育于其中,避免流于形式。
鉴于提高技术接受度与普及性可显著提升医学生人工智能准备度,且医学生在此方面存在年级与专业差异,医学院校需开展大规模调查,旨在了解医学生对人工智能课程的需求与学习意向,以满足不同年级与专业学生的需求,构建广泛的医学人工智能教学体系。建议将人工智能引入高等医学院校开设的课程中,营造积极的科研创新氛围,激励医学生通过自主学习接触人工智能,从而提升学生对人工智能的感知易用性;同时,人工智能可辅助教学,提供新的授课方式,增加学生兴趣与专注度,进而增强医学生对人工智能的感知易用性。
3.3 以需求为导向推动AI与医学教育场景融合
多元回归分析结果表明,感知易用性与任务技术匹配度对医学生人工智能准备度产生显著正向影响。其中,感知易用性的影响尤为突出,表现为当医学生认为人工智能技术易于理解与操作时,其准备度显著提高。这与关于大学生使用ChatGPT影响因素的研究
[22]结果一致。人工智能技术的不断优化,使其在易用性和操作友好性上表现优越,进一步激发了医学生主动探索与学习的积极性
[28-29]。
此外,任务技术匹配度亦是影响准备度的重要因素。当人工智能技术特性能够有效满足医学生任务需求时,学生对技术的接受度和使用意愿均有所增强。这指出了一个重要问题——通用的人工智能工具往往不能满足医学生具体的、专业性的需求。巴基斯坦的研究
[30]显示,医学生虽然认可AI的价值,却很少在临床中实际使用。其关键原因在于,当前许多人工智能工具的功能与医学生真实的见习、实践等场景脱节。因此,相关开发人员应重视其在人工智能应用的开发及使用过程中的重要意义。为精准贴合医学生实际需求,建议调研医学生在学习和临床实践中的痛点与期望,并强化与医学专业人员的深度合作,共同推进人工智能技术的优化与应用。同时,将人工智能融入医学教育,通过临床模拟等实验辅助医学生完成任务,提升技能。这些措施是提升医学生人工智能准备度的有效途径,有助于他们更好地掌握人工智能技能。
4 结 语
国务院办公厅《关于加快医学教育创新发展的指导意见》
[31]中指出应建立“医学+X”多学科交叉融合平台和机制。医学院校作为践行医学教育的主力军,承担着为祖国的卫生健康事业培养大批优秀人才的重要任务。现今,“人工智能+医学”是世界医学教育研究中的热门方向
[32],其发展对推动中国医学教育向“高质量、高效率、可持续”的方向前进具有重要意义
[33]。本研究通过对北京市某医学院校本科生的调查,揭示了医学生对人工智能的准备度现状,并证实感知易用性与任务技术匹配是影响其准备度的关键因素。结果表明,当前医学生虽具备一定的AI应用基础,但在能力构建与伦理认知层面仍需加强。基于此,本文提出的将AI系统化融入课程、以学生为中心提升技术易用性,以及加强AI与医学任务关联性等建议,为医学院校开展智能教育提供了有针对性的实践路径。
本研究仍存在一定局限性:①单中心方便抽样可能导致样本代表性不足,限制结果向更广泛医学生群体的外推;②研究对象局限于本科医学生,而非涵盖研究生或临床医师等不同职业阶段的群体,制约了结论的普适性;③本研究选择使用的方便抽样法,存在选择偏倚。
展望未来,本研究作为一项单中心的横断面调查,为后续研究奠定了基础。为更深入、动态地理解医学生AI准备度的演变规律及教育干预的长期效果,未来研究可考虑开展多中心、大样本的调查,以增强结果的普适性
[34];并可进一步设计纵向队列研究,追踪医学生从入学至毕业乃至职业生涯早期的AI素养发展轨迹,从而为构建贯穿医学教育全程的人工智能培养体系提供更坚实的证据支持。