先天性心脏病(congenital heart disease, CHD)是最常见的出生缺陷,全球及中国的患病率呈上升趋势,最新数据分别达8.22‰
[1]和8.98‰
[2-3]。随着诊疗技术的快速发展,CHD患儿的生存率显著提高,但神经发育迟缓问题随之凸显,成为影响长期预后的关键挑战
[4]。这种迟缓可能源于胎儿期异常血流动力学所致的脑灌注与氧供不足
[5-6]。临床发现,CHD儿童在学龄前及学龄期普遍存在运动、语言、记忆及信息处理速度等多维度发育落后,部分患儿智商偏低
[7]。这些缺陷不仅阻碍其学业与社交发展,更可能对成年后的职业生涯造成深远影响
[8]。尽管国际上已采用贝利婴儿发展量表(Bayley Scales of Infant Development, BSID)等工具对CHD儿童神经发育进行评估,但现有研究多局限于西方国家,且样本量普遍较小,导致统计效力不足。尤其在中国这一高发地区,相关研究虽已起步,却迫切需要系统性的数据整合。基于此,本研究通过Meta分析的方法,综合评估CHD儿童在认知、语言、运动功能及智商等方面的发育水平,并与健康儿童进行比较,同时通过亚组分析和敏感性分析探讨潜在异质性来源,旨在为CHD儿童神经发育迟缓的筛查与干预提供循证医学支持。
1 资料与方法
1.1 文献检索策略
计算机检索Web of Science、PubMed、Embase、万方数据库、中国知网、中国生物医学文献数据库及维普数据库中采用BSID量表(包括BSID-Ⅱ和BSID-Ⅲ)和韦氏智力量表对CHD儿童与健康对照儿童的神经发育状况进行评估的研究,同时追溯纳入文献的参考文献,补充获取相关文献。中文检索词为“先天性心脏病”“先天性心脏缺陷”“贝利婴儿发展量表”“韦氏儿童智力量表”;英文检索词为“congenital heart disease”“Bayley Scales of Infant Development Ⅱ”“Bayley Scales of Infant Development Ⅲ”“Wechsler Intelligence Scale for Children”“Wechsler Preschool and Primary Scale of Intelligence”。采取主题词与自由词相结合的方式,检索时间为各数据库建库至2025年2月20日。
1.2 文献纳入与排除标准
纳入标准:(1)研究对象为CHD儿童;(2)采用BSID量表或韦氏智力量表评估;(3)结果以均值±标准差表示;(4)设有健康对照组;(5)研究设计为队列、病例对照或横断面研究。
排除标准:(1)缺乏原始数据;(2)会议摘要、综述、社论、评论及非同行评审报告等;(3)重复文献。
1.3 文献筛选与资料提取
由两名研究者独立筛选文献、提取数据及进行质量评估。如有分歧,通过讨论或咨询通信作者予以解决。提取的数据包括第一作者、发表年份、研究所在地区、研究设计类型、病例组与对照组样本量、结局测量工具、评估年龄、量表各项得分、是否手术治疗等。
1.4 文献质量评价
采用Newcastle-Ottawa量表评估队列研究和病例对照研究的质量:当评分≥7分时,认为该研究的质量较高
[9]。采用美国医疗研究与质量署标准评估横断面研究的质量:8~11分代表高质量,4~7分代表中等质量,≤3分代表低质量
[10]。
1.5 量表内容
(1)BSID量表适用于1~42月龄儿童,其中BSID-Ⅱ量表包括智力发育指数(mental development index, MDI)和精神运动发育指数(psychomotor development index, PDI);BSID-Ⅲ量表包括认知复合评分(cognitive composite score, CCS)、语言复合评分(language composite score, LCS)和运动能力复合评分(motor composite score, MCS),标准得分均为100±15
[11-12],其子测验(接受性/表达性语言、精细/粗大运动)评分为10±3
[13-14]。
(2)韦氏智力量表分为学前及初小智力量表(Wechsler Preschool and Primary Scale of Intelligence, WPPSI)和儿童智力量表(Wechsler Intelligence Scale for Children, WISC)
[15-16]。WPPSI适用于2岁6个月至7岁7个月的儿童;WISC适用于6岁至16岁11个月的儿童。WPPSI包括总智商(full-scale intelligence quotient, FIQ)、语言智商(verbal intelligence quotient, VIQ)和操作智商(performance intelligence quotient, PIQ);WISC-Ⅳ/Ⅴ则主要包括FIQ及多个认知指数,标准得分均为100±15,其子测验评分为10±3
[17]。
1.6 统计学分析
采用Hedges' g计算CHD患儿与健康对照在神经发育得分方面的差异的效应量。Hedges' g值的大小反映效应强度(0.2为小效应,0.5为中等效应,0.8及以上为大效应),负值表示CHD患儿的得分低于健康对照。研究间的异质性通过Cochran's Q检验(检验水准α=0.10)和I2统计量进行评估。若异质性不显著(P≥0.10)且I²值较低(<50%),提示研究间一致性较好,采用固定效应模型分析;若异质性显著(P<0.10)或I²值较高(≥50%),则采用随机效应模型分析。为探讨异质性的来源,进行亚组分析,分层变量包括研究设计、地区、样本量、匹配情况、研究质量评分及CHD亚型。采用逐项剔除法进行敏感性分析,采用Egger检验(P<0.1)和漏斗图评估发表偏倚。所有统计分析均在Stata/SE 17.0(StataCorp LLC)中完成,显著性水平设定为0.05(双侧检验)。
2 结果
2.1 文献检索结果
共检索出882篇文献,根据纳入和排除标准剔除849篇,最终纳入33篇文献。其中,有关BSID-Ⅲ量表的研究11篇
[15,18-27],BSID-Ⅱ量表的研究10篇
[28-37],韦氏智力量表的研究12篇
[38-49]。筛选流程见
图1,纳入文献的基本特征见
表1。
2.2 文献的基本特征与质量评价
纳入的21项BSID量表研究共涉及2 189名受试者,12项韦氏智力量表研究共涉及1 127名受试者。所纳入的研究质量均为中、高质量,见
表1。此外,部分研究中包含不同年龄组或CHD类型的数据,在Meta分析中均作为独立数据组处理。
2.3 Meta分析结果
2.3.1 BSID-Ⅱ量表分析结果
图2显示了CHD组与对照组在BSID-Ⅱ量表得分上的Meta分析结果。研究间异质性高(MDI:
I²=91.58%;PDI:
I²=93.00%),采用随机效应模型进行分析。结果显示,与对照组相比,CHD组在MDI和PDI得分上均显著降低(MDI:
Hedges's g=-1.09,95%
CI:-1.56~-0.63;PDI:
Hedges's g=-1.22,95%
CI:-1.75~-0.70)(均
P<0.001)。
2.3.2 BSID-Ⅲ量表分析结果
图3显示了CHD组与对照组在BSID-Ⅲ量表得分上的Meta分析结果。研究间异质性较低(CCS:
I²=0.00%;LCS:
I²=47.89%;MCS:
I²=45.23%),采用固定效应模型进行分析。结果显示,与对照组相比,CHD组在CCS、LCS和MCS得分上均显著降低(CCS:
Hedges's g=-0.78,95%
CI:-0.91~-0.65;LCS:
Hedges's g=-0.65,95%
CI:-0.79~-0.51;MCS:
Hedges's g=-0.98,95%
CI:-1.12~-0.83)(均
P<0.001)。此外,CHD组在接受性交流、表达性交流、精细运动和粗大运动上的得分均显著低于对照组(
P<0.001)(
表2)。
2.3.3 韦氏智力量表分析结果
图4显示了CHD组与对照组在韦氏智力量表得分上的Meta分析结果。涉及FIQ和PIQ的研究间异质性较低(FIQ:
I²=47.68%;PIQ:
I²=0.00%),采用固定效应模型进行分析。涉及VIQ的研究间异质性较高(
I²=74.20%),采用随机效应模型进行分析。结果显示,CHD组的FIQ、PIQ和VIQ得分均显著低于对照组(FIQ:
Hedges's g=-0.74,95%
CI:-0.86~-0.61;VIQ:
Hedges's g=-0.86,95%
CI:-1.22~-0.49;PIQ:
Hedges's g=-0.67,95%
CI:-0.83~-0.50)(均
P<0.001)。
CHD组在图片补缺、积木设计、常识、词汇,以及言语理解指数、知觉推理指数等子测验方面的得分均显著低于对照组(
P<0.05),见
表2。
2.4 亚组分析
根据研究设计类型(队列研究、横断面研究)、地区分布(亚洲、欧洲、北美洲和大洋洲)、CHD组和对照组是否匹配、样本量大小(<100、≥100)、研究质量评分(高质量、中等质量)以及CHD亚型(发绀型、非发绀型和混合型)对合并效应量Hedges's g进行了亚组分析。对有关BSID-Ⅱ量表的研究分析显示,研究质量评分可能是MDI异质性的来源(P=0.026)。对有关BSID-Ⅲ量表的研究分析显示,地区分布可能是LCS(P=0.017)和MCS(P=0.007)异质性的来源。对有关韦氏智力量表的研究分析显示,地区分布可能是FIQ(P=0.015)异质性的来源,而研究质量评分(P=0.043)和CHD亚型(P=0.003)可能是VIQ异质性的来源。亚组分析中,发绀型CHD的合并效应量(Hedges's g=-2.33)大于非发绀型CHD(Hedges's g=-0.86),提示发绀型CHD可能与VIQ更明显的下降相关。
2.5 敏感性分析
敏感性分析显示,在逐一剔除单个研究后,合并效应量始终保持稳定。具体而言,在BSID-Ⅱ量表中,MDI的Hedges's g变化范围为-0.91~-1.17,PDI的变化范围为-0.99~-1.31;在BSID-Ⅲ量表中,CCS的Hedges's g变化范围为-0.73~-0.81,LCS为-0.60~-0.70,MCS为-0.87~-1.02;在韦氏智力量表中,FIQ的Hedges's g变化范围为-0.70~-0.78,VIQ为-0.72~-0.96,PIQ为-0.61~-0.73。各分析的95%CI均未跨越无效线,统计学显著性均得以保持(P<0.001)。未发现任何单一研究对总体效应量产生不成比例的影响,提示研究结果具有良好的稳健性。
2.6 发表偏倚
Egger回归分析和漏斗图结果显示,除BSID-Ⅱ量表的MDI(漏斗图提示)及韦氏智力量表的VIQ(Egger回归检验:P=0.045)存在潜在发表偏倚外,其余指标均未发现明显发表偏倚(P>0.1)。经剪切填补法调整后,MDI的效应量Hedges's g=-1.31(95%CI:-1.73~-0.88),VIQ的效应量Hedges's g=-0.86(95%CI:-1.22~-0.49),提示结果稳健。
3 讨论
本研究通过对BSID量表(Ⅱ版、Ⅲ版)及韦氏智力量表进行Meta分析,系统性地评估了CHD儿童与健康对照儿童的神经发育差异。本研究结果显示,CHD儿童在多个核心神经发育领域均表现出显著落后,包括认知、语言、运动功能及智力水平。这些发现不仅在统计学上具有显著性,其效应量也达到了较高的水平,这提示该神经发育落后在临床实践中具有重要的潜在意义。CHD对神经发育的不利影响可能源于多重机制,包括脑部缺氧与血流动力学异常、围手术期应激与损伤,以及遗传和表观遗传因素。值得注意的是,CHD对神经发育的影响并非仅限于婴幼儿期(基于BSID量表的评估),在学龄前及学龄期(基于WPPSI/WISC的评估)同样存在智力发育落后,说明这种不利影响可能具有持续性。因此,早期识别与干预尤为关键。本研究从全球视角综合评估CHD对儿童神经发育的广泛影响,为相关临床干预提供了更具说服力的循证依据。
尽管近年来有关CHD儿童神经发育的研究逐渐增多,但大多数研究样本量有限(10~300例),结果分散,难以形成整体性的认识。本研究通过Meta分析整合现有证据,显著提高了统计效能,增强了结果的稳健性和外部推广性。值得指出的是,虽然BSID量表和韦氏智力量表是国际公认的神经发育评估工具,但部分研究在具体应用中未对语言、运动等不同功能维度进行细化区分,这可能影响结果的精确性与可比性。
本研究的亚组分析进一步揭示了神经发育结局中异质性的潜在来源。结果显示,地理区域可能是LCS、MCS和FIQ的异质性来源,而研究质量评分和CHD亚型则可能是VIQ的异质性来源。地理区域差异可能与医疗资源可及性、社会经济水平以及语言与文化背景相关,这些因素均可能通过教育环境和康复服务的差异间接影响神经发育结局。研究质量评分的作用则提示方法学设计、样本选择及评估工具的差异会对效应估计产生重要影响,强调了未来研究在设计和报告方面需要更高的规范性。本Meta分析显示,发绀型CHD(
Hedges's g=-2.33)对VIQ的负面影响显著大于非发绀型CHD(
Hedges's g=-0.86),提示发绀型CHD所导致的生理性缺氧可能对大脑中负责言语和抽象思维的特定功能区域造成了更严重的损害。这与Feldmann等
[50]的研究结果一致。这种差异可能源于复杂CHD导致的脑部低灌注与慢性缺氧
[51],以及更复杂的手术与术后恢复过程
[52]。既往Karsdorp等
[53]指出,重度CHD儿童PIQ受损更为显著,而本研究中VIQ受损尤为突出,或因所纳入的发绀型CHD病例以法洛四联症为主。法洛四联症患儿因术前长期低氧血症和术后循环动力学改变,更易出现语言功能的持续性损害。Ma等
[40]亦发现,法洛四联症术后皮质厚度减少与VIQ下降相关,为这一推测提供了神经影像学证据。
目前,国内外BSID量表用于评估CHD婴幼儿神经发育的Meta分析仅有4项
[54-57],且存在局限性:(1)多数研究未设健康对照组,仅与标准均值比较,可能高估或低估CHD的影响;(2)研究范围受限,部分研究仅关注单一维度,如Sprong等
[55]仅评估重度CHD患儿的运动发育,而Snookes等
[57]仅分析术后CHD儿童的认知和运动发育情况;(3)CHD亚型覆盖不全面:Huisenga等
[56]仅分析复杂型CHD,Turner等
[54]和Sprong等
[55]则仅关注危重型CHD。此外,Huisenga等
[56]的研究主要基于欧洲和北美的数据,而本研究则纳入了亚洲的研究,扩展了地域代表性。关于韦氏智力量表,Feldmann等
[50]仅探讨了总的智力水平;Karsdorp等
[53]对中国研究的覆盖有限;Mills等
[58]则聚焦青少年CHD患者。本研究的优势在于同时整合BSID量表和韦氏智力量表,并纳入健康对照儿童进行直接比较,从而更准确地评估CHD对神经发育的影响。
本研究存在的局限包括:(1)仅纳入BSID量表和韦氏智力量表有关研究,可能限制对CHD相关神经发育的全面评估;(2)手术方式等手术相关因素因原始文献信息不足未纳入分析;(3)多数样本来自国外,诊疗策略和康复的差异可能影响外部适用性;(4)缺乏心脏科专家参与,未来应加强多学科合作以提升临床指导价值。
综上所述,本Meta分析表明,与健康儿童相比,CHD儿童在认知、语言、运动及智力水平各维度均显著落后,凸显了早期系统性筛查与干预的紧迫性。未来应整合多中心数据,深入探究不同CHD亚型、手术方式等因素对神经发育的影响机制,为制定个体化干预策略提供依据,从而进一步改善患儿的远期预后。