慢性脑灌注不足(chronic cerebral hypoperfusin,CCH)是老年脑损伤和血管性认知障碍的关键上游病理状态,但目前缺少明确、可操作的药物靶点
[1]。脑白质高信号(white matter hyperintensities,WMH)是CCH相关白质损伤的一种可量化影像学标志,并且与卒中、痴呆及死亡风险的升高密切相关,这凸显了其重要的临床与流行病学意义
[2]。观察性研究本身难以阐明低灌注、白质损伤以及多种病因并存现象之间的因果联系;因此,需要借助更强大的工具来推断暴露因素与临床结局之间的因果关系
[3]。
孟德尔随机化(Mendelian randomization,MR)方法利用与可改变暴露因素强相关的遗传变异作为“自然随机化”的工具变量,能够有效减少混杂偏倚和反向因果的干扰,已被广泛应用于识别潜在的可干预通路和药物靶点
[3-4]。在蛋白质组学研究中,优先选择顺式蛋白数量性状位点(protein quantitative trait loci,pQTL)作为工具变量,能提高生物学解释的清晰度并减少远端多效性影响,该方法在各种疾病的靶点优先级排序中已展现出其价值
[5-6]。与此同时,贝叶斯共定位分析能够在基因座层面判定暴露因素与结局是否更可能由同一个因果变异驱动,这有助于避免对“显著但位于不同峰值”的遗传信号产生误读,从而为MR结果提供正交证据支持
[6]。
与脑脊液(cerebrospinal fluid,CSF)相比,血浆蛋白检测具有侵入性小、可扩展性强、成本更低等优势,这使得研究人员能够获得更大的pQTL样本量以及统计效力更强的工具变量;此外,血浆对血管-内皮界面来源的信号尤为敏感,这与CCH的血管病理本质相契合
[7-8]。因此,选择血浆蛋白作为暴露因素,一方面是因为大规模人群的血浆pQTL资源已趋成熟且易于扩展——这为开展两样本MR分析提供了强有力的工具;另一方面则是因为血浆能灵敏地反映与CCH病理机制密切相关的血管-内皮信号,这对于后续的机制推断和临床转化潜力至关重要
[9-10]。值得注意的是,近期已有研究将脑脊液/血浆pQTL与WMH、血管周围间隙(perivascular spaces,PVS)等磁共振成像(magnetic resonance imaging,MRI)白质指标相结合进行MR分析,为生物体液中的蛋白质与白质影像学改变之间的因果关联提供了初步证据,也间接支持了本研究方法的可行性
[11]。
基于上述考量和方法学优势,本研究将WMH视为CCH所致白质损伤的主要特征,开展了双样本蛋白质组MR分析,并利用贝叶斯共定位在基因座层面强化了因果关系的解读。为了评估本研究结论在CCH相关不同终点间的一致性,课题组进一步利用大样本资源进行了跨终点的一致性验证
[12-13]。在细胞定位方面,本课题组整合了人类蛋白质图谱的人脑单核转录组图谱[涵盖11个脑区、34种细胞类型,提供标准化的每百万转录本数(normalized Transcripts Per Million,nTPM)矩阵],将遗传/因果信号投射到内皮细胞、周细胞、血管平滑肌细胞和成纤维样细胞等关键谱系上,以辅助生物学解读,旨在系统性地发现并分层评估与白质损伤相关的候选蛋白质。
1 资料与方法
1.1 研究设计与终点指标
本研究的工作流程如
图1所示。本课题组筛选了来自8项大型欧洲蛋白质组学研究资源的血浆pQTL集,并评估了其与全基因组关联研究(Genome-Wide Association Study,GWAS)数据集的关系:WMH(主要指标)
[14]、PVS(方向性验证)
[12]及腔隙性卒中(lacunar stroke,LS)(方向性验证)
[13]。随后,依据以下4个证据层面对蛋白靶点进行分级评估:①蛋白质组孟德尔随机化分析;②基因座水平的贝叶斯共定位分析;③跨终点一致性验证;④基于人脑单核转录组图谱的细胞类型定位。
1.2 蛋白质组学工具变量
如前所述
[15],本研究整合了8项针对欧洲血统人群开展的蛋白质组学研究:Fenland(10 708名参与者,4 775种蛋白质)
[16]、Iceland(35 559名参与者,4 719种蛋白质)
[8,17]、INTERVAL(3 301名参与者,2 995种蛋白质)
[7],UKB-PPP (34 557名参与者,2 922种蛋白质)
[18],UKB-PPP第一阶段 (35 571名参与者,1 463种蛋白质)
[19],KORA F4(1 000名参与者,1 124种蛋白质)
[20],SCALLOP(30 931名参与者,90种蛋白质)
[21],以及FHS(6 861名参与者,71种蛋白质)
[22],所纳入蛋白质组学研究的详细信息见
表1。数据标准化与跨研究合并遵循既往工作流程
[15];最终形成的每种蛋白质工具集部分展示在
表2。
关于层粘连蛋白测量的说明:在INTERVAL研究(使用SomaScan技术平台)中,部分适配体可结合层粘连蛋白不同亚基上的共同表位;该平台采用蛋白质组注释,因此将该检测标识为“LAMB1/LAMC1/LAMA1”。鉴于此,本课题组将该检测作为1个整体指标进行分析,但仅提取了LAMC1基因座±500 kb范围内的顺式(cis)变异作为遗传工具变量,原因是该检测所有显著的顺式pQTL均锚定在LAMC1基因座(在LAMB1或LAMA1基因座±500 kb范围内未发现独立的、达到显著性阈值的顺式工具变量)。因此,本研究的MR估计值在统计学上等效于对LAMC1(γ1链)的遗传代理效应,而非跨基因的聚合效应。
1.3 结局数据处理与基因组版本对齐
WMH、PVS和LS的汇总统计数据均对齐至同一基因组版本(hg19/GRCh37),并经标准化处理,确保效应量在暴露变量与结局变量间均指向相同效应等位基因
[23]。
1.4 MR主要分析
若在聚类(clumping)后仅剩1个工具变量,本研究采用Wald比率法并结合Delta法计算标准误(standard error,SE)。若有2个或以上独立工具变量可用,则采用逆方差加权(inverse-variance weighted,IVW)固定效应模型来合并各SNP的比率估计值。结果以比值比(OR)、95%CI及双侧
P值的形式报告。必要时采用Cochran’s Q统计量描述异质性,并以加权中位数法或MR-Egger法作为敏感性分析进行参考,但不将其用于主要结论的推断
[24-26]。错误发现率(false discovery rate,FDR)控制在0.05
[27]。
1.5 贝叶斯共定位分析
本课题组采用贝叶斯共定位法检验特定基因座上的MR暴露与WMH关联是否由同一因果变异驱动。针对每种蛋白质,将分析窗口锚定于暴露侧哨兵变异位点,并在hg19基因组构建中±1 000千碱基的对称窗口内比较暴露与结局效应量及标准误。仅当变异在等位基因水平标准化及基础质量检查后同时存在于两数据集时才纳入分析。先验概率设定为:暴露关联0.000 1,结局关联0.000 1,共同关联0.000 01。汇总了5项标准假设的后验支持度,重点关注共享因果变异概率(PP4)与不同因果变异概率(PP3)。将PP4>0.80视为强支持共享变异,0.50~0.80视为提示性支持,<0.50视为支持不足。PP3接近1则表明存在独立变异
[28]。
1.6 跨终点一致性
对于PVS,本研究采用了2023年发表于《自然-医学》(
Nature Medicine)的多队列GWAS/WES/WGS资源(样本量高达38 598名参与者),其通路富集分析结果突出了细胞外基质(extracellular matrix,ECM)/发育过程——这与WMH的生物学背景非常契合,十分适用于方向性重复验证
[12]。对于LS,采用了2021年发表于《柳叶刀-神经病学》(
Lancet Neurology)的国际病例对照GWAS(约7 338例病例 vs. 254 798例对照),并据此生成了相应的荟萃分析汇总统计数据
[13]。针对这2个外部终点,采用了与WMH分析相同的工具变量选择、数据协调和估计流程,并主要在作用方向层面上与WMH的结果进行比对解读
[23]。
1.7 单核脑图谱与细胞类型定位
为将遗传/因果线索投射到特定细胞类型,本研究采用了HPA人脑单核转录组图谱。其下载站点提供了34种细胞聚类类型×基因的nTPM矩阵,覆盖11个脑区,并附有标准化的字段说明和文档。采用统一尺度的点图(dot plot)来展示4种候选蛋白(ACOX1,ART4,MGP及层粘连蛋白复合物)在这34种细胞类型中的绝对表达量和检测比例,避免了仅在部分细胞亚集中进行排名展示可能带来的解释偏倚;该图谱整合了来自公共单核RNA测序(snRNA-seq)数据集的超过250万个脑细胞核。
1.8 质量控制与稳健性
连锁不平衡(linkage disequilibrium,LD)参考数据和等位基因频率均来自1000 Genomes Project(第三阶段,欧洲人群),用于在回文SNP位点进行聚类和链推断,确保了跨资源数据的一致性
[29]。所有MR和共定位分析均使用相同的基因组版本(hg19)并采用双侧检验。通过数量级变化调整聚类参数和共定位先验概率来进行稳定性检验,报告结果以主要分析为准,敏感性分析结果作为支持性证据
[23]。
1.9 伦理声明
本研究仅使用公开的去识别化GWAS汇总统计数据及在线资源;原始研究均获得适当伦理审批及知情同意程序。未涉及新受试者招募或干预措施。
2 结果
2.1 筛查结果与后续分析范围
在以WMH为主要终点的全蛋白质组MR筛查中,经多重检验校正(FDR<0.05)后,共有13种蛋白质与WMH存在关联,它们分别是:ACOX1、ARL1、CTF1、DCK、NEFL、PDZK1IP1、RGS7、SARS、TBCA、SNRPF、ART4、MGP及LAMB1_LAMC1_LAMA1(层粘连蛋白测定组)。其中9个信号仅由反式pQTL驱动(ARL1、CTF1、DCK、NEFL、PDZK1IP1、RGS7、SARS、TBCA、SNRPF),鉴于其生物学特异性有限,本文未对其进行深入讨论,仅作为探索性发现予以报告。因此,本课题组随后的分析重点聚焦于另外4个拥有顺式(cis)pQTL证据的蛋白质:ACOX1、ART4、MGP和层粘连蛋白复合物,并进一步评估了它们的作用方向一致性和细胞定位。
2.2 4个具有顺式证据的蛋白
经错误发现校正后,4种蛋白均对白质高信号呈统计学显著关联。ACOX1(单一变异位点,采用Wald比值法评估)显示保护性关联,
OR=0.433(95%CI=0.355~0.527)。ART4(同样采用单变异位点Wald分析)显示轻微风险关联
OR=1.037(1.022~1.053)。采用多重工具与逆方差加权后,MGP和层粘连蛋白测定组均显示中度保护作用:MGP
OR=0.935(0.906~0.965);层粘连蛋白
OR=0.934(0.905~0.965)。该模式具有一致性:ACOX1具有最大保护效力;ART4具有微小但稳定的风险效应;MGP与层粘连蛋白在多变量聚合分析中显示出相似保护作用。其余9项信号由转录因子驱动,虽通过多重检验阈值,但效应较弱。FDR<0.05的部分孟德尔随机化分析结果见
表3。
2.3 跨终点一致性
为避免WMH特异性单表型假阳性,本课题组在另外2个脑小血管病变终点中评估了这些发现的外部一致性。PVS采用欧洲人群的影像GWAS汇总统计数据,其表型基于3D T2/T1结构MRI上半自动或自动分割的PVS体积/评分得出;队列主要为基于人群的研究(以英国生物银行MRI子队列为主),样本量达数万人;基因型均经过标准质量控制和参照面板的基因型插补。LS分析则采用了国际病例对照GWAS汇总统计数据,病例经临床或影像学确认(≤10 000例),对照组规模庞大(数十万例);各项研究均控制了人群结构差异,并采用固定效应/随机效应荟萃分析合并结果。对于这两个终点,我们均采用了与WMH主要分析相同的数据协调和工具变量选择流程,并报告了双侧P值,同时注明了名义显著性和FDR状态(
表4)。在此分析框架下,上述4个顺式优先候选蛋白在PVS和LS中均表现出与WMH一致的效应方向:ACOX1、MGP和层粘连蛋白复合物依然显示保护作用,而ART4则持续显示风险增加作用。其绝对效应量均小于在WMH中的效应,这与在不同表型间进行效应迁移时常见的衰减现象一致;其统计学显著性则各不相同,部分达到名义显著(
P<0.05),但多数在经过多重检验校正后变为临界或不再显著,这与PVS和LS相对较小的样本量及较大的测量误差(尤其是PVS)相符。方向的一致性——特别是ACOX1和MGP的保护性信号,以及ART4的微弱风险信号——在2个小血管终点中都得到了重现,这为结论的可移植性提供了证据;层粘连蛋白复合物在PVS/LS中的保护方向也与其基底膜/ECM的生物学功能相吻合。考虑到统计效能和测量差异,将跨终点结果视为支持性证据,并纳入本研究的证据分级体系(
图2和
表4)。
2.4 共定位分析
本课题组以暴露侧的哨兵变异为中心,在±1 000 kb的对称窗口内进行了贝叶斯共定位分析,从而对4个拥有顺式支持的蛋白质进行了区分。ART4和MGP显示出强有力的证据,表明其MR暴露(蛋白质水平)与WMH的关联源于同一个因果变异;两者共享因果变异的后验概率(PP4)均为0.995,而支持不同变异(PP3)的证据则微乎其微(
图3)。相比之下,ACOX1虽在MR中显示保护性效应,但其基因座更倾向于支持不同的遗传信号:其不同变异的概率(PP3)几乎为1,而共享变异的概率(PP4)可忽略不计。对于以LAMC1为锚点的层粘连蛋白检测组,其支持共享变异的证据较弱,不同变异的解释仍然较为合理。完整的数值结果报告于
表5。
2.5 单核(single-nucleus)细胞类型定位(HPA)
本课题组将遗传/因果线索投射至HPA 34类单核(single-nucleus)细胞图谱。为避免相对缩放伪影,正文仅展示绝对表达量点图(
图4),并在统一尺度下解读全部34类细胞;每个基因的前5个高表达细胞簇列于补充
表6。总体上,MGP 在内皮、血管平滑肌、周细胞及成纤维样谱系中较高;层粘连蛋白测定组在成纤维与平滑肌等基质/基底膜相关细胞中较高;ACOX1在内皮富集,并在部分胶质亚型中等;ART4总体较低,但在内皮达到峰值(
图4)。
2.6 证据整合与分级
通过结合MR估计值及其FDR支持、跨终点一致性、基因座共定位及单核(single-nucleus)细胞类型定位,本课题组对靶点进行分级。ART4和MGP为高可信度靶点:它们通过MR,且存在强有力的共享因果变异证据,在血管周围间隙和腔隙性卒中中呈现方向一致的信号,并与合理的细胞类型表达相吻合。ACOX1与层粘连蛋白测定组为中等可信度:MR信号与细胞水平模式具有生物学一致性,但共定位较弱或存在不一致,因此优先开展精细定位、强化顺式调控工具及功能验证工作。
3 讨论
本研究将CCH确立为脑小血管损伤的上游病理生理背景,并将WMH作为其主要特征。在此框架下,蛋白质MR筛查在多重检验校正后,共鉴定出13种与WMH存在关联的蛋白质;其中4种拥有顺式(cis)工具变量的蛋白质(ACOX1、ART4、MGP及以LAMC1为锚点的层粘连蛋白测定组)被纳入后续深入分析。需要明确的是,本研究的设计旨在推断其对WMH的因果效应。对PVS和LS的分析,主要用于检验这些因果效应方向在小血管病变谱系中的一致性,而非宣称其在这些终点上也存在因果效应。这种“估计目标”的区分在CCH背景下至关重要,因为各种影像学表型实质上是共享的微血管应激因素的概率性表现,而非单一上游因素的充分必要条件式的结果
[12-13]。因此,在CCH背景下解读MR结果,应着重关注其生物学一致性和效应方向的普适性,而非跨表型的因果断言。
本研究筛选出的4个核心蛋白,为理解CCH背景下WMH的机制提供了具体切入点。ACOX1是过氧化物酶体脂肪酸β-氧化通路的起始与限速酶,参与髓鞘相关脂质稳态与细胞氧化还原平衡
[30-31]。MR结果显示较高的血浆ACOX1与较低的WMH风险相关,提示系统性脂质代谢与过氧化体稳态可能对白质具有保护作用。ART4(CD297)为红细胞膜上的GPI锚定蛋白,人源ART4的细胞外单ADP-核糖基转移酶活性尚未确证。本研究观察到血浆ART4与WMH风险的因果关联,可能作为血液学或血管相关状态的间接指示,具体通路仍需实验验证。MGP为维生素K依赖的抗钙化分子,可拮抗BMP2/4信号以维持血管弹性与基质稳态
[32]。本研究发现其与WMH存在强共定位证据,支持“血管壁重塑—基底膜和细胞外基质稳态失衡”在WMH形成中的关键作用。LAMC1编码层粘连蛋白γ1链,层粘连蛋白是微血管基底膜的核心组成,影响细胞黏附、迁移与存活
[33]。尽管本研究中共定位证据较弱,但遗传层面呈现的负相关提示系统性层粘连蛋白代谢或与微血管基底膜完整性相关,这与WMH所见的血脑屏障受损过程相一致。
共定位分析与细胞类型定位的结果对候选靶点进行了有效分层,并将其映射至慢性低灌注背景下预期相关的生物学过程。ART4-WMH和MGP-WMH关联均显示出强有力的共享变异证据(高PPH4),这与MR结果相互印证,形成了强有力的证据链。ART4定位于内皮细胞富集的区域,可能捕捉了核苷酸信号传导与内皮细胞的激活状态;而MGP则定位于基底膜和细胞外基质谱系,提示其可能参与了血管壁的重塑过程。与之相反,ACOX1虽显示出保护性的MR估计值,但其基因座更倾向于支持不同于WMH的独立因果变异(高PPH3),这与该区域的复杂性(如存在相邻或多个信号)相符;层粘连蛋白测定组则显示出保护性MR效应但共定位证据较弱
[28]。结合人脑单核转录组数据,这些发现共同指向了与CCH病理密切相关的2条核心轴线:内皮细胞代谢与结构耦合功能紊乱,以及基底膜与细胞外基质重塑障碍。前者与低灌注诱导的代谢应激、剪切力降低、氧化还原失衡及对少突胶质细胞的营养支持受损等机制相吻合;后者则与血管周围单元的渐进性改变相一致,这些变化会损害血脑屏障功能并增加白质易损性,这已在临床和实验性低灌注模型中得到观察
[34-36]。遗传因果性、基因座共享性与细胞定位三者之间的高度吻合,极大地增强了我们的信心,表明这些通路并非由混杂因素或反向因果关系所导致的假象。
基于上述分级结果,本研究衍生出潜在的临床与转化医学意义。ART4和MGP作为高置信度候选靶点脱颖而出,其可能作为靶向干预策略的分子,也可能作为血浆药效动力学生物标志物或伴随诊断标志物,用于监测WMH的进展或治疗反应。在CCH背景下,WMH进展仍是寻求小血管神经保护作用的临床试验最合适的主要影像学终点,因为它能整合随时间推移的弥漫性白质损伤,并在中等样本量的研究中提供足够的统计效能。PVS和LS则可作为次要或机制探索性终点,这与其虽方向一致但效应量更小且在不同队列中存在较大测量误差的特性相符
[12-13]。此外,这2条轴线也为老药新用或新分子实体开发提供了可检验的假设。在内皮层面,调控过氧化物酶体脂质氧化和核苷酸介导的信号传导,或许能改善内皮细胞的代谢适应性与屏障完整性。在血管壁层面,增强细胞外基质的组装与稳态维持,则可能稳定基底膜、支持周细胞-内皮细胞对话,并最终改善微循环储备功能。这些假设可在分阶段的研究体系中得到验证,例如将富含生物标志物的临床试验与定量MRI终点和系列血浆蛋白检测相结合。
当然,本研究的一些局限性和未来研究方向也需要谨慎考量。MR估计的是与基因终生相关的蛋白质水平变化,其效应大小和时效性可能无法完全模拟药理干预的效果;剂量反应关系和时间窗口需要通过实验来明确。尽管已优先采用顺式pQTL并进行共定位分析,但残余多效性、连锁不平衡结构以及单一因果变异的假设仍可能给估计值带来偏倚
[28]。人群祖先背景、蛋白质组学平台和影像处理流程的差异,可能是导致效应在PVS和LS中出现衰减的原因之一,这也支持了本课题组将这些终点仅用于方向性验证而非因果推断的策略
[12-13]。未来的研究应将MR与共定位分析延伸至以PVS和LS为主要结局的分析中;应用多变量MR来控制诸如血压、代谢特征和炎症等共有的血管风险因素;采用多信号共定位分析进行精细定位,以解析ACOX1和层粘连蛋白检测组等复杂基因座;并前瞻性地在以WMH进展为主要结局的观察性队列和早期干预研究中,验证ART4和MGP作为血浆生物标志物的潜力。总而言之,在CCH框架下,汇聚的遗传学与细胞学证据共同揭示了内皮-代谢通路和基底膜-细胞外基质通路在脑小血管性白质损伤中的关键作用,其中ART4和MGP已成为最具转化前景的领衔候选分子。