China Journal of General Surgery, 2025, 34(3):475-484.
胰腺导管腺癌(pancreatic ductal adenocarcinoma,PDAC)因其高度恶性的生物学特性和极差的临床预后,被称为“癌症之王”。作为消化系统最具侵袭性的上皮源性肿瘤,PDAC以早期转移和不良预后为显著特征。流行病学数据显示,近年来PDAC的发病率持续攀升,其在癌症相关死亡中的贡献率也逐年递增
[1]。受限于早期诊断手段的匮乏和治疗方案的局限性,改善PDAC患者预后仍是全球肿瘤学界面临的重大挑战。目前,手术切除联合辅助化疗仍是对抗PDAC的主要策略
[2]。尽管以吉西他滨为代表的传统化疗药物及新兴的免疫检查点抑制剂展现出一定的治疗效果
[3],但肿瘤微环境(tumor microenvironment,TME)通过调控肿瘤发生、进展及耐药性等过程,显著影响着治疗效果
[4]。因此,迫切需要确定用于PDAC早期诊断和改善预后的前瞻性生物标志物。
近年来,表观遗传学研究的突破性进展为肿瘤发生机制提供了新的分子层面的解释,并为靶向治疗开辟了新途径
[5]。其中,
N6-甲基腺苷(
N6-methyladenosine,m6A)作为真核生物中最普遍的RNA甲基化修饰,其动态调控过程由甲基转移酶、去甲基化酶和信号转导器调控共同完成
[6]。多项研究
[7-9]表明,m6A修饰在肿瘤发生发展中发挥关键作用。例如,METTL3可通过YTHDF2介导的m6A修饰促进抑癌基因SOCS2 mRNA的降解,其表达水平与肝癌恶性程度显著相关
[10]。5-甲基胞嘧啶(5-methylcytosine,m5C)作为第二种常见的RNA甲基化形式,广泛分布于各类RNA分子中。m5C修饰主要作用于mRNA的非翻译区(untranslated region,UTR),参与调控RNA稳定性、蛋白质翻译及转录过程等重要生物学功能
[11-12]。Song等
[13]创新性地利用m6A和m5C相关长链非编码RNA(long noncoding RNA,lncRNA)构建预后模型,成功预测了直肠癌患者的免疫特征。然而,m6A和m5C修饰在PDAC预后评估中的价值及其临床指导意义仍有待阐明。
lncRNA是一类长度超过200个核苷酸的非编码RNA分子,已被证明可以通过原位调控和分子诱饵效应、结合蛋白和分子支架等机制调节肿瘤生长
[14]。目前,尽管对lncRNA的生物学功能的报道相对较少,但越来越多的研究
[15-17]表明,lncRNA可以为多种类型的肿瘤提供重要的预后价值。随着新一代测序技术的应用和普及,大量有关肿瘤的高通量测序数据使得利用生物信息学预测肿瘤中lncRNA功能成为可能。
本研究聚焦于PDAC中与m6A及m5C调控因子共表达的lncRNA,整合生物信息学与统计学方法构建PDAC预后预测模型。基于癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库中的PDAC患者数据,研究者建立了由m6A和m5C相关差异表达lncRNA(differentially expressed lncRNAs,DElncRNA)组成的预后评估体系。并进一步分析揭示了不同风险组患者在肿瘤浸润免疫细胞、TME基质活性方面的显著差异。
1 资料与方法
1.1 数据来源及鉴定PDAC中m6A和m5C相关DElncRNA
从TCGA数据库(
https://portal.gdc.cancer.gov)获取了TCGA-PDAC队列的RNA-seq数据和随附的临床随访详细信息。利用R包“DESeq2”来精确定位TCGA数据库中胰腺正常组织和肿瘤组织中的差异表达基因(differentially expressed genes,DEG),并设定了|log2FC|>1,
P<0.05。根据最新研究结果,选择了25个公认的m6A和13个m5C调节因子进行后续的Pearson相关性分析。筛选Pearson分析中|
r|>0.4和
P<0.05的m6A和m5C相关lncRNA,并与DEG取得交集,创建了一个称为m6A和m5C相关DElncRNA的子集。
1.2 m6A和m5C相关DElncRNA预后模型的构建和验证
对差异表达的DElncRNA进行单变量Cox回归分析,最小绝对收缩率和选择运算符(least absolute shrinkage and selection operator,LASSO)回归分析和多变量Cox回归筛选出4个与m6A和m5C相关的DElncRNA并构建了一个预后模型。接下来,根据中位风险评分将训练和验证队列样本分为高风险组和低风险组,使用Kaplan-Meier方法和Log-rank检验分析两组的生存差异。同时,采用受试者工作特征曲线(receiver operating characteristic curve,ROC)来评估特征对1、3、5年总生存期(overall survival,OS)的预测能力。利用R(4.1.2)软件的“caret”包从178个PDAC样本中,随机抽取89个样本,进行内部验证。为了进一步验证m6A和m5C相关DElncRNA的风险评分能否预测PDAC患者预后,加入TNM分期、年龄、性别、T分期进行单因素和多因素Cox风险回归分析。
1.3 肿瘤浸润免疫细胞的鉴定与TME评估
运用CIBERSORT反卷积算法对原始基因表达谱数据进行解析,通过参考LM22特征矩阵中547个标志基因的表达特征,精确量化PDAC组织中22种不同人类免疫细胞亚群的比例组成。为进一步全面评估TME特征,采用R语言“ESTIMATE”包计算和比较三个关键的TME评价指标:免疫评分(immune score),反映肿瘤组织中免疫细胞浸润程度;基质评分(stromal score),表征肿瘤相关成纤维细胞和细胞外基质成分的丰富度;综合估计评分(ESTIMATE score),作为前两者的综合指标,可间接评估肿瘤纯度。
1.4 统计学处理
统计分析均使用R软件(4.1.2 版)进行。根据双侧P值评估统计显著性,P<0.05为差异有统计学意义。采用t检验或Wilcoxon检验来检查两组之间的差异。
2 结 果
2.1 鉴定PDAC中m6A和m5C相关DElncRNA
相关性分析提取到3 000个m6A相关lncRNA和2 271个m5C相关lncRNA。对整个TCGA进行差异分析,获得1 939个DEG。之后,对lncRNA和DEG合并,鉴定出84个重叠的m6A和m5C相关DElncRNA(
图1)。
2.2 与PDAC预后相关的DElncRNA
基于TCGA数据集,将178个肿瘤样本随机分配到训练集(
n=89)和验证集(
n=89)。在训练集中,单因素Cox风险回归分析获得15个与患者OS相关的DElncRNA(均
P<0.05)。基于单因素Cox分析结果,对15个差异基因进行LASSO回归分析,采用交叉验证法进行迭代分析,结果显示当变量数为10时,模型均方根误差最小,其对应的是
λ=0.003(
图2)。将以上DElncRNA纳入多因素Cox风险回归分析获得4个与预后明显相关的lncRNA(LINC00857、LINC02038、TSPOAP1-AS1和TRPC7-AS1)(
表1)。
2.3 m6A和m5C相关DElncRNA预后模型的构建和验证
基于4个DElncRNA的回归系数和表达水平,通过加权计算获得了每例患者的风险评分。以中位风险评分为界值,将患者划分为高风险组和低风险组(
图3A)。分析结果显示,高风险组患者表现出显著升高的风险评分和免疫基因表达水平,同时伴随较差的生存预后;而低风险组患者则呈现相反的特征。生存分析结果显示,高风险组患者的OS率明显低于低风险组(
P<0.001)(
图3B)。生存曲线呈现出明显的剂量-效应关系:随着风险评分的升高,患者OS率呈现渐进性下降趋势。为评估预后模型的预测效能,绘制ROC曲线并计算曲线下面积(area under curve,AUC)值。结果显示,该模型1、3、5年生存预测的AUC值在训练集中分别为0.766、0.875和0.879,验证集中分别为0.685、0.711、0.792(
图3C)。
2.4 风险评分与临床病理特征的相关性
单因素与多因素Cox回归分析结果显示,风险评分是PDAC的独立预后因素(
HR=1.562,95%
CI=1.312~1.859,
P<0.001)(
表2)。
2.5 风险评分与肿瘤免疫微环境相关性评价
免疫细胞浸润分析结果显示,不同风险组间存在显著的免疫微环境差异(
图4A)。具体而言,低风险组患者肿瘤组织中幼稚B细胞、记忆B细胞、CD8
+ T细胞、浆细胞和单核细胞的浸润水平明显高于高风险组(均
P<0.05);而M0巨噬细胞则在高风险组中呈现明显富集(
P<0.001)。进一步分析揭示了更为广泛的免疫功能差异:低风险组在抗原呈递细胞共刺激、趋化因子受体信号、Ⅱ型干扰素反应、人类白细胞抗原表达、细胞溶解活性、促炎反应、T细胞共刺激等方面均显著增强;而高风险组则表现出更高的主要组织相容性复合体Ⅰ类(MHC-Ⅰ)表达水平(
图4B)。此外,TME评分分析表明,低风险组具有更活跃的免疫细胞浸润特征,同时伴有更高水平的肿瘤相关成纤维细胞和细胞外基质成分沉积(
图4C-E)。
3 讨 论
表观遗传修饰被认为是癌症发展和进展的重要驱动因素。作为表观遗传调控的主要形式,染色质修饰酶、相关调控蛋白及非编码RNA的功能异常可通过改变染色质结构和动力学参与肿瘤发生
[18-19]。近年来,m6A修饰与胰腺癌的关联研究取得重要进展,多个基于m6A的预后模型被证实与胰腺癌进展和预后显著相关
[20-21]。同时,m5C修饰作为表观遗传学研究的新兴领域,Yuan等
[22]已鉴定出8个与胰腺癌进展和预后密切相关的m5C相关lncRNA(CASC8、AC022098.1等)。本研究创新性地整合m6A和m5C调控网络,构建了新型lncRNA预后模型,并深入探讨了其与免疫微环境的关联。
本研究通过单因素和多因素Cox回归筛选,最终确定4个关键预后lncRNA,并构建预后模型。其中,LINC00857和LINC02038在高风险组过表达,而TRPC7-AS1和TSPOAP1-AS1则表达下调,提示这些lncRNA可能参与PDAC进展调控。研究
[23-25]表明,LINC00857是胰腺癌中广泛报道的致癌lncRNA,其可调节下游microRNA促进胰腺肿瘤进展。进一步探究发现,胰腺癌组织中LINC00857的过表达部分由突变体p53驱动,进而降解FOXM1蛋白促进胰腺癌的转移
[26]。LINC02038是2 434个核苷酸长的非蛋白编码RNA,参与调控多种肿瘤细胞。Liu等
[27]证明LINC02308是结直肠癌中的一种新型抑癌基因,通过竞争性结合miR-552-5p及调控FAM172A/PI3K/Akt通路抑制结直肠癌进展。TRPC7-AS1是一种离子通道跨膜蛋白,其通过改变细胞内钙浓度或细胞膜电位在疼痛、机械损伤、渗透压感知和温度感知中起关键作用
[28]。近年来TRPC7-AS1已被证明是胰腺癌的可能预后标志物,生物信息学分析显示TRPC7-AS1表达独立影响PDAC患者的预后,并且其与PDAC中的上皮-间充质转化、糖酵解、缺氧呈显著负相关
[21]。关于TSPOAP1-AS1,研究者
[29]发现其在胰腺癌患者组织和血清中的表达降低,体内和体外实验发现TSPOAP1-AS1的相应过表达抑制胰腺癌细胞的增殖和侵袭,表明TSPOAP1-AS1可能在胰腺癌中具有潜在的调节功能。除LINC00857外,其余lncRNA在PDAC中的具体机制仍需深入探索。
本研究对相关预后特征的免疫浸润景观进行了研究,结果显示低风险组富含幼稚B细胞、记忆B细胞、CD8
+ T细胞等抗肿瘤免疫细胞,而高风险组M0巨噬细胞显著富集。根据前期研究结果,M0巨噬细胞可以分化成M2巨噬细胞,而M2表型巨噬细胞已被证明通过分泌免疫抑制细胞因子和趋化因子对胰腺癌具有共致癌性,从而促进肿瘤发展
[30];同样,CD8
+ T细胞(负责检测和消除恶性细胞的主要免疫哨兵)的存在与患者预后改善有关,肿瘤内较高水平的CD8
+ T细胞浸润通常预示着更有利的结果
[31-32]。ESTIMATE结果揭示了低风险组的一个悖论,尽管免疫和基质评分较高,但这些有利因素与改善预后的预期不一致。这种矛盾可能源于免疫抑制细胞(如CD8
+ T细胞和浆细胞)的同时浸润。
尽管成功构建和验证了PDAC的预后模型,但本研究依旧具有局限性。首先,研究者主要利用来自TCGA数据库的数据,而没有整合来自基因表达综合(GEO)数据库的信息,这可能会降低本次研究结果的稳定性和可靠性。其次,TCGA数据库中缺乏全面的临床数据,特别是关于淋巴结和远处转移的数据,限制了本研究准确预测PDAC患者转移状态与预后之间关系的能力,扩大样本量对于解决此限制至关重要。未来的研究应优先考虑对已鉴定的DElncRNA进行实验验证,并深入研究其影响PDAC预后的具体机制。
综上,本研究基于m6A和m5C相关的差异DElncRNA构建了可靠的PDAC预后模型,该模型不仅具有预测PDAC预后价值,更为理解PDAC免疫微环境提供了新视角。该模型有望为PDAC的个体化治疗提供新思路。
国家自然科学基金资助项目(82170661)