宫颈癌是女性生殖系统最常见的恶性肿瘤之一,根据世界卫生组织统计,全球每年约有57万新发病例和31万死亡病例。我国是世界上宫颈癌发病率最高的国家之一,每年约有13万新发病例和3万死亡病例
[1]。目前,常用的宫颈癌筛查方法主要有液基细胞学检查(liquid-based cervical cytology,LBC)、宫颈细胞DNA定量检查、阴道镜检查和活组织病理检查等,但是这几种方法均有着各自的缺点,限制其在临床的进一步使用
[2-4]。TS具有操作简单、结果快速、客观准确等优点,已被多个国家和地区用于宫颈癌筛查
[5]。然而,TS系统目前仍存在一些问题,如算法不够完善、特异度不够高、对低分化病变诊断不敏感等。
为了改进TS系统的算法和提高其诊断效能,本研究引入了一种新兴的机器学习技术——图神经网络(graph neural network,GNN)
[6-7]。GNN是一种能够处理图结构数据的深度学习模型,可以有效地提取图中节点和边的特征,并利用图的拓扑结构进行信息传递和聚合,从而实现对图数据的分类、回归、聚类等任务
[8-9]。本研究的目的是基于图神经网络对比分析TS、宫颈细胞DNA定量检查在高危型HPV阳性患者中筛查宫颈癌及癌前病变的效果,为宫颈癌的筛查寻求一种更加简单、有效的方法。
1 资料与方法
1.1 研究对象
1.1.1 纳入标准和排除标准
本研究选取2022年1月至2023年5月于重庆大学附属黔江医院妇科门诊行宫颈癌高危型HPV检测阳性的400例患者为研究对象。纳入标准:①年龄25~65岁;②有性生活史;③未接受过宫颈癌筛查或治疗;④无妊娠、月经、宫颈炎症等影响检查的情况;⑤自愿参加本研究并签署知情同意书。排除标准:①有宫颈癌或癌前病变的确诊或疑似病史;②有其他恶性肿瘤或免疫系统疾病的病史;③在过去6个月内接受过放射治疗、化学治疗或免疫治疗;④在过去3个月内接受过抗生素或抗炎药物的治疗;⑤在过去2周内使用过阴道药物或避孕药。本研究于医院伦理委员会批准后开展。
1.1.2 样本大小和分组方法
本研究拟招募200例患者作为每组的样本量,共400例患者。根据患者的就诊顺序,采用随机数字表法将400例患者分为2组,每组200例。其中,TS融合图神经网络组(简称TS-GNN组)接受TS融合图神经网络检测,宫颈细胞DNA定量组(简称DNA组)接受宫颈细胞DNA定量检测。2组患者的基本资料如年龄、婚姻状况、生育史、性生活史等进行配对比较,以保证2组间的可比性。
1.2 研究方法
1.2.1 HPV 检测方法
所有患者均在月经干净后的第5~14天进行HPV检测。检测方法采用Hybribio HPV GenoArray Test Kit(杭州海博生物科技有限公司),该试剂盒是一种基于杂交捕获技术和DNA芯片技术的HPV分型检测方法,可以同时检测21种HPV亚型,包括15种高危型(16、18、26、31、33、35、39、45、51、52、53、56、58、59、68)和6种低危型(6、11、40、42、43、44)。
1.2.2 TS融合图神经网络检测方法
图的卷积神经网络原理。复杂网络也由基于图的结构组成
[10],G=(V,E),其中V={V1,V2,...,Vr}是节点的集合,E={eij}是边缘的集合。图卷积网络(graph convolutional network,GCN)是一种典型的GNN模型
[11],GCN是一种从图数据中提取特征的方法,一个多层GCN的传播可以表示为
[12]:
其中,σ(·)为激活函数,A为邻接矩阵,W(l)是权重。
TS融合图神经网络检测方法是本研究的核心方法,其基本原理和步骤如下
[13-14]:①使用TS系统对患者进行宫颈电化学检测;②根据TS系统提供的电化学参数,构建宫颈上皮细胞的图结构数据;③利用图神经网络对图结构数据进行特征提取和表示学习,即将每个节点和边的特征向量通过多层的信息传递和聚合操作,得到一个低维且富含信息的特征向量;④使用SVM或RF等分类器对特征向量进行分类,根据预设的阈值判断宫颈上皮细胞是否存在癌变或癌前病变,并给出诊断结果。本研究使用了一种基于GCN和图注意力网络(graph attention network,GAT)的图神经网络模型,具体结构如
图1所示。
该模型由3个部分组成:输入层、隐藏层和输出层。输入层负责将电化学参数转换为节点和边的特征向量,并进行归一化处理。隐藏层由2个GCN层和1个GAT层组成,GCN层负责对节点和边进行局部信息传递和聚合,GAT层负责对节点和边进行全局信息传递和聚合,并通过注意力机制赋予不同节点和边不同的隐藏层,由2个GCN层和1个GAT层组成,GCN层负责对节点和边进行局部信息传递和聚合,GAT层负责对节点和边进行全局信息传递和聚合,并通过注意力机制赋予不同节点和边不同的权重,从而突出重要的特征。输出层由1个全连接层和1个Softmax层组成,全连接层负责将隐藏层的输出转换为分类器的输入,Softmax层负责将输入映射为概率分布,并根据最大概率给出分类结果。本研究使用了PyTorch框架实现了该模型,并在NVIDIA GeForce RTX 2080 Ti GPU上进行了训练和测试。模型的超参数如
表1所示。
1.2.3 宫颈细胞DNA定量检测方法
宫颈细胞DNA定量检测方法是本研究的对照方法,其基本原理和步骤如下:①使用无菌刷子从宫颈管口处采集宫颈分泌物样本,将刷子放入含有DNA提取液的离心管中;②将含有样本的离心管放入DNA提取仪中,按照操作步骤进行DNA提取;③将提取后的DNA样本与预先设计好的HPV DNA定量引物和探针混合,形成PCR反应体系;④将PCR反应体系放入荧光定量PCR仪中,按照设定好的温度程序进行PCR扩增;⑤根据荧光信号强度计算HPV DNA拷贝数,并与参考值进行比较,判断宫颈上皮细胞是否存在癌变或癌前病变,并给出诊断结果。本研究使用了CareGene HPV DNA Quantitative Detection Kit(深圳市卡尔基因生物技术有限公司),该试剂盒是一种基于荧光定量PCR技术的HPV DNA定量检测方法,可以同时检测15种高危型HPV(16、18、26、31、33、35、39、45、51、52、53、56、58、59、68)和2种低危型HPV(6、11)的DNA拷贝数,并与内参基因β-球蛋白进行标准化。HPV DNA定量检测结果按照试剂盒的说明书进行判读,即HPV DNA拷贝数大于等于104 copies/μL为阳性,小于104 copies/μL为阴性。
1.2.4 阴道镜检查方法
阴道镜检查方法是本研究的参考方法,其基本原理和步骤如下
[15-16]:①患者平卧妇科检查床,清洁外阴和阴道口,暴露宫颈;②使用阴道镜对宫颈进行观察,根据宫颈上皮的颜色、边界、表面、血管等特征,判断是否存在异常区域;③使用5%醋酸溶液对宫颈进行涂抹,观察是否出现醋酸白现象;④使用碘试液对宫颈进行涂抹,观察是否出现碘不染现象;⑤根据阴道镜的观察结果,选择疑似异常区域进行活组织取样;⑥将取样后的组织送至病理科进行切片和染色,然后由病理医生进行显微镜观察和诊断。本研究使用了DYSIS Colposcope(英国DYSIS Medical Ltd.),该阴道镜是一种基于数字图像处理技术的智能阴道镜,可以自动记录和分析宫颈图像,并生成一张彩色编码图(DYSISmap),显示宫颈上皮异常区域的位置和程度。阴道镜检查结果按照国际阴道镜学会的标准进行判读,即根据宫颈上皮的形态和血管特征,将其分为正常、低级别病变、高级别病变或癌变等类型。
1.2.5 活组织病理检查方法
活组织病理检查方法是本研究的“金标准”方法,其基本原理和步骤如下
[17-18]:①将从阴道镜检查中取得的组织样本送至病理科,进行固定、脱水、包埋、切片和染色等处理,制成玻片;②使用显微镜对玻片进行观察,根据宫颈上皮细胞的形态、排列、核仁、核分裂等特征,判断是否存在癌变或癌前病变,并进行分级;③根据世界卫生组织和美国妇科病理学家协会的标准,将宫颈上皮病变分为正常、鳞状上皮内病变、腺上皮内病变或浸润性癌等类型。
1.3 检测结果判读
1.3.1 HPV检测结果判读
HPV检测结果按照国际标准化组织的标准进行判读,即荧光信号强度大于等于阳性对照的50%为阳性,小于阳性对照的50%为阴性。
1.3.2 TS 融合图神经网络检测结果判读
TS融合图神经网络检测结果按照模型给出的分类结果进行判读,即根据特征向量的概率分布,将其分为正常/轻度病变(normal/low-grade)或中度以上病变(moderate or worse)。
1.3.3 宫颈细胞DNA定量检测结果判读
宫颈细胞DNA定量检测结果按照试剂盒的说明书进行判读,即HPV DNA拷贝数大于等于104 copies/μL为阳性,小于104 copies/μL为阴性。
1.3.4 阴道镜检查结果判读
阴道镜检查结果按照国际阴道镜学会的标准进行判读,即根据宫颈上皮的形态和血管特征,将其分为正常、低级别病变、高级别病变或癌变等类型。
1.3.5 活组织病理检查结果判读
活组织病理检查结果由两名经验丰富的病理医生进行判读,如有分歧,由第三名病理医生进行仲裁。活组织病理检查结果被认为是诊断宫颈癌及癌前病变的“金标准”,本研究以其作为评价TS融合图神经网络和宫颈细胞DNA定量检测效果的参考标准。
1.4 统计学方法
本研究使用了SPSS 26.0软件进行数据的统计分析。计量资料采用均数±标准差(x±s)表示,计数资料采用频数和百分比(n,%)表示。2组间的计量资料比较采用t检验或非参数检验,2组间的计数资料比较采用卡方检验或Fisher精确概率法。TS融合图神经网络和宫颈细胞DNA定量检测与活组织病理结果的一致性分析采用Kappa检验,灵敏度、特异度、阴性预测值、阳性预测值等指标的计算采用混淆矩阵法,受试者工作特征(receiver operating characteristic,ROC)曲线下面积(area under the curve,AUC)的计算和比较采用曲线下面积法。所有检验均采用双尾检验,检验水准α=0.05。
2 结果
2.1 基本资料分析
本研究共纳入400例高危型HPV阳性的患者,其中TS-GNN组200例,DNA组200例。2组患者的基本资料如年龄、婚姻状况、生育史、性生活史等均经过配对比较,差异无统计学意义,具体见
表2。
2组患者的HPV类型分布情况如
图2所示,可以看出,2组患者的HPV类型分布基本相似,以HPV16、18、52、58等高危型HPV为主,其中HPV16的阳性率最高,分别为TS-GNN组的38.5%和DNA组的39.0%。
2.2 TS 融合图神经网络、宫颈细胞DNA定量检测与活组织病理结果的比较
2.2.1 TS 融合图神经网络、宫颈细胞DNA定量检测与活组织病理结果的一致性分析
结果显示,TS融合图神经网络与活组织病理结果的一致性检验统计量Kappa值为0.89,高于宫颈细胞DNA定量检测(0.72),表明TS融合图神经网络与活组织病理结果的一致性较好,而宫颈细胞DNA定量检测与活组织病理结果的一致性较差。具体见
表3。
2.2.2 TS 融合图神经网络、宫颈细胞DNA定量检测筛查宫颈癌及癌前病变的灵敏度、特异度、阴性预测值、阳性预测值分析
结果显示,TS融合图神经网络筛查中度以上病变的灵敏度、特异度、阴性预测值、阳性预测值分别为93.75%、95.45%、98.18%、87.50%,均高于宫颈细胞DNA定量检测(分别为81.25%、90.91%、96.15%、64.29%),表明TS融合图神经网络筛查中度以上病变的效果优于宫颈细胞DNA定量检测,具有较高的准确性和可靠性。具体见
表4。
2.2.3 TS 融合图神经网络、宫颈细胞DNA定量检测筛查宫颈癌及癌前病变的ROC曲线下面积分析
本研究绘制了TS融合图神经网络和宫颈细胞DNA定量检测筛查中度以上病变的ROC曲线,并计算了其ROC曲线下面积。结果显示,TS融合图神经网络筛查中度以上病变的AUC为0.97,高于宫颈细胞DNA定量检测(0.92),并且两者之间存在显著差异,表明TS融合图神经网络筛查中度以上病变的效果显著优于宫颈细胞DNA定量检测,具有较高的诊断价值。具体见
图3。
3 讨论
本研究探索了一种新型的宫颈癌筛查算法,即TS融合图神经网络,将宫颈上皮细胞的电化学特征构建为图结构数据,利用图神经网络进行特征提取和标识学习,然后使用分类器进行分类,以提高TS系统对宫颈癌及癌前病变的诊断效果。结合国内外文献研究成果,以及本研究的结果,主要发现如下。
TS融合图神经网络与活组织病理结果的一致性较好,而宫颈细胞DNA定量检测与活组织病理结果的一致性较差。这说明TS融合图神经网络能够更准确地反映宫颈上皮细胞的真实状况,而宫颈细胞DNA定量检测可能存在一定的误差。这可能与TS系统和图神经网络的优势有关。宫颈细胞DNA定量检测是一种依赖采样质量、操作技术、试剂质量等因素的检测方法,可能存在样本不足、污染、失活、假阳性等问题。
TS融合图神经网络筛查中度以上病变的效果优于宫颈细胞DNA定量检测,具有较高的准确性和可靠性。这说明TS融合图神经网络能够更有效地区分正常/轻度病变和中度以上病变,而宫颈细胞DNA定量检测可能存在一定的漏诊或误诊。这可能与TS系统和图神经网络的敏感性和特异性有关。TS系统能够敏感地检测宫颈上皮细胞的微小变化,反映其电化学特征的差异。图神经网络能够特异地区分不同类型图的结构数据,反映其特征向量的差异。相比之下,宫颈细胞DNA定量检测只能检测HPV DNA拷贝数,并不能反映宫颈上皮细胞是否发生癌变或癌前病变。
TS融合图神经网络筛查中度以上病变的效果显著优于宫颈细胞DNA定量检测,具有较高的诊断价值。这说明TS融合图神经网络能够更有效地筛查出高危患者,而宫颈细胞DNA定量检测可能存在一定的漏报或误报。这可能与TS系统和图神经网络的判别能力和鉴别能力有关。TS系统能够判别出宫颈上皮细胞的异常程度,反映其电化学特征的异常度。图神经网络能够鉴别出宫颈上皮细胞的异常类型,反映其特征向量的异常类别。相比之下,宫颈细胞DNA定量检测只能检测HPV DNA拷贝数,并不能反映宫颈上皮细胞的异常程度和类型。
TS系统用于HPV阳性患者分流,以及用于癌前病变及宫颈癌早期诊断已有比较多的研究。随着科技的不断进步,人工智能技术与医学领域融合的不断深入,神经网络系统运用于医学大数据的研究也越来越普遍;作为一种新型的神经网络结构,图神经网络在学习图数据方面具有强大的功能。本研究的创新点在于首次将TS系统和图神经网络相结合,构建了一种新型的宫颈癌筛查算法,即TS融合图神经网络。该算法充分利用了TS系统和图神经网络的优势,提高了TS系统对宫颈癌及癌前病变的诊断效果,为宫颈癌的筛查寻求一种更加简单、有效的方法。本研究的意义在于探索了一种新型的宫颈癌筛查技术,利用图神经网络提高TS系统的诊断准确性和可靠性,为宫颈癌的早期发现、早期治疗和预后改善提供有力的技术支持。本研究还为其他基于电化学特征的医学检测提供了一种新的思路和方法,为图神经网络在医学领域的应用拓展了新的范畴。
基于图神经网络对比分析了TS、宫颈细胞DNA定量检查在高危型 HPV阳性患者中筛查宫颈癌及癌前病变的效果,发现TS融合图神经网络能够有效地提高TS系统对宫颈癌及癌前病变的诊断效果,具有较高的准确性、可靠性和诊断价值。为宫颈癌筛查提供了一种新型的方法,并为图神经网络在医学领域的应用拓展了新的范畴。