胃肠道间质瘤(gastrointestinal stromal tumors,GISTs)是胃肠道最常见的软组织肉瘤,占胃肠道肿瘤的1%~2%,具有高度恶性潜能
[1-2]。手术切除是其最主要和最有效的治疗手段。伊马替尼(imatinib,IM)作为一种酪氨酸激酶受体抑制剂,是国内外指南推荐的GISTs术前新辅助治疗的一线用药
[3-5]。它能够有效减小肿瘤体积,降低临床分期,缩小手术范围,最大程度地避免不必要的联合器官切除、保留重要器官的结构和功能,降低手术风险,提高患者术后生存质量
[6-8]。然而,术前IM用药时间及最佳的手术时机尚无明确的定论,国内外指南推荐达到最佳疗效反应(best of response,BOR)后进行手术
[3-4]。然而对于某些特殊部位的GISTs,即使经过IM术前治疗,也存在不可避免的手术风险及术后并发症
[9-10]。此外,目前相关研究表明对于直肠癌靶向治疗后达临床完全缓解(clinical complete response,CCR)的患者选择随访观察替代手术治疗并不会影响患者预后
[11-12]。在接受IM治疗的GISTs患者中哪些患者达到了CCR,是否也能选择随访观察替代手术的治疗方式尚未可知。因此,本研究需要1个可靠的疗效评估标准去判断GISTs患者IM治疗后的BOR与CCR以辅助其后续治疗的选择。
目前,临床应用最普遍的GISTs疗效评估标准是RECIST1.1标准
[13],它仅基于肿瘤长径判断疗效反应。然而,当IM耐药时,除了体积增大也表现为瘤内新生结节
[14]。因此,有研究在RECIST1.1的基础上增加了对瘤内新生结节的评估从而提出了mRECIST1.1标准
[15]。此外,GISTs对IM的反应不仅表现为肿瘤缩小,还会表现为肿瘤密度降低及肿瘤血管缩小,甚至,由于肿瘤内出血、坏死或黏液变性,其体积反而会增大
[16-18]。因此,仅基于肿瘤大小变化的RECIST1.1标准可能会低估GISTs患者对IM的反应
[16,19]。为了克服这一弱点,Choi H等
[19]结合肿瘤平均密度变化提出了Choi标准
[19]。但基于下述原因导致其临床应用并不普遍。首先,GISTs在治疗期间可能出现出血或钙化,这会影响CT值测量而使疗效评估出现误差。其次,IM耐药后肿瘤边缘的实性成分增加,而由于GISTs快速增长肿瘤内部囊变坏死会导致平均CT值反而降低。近来,也有研究将基于肿瘤内部密度均质性及边缘轮廓变化的早期形态变化(early morphological change,EMC)标准应用于GISTs的疗效评估
[20],但由于其形态学征象定性存在主观性强的缺陷,目前也未能普遍应用于临床。虽然已有多种疗效评估标准被提出,但其评估侧重点各不相同,何种标准能更准确地评估GSITs患者IM治疗后的疗效尚无定论。
因此,本研究拟比较RECIST1.1、mRECIST1.1、Choi以及EMC 4种疗效评估标准对接受IM治疗的GISTs患者的预后预测能力,以选择最佳的标准判断患者的BOR或CCR,为临床决定手术时机或后续治疗提供参考。
1 资料与方法
1.1 患者收集
本机构伦理委员会已批准该项研究(审批号:K2023-472)。回顾性从本机构临床数据库筛选2012年9月至2022年10月的GISTs患者。纳入标准:①具有准确的病理诊断信息;②具有完整的IM(商品名为昕维,江苏豪森药业股份有限公司,国药准字H20133200或商品名为格列卫,Novartis Pharma Productions GmbH,国药准字H20150112)治疗记录。排除标准:①无基线或治疗后增强CT图像;②基线与首次随访CT检查时间间隔>1年;③合并其他恶性肿瘤。
1.2 CT图像扫描
采用以下多层螺旋CT机之一进行腹部对比增强CT检查:Siemens Somatom Sensation 64(Siemens,Forchheim);GE Discovery CT750m(GE Healthcare,Princeton,NJ)或GE LightSpeed VCT(GE Healthcare,Princeton,NJ)。螺旋CT的参数为:管电压120 kV,自动毫安秒技术(有效毫安秒210~250 mAs),螺距1,旋转时间0.5 s,视野大小350 mm×350 mm,矩阵512×512,层厚及间距5 mm,重建间隔1~1.5 mm。CT检查前患者禁食禁饮至少3 h,扫描前5~10 min口服水500 mL。增强扫描以流率3 m/s静脉注射碘离子对比剂(300~370 mgI/mL),每公斤体质量注射剂量1.0~1.5 mL。运用团注追踪技术,以腹主动脉腹腔干开口水平为监测平面,达到触发阈值(100 HU)后12 s扫描获得动脉期图像,延迟28 s、50 s分别获得静脉期和延迟期图像。
1.3 疗效评估
由1 位具有10年腹部CT诊断经验的高年资医师A及1 位具有2年腹部CT诊断经验的低年资医师B对纳入患者IM治疗前后的所有CT增强图像独立地进行回顾性分析。2名医师如有分歧,以高年资医师的评估结果进行统计分析。分别采用RECIST1.1、mRECIST1.1、Choi及EMC标准对每一次随访的增强CT图像进行疗效评估(
表1)。EMC标准先根据病灶的形态特点分为3类:1类定义为病灶均匀低密度,边界清晰,边缘无强化环;3类定义为病灶密度不均匀,边界不清,边缘强化;2类病灶介于1类与3类之间
[21]。再根据治疗前后病灶形态分类变化将疗效反应分为完全反应、部分反应及无反应3类(
表1)。当存在多个病灶时,以大部分病灶的形态变化为准。根据患者首次随访疗效反应分为疗效good组(定义为RECIST1.1、mRECIST1.1或Choi标准评估为PR或CR的患者,EMC标准评估为完全反应的患者)和疗效poor组(定义为RECIST1.1、mRECIST1.1或Choi标准评估为PD或SD的患者,EMC标准评估为部分反应或无反应的患者)
[21]。BOR评估:根据RECIST1.1标准定义为靶病灶最长径之和最小时;根据mRECIST1.1标准定义为靶病灶最长径之和最小且无新生瘤内结节时;根据Choi标准定义为靶病灶平均密度之和最小时;根据EMC标准病灶形态分类级别最低且最长径之和最小时。
1.4 统计学方法
所有的统计分析均在SPSS 25.0(IBM,Armonk,NY,USA)中进行。用Shapiro-Wilk检验验证计量资料的正态性,正态分布变量用均数±标准差(
x±
s)表示,组间比较采用独立样本
t检验;非正态分布变量用
Md (
P25,
P75)表示,组间比较采用Mann‐Whitney
U检验。计数资料采用
n(%)表示,组间比较采用卡方检验或Fisher精确检验。首次随访评估四种疗效评估标准的观察者间一致性使用Kappa系数计算。Kappa系数为0.00~0.20、0.21~0.40、0.41~0.60、0.61~0.80、0.81~1.00分别对应一致性较差、一般、中等、较强、强
[22]。总生存时间(overall survival,OS)定义为IM治疗开始至患者死亡的时间。无进展生存时间(progression-free survival,PFS)定义为从IM治疗开始至患者出现PD的时间。在末次随访时所有未发生终点事件的患者均定义为删失。采用Kaplan-Meier法分别绘制四种疗效评估标准疗效good组和poor组的生存曲线,并通过log-rank检验比较组间生存差异。检验水准
α=0.05。
分析首次随访时不同反应患者在IM治疗后0~3个月、4~6个月、7~9个月、10~12个月,4个时间段达到BOR和PD的比例并计算其比例差值,定义在BOR比例≥50%且PD比例≤20%的前提下,差值最大的治疗时间段为患者的最佳手术时机。
2 结 果
2.1 首次随访疗效评估分组与一般临床特征
本研究共纳入患者66例,包含男性46例,女性20例。所有患者均为首次接受IM治疗,64例患者400 mg/d,2例患者600 mg/d,清晨顿服,治疗持续到患者疾病进展、严重的不良反应事件或患者拒绝进一步治疗。IM中位用药时间为3年(整体用药时间0.3~7.0年)。患者治疗后首次CT随访中位时间为116 d(首次随访时间范围27~354 d)。根据mRECIST1.1标准首次随访疗效评估PR 25例,SD 36例,PD 5例,RECIST1.1标准首次随访疗效评估结果与mRECIST1.1标准完全一致。根据Choi标准首次随访疗效评估PR 51例,SD 9例,PD 6例。根据EMC标准完全反应18例,部分反应25例,无反应23例。4种标准首次随访疗效评估分组情况及患者临床基本信息见
表2。各疗效评估标准2组间患者年龄、性别及是否手术均差异无统计学意义。
2.2 不同疗效标准观察者间一致性
2位医师在RECIST1.1标准和mRECIST1.1标准下首次随访疗效评估的观察者一致性表现为强(Kappa=0.806,P<0.001);在Choi标准下表现为较强(Kappa=0.759,P<0.001);在EMC标准下也表现为较强(Kappa=0.725,P<0.001)。
2.3 不同疗效评估标准疗效good组与poor组间的预后分析
EMC标准首次随访疗效good组与poor组的OS(
P=0.043,
图1A)及PFS(
P=0.003,
图1B)差异均有统计学意义。Choi标准2组间仅PFS差异有统计学意义(
P=0.002,
图1C),而OS差异无统计学意义(
P=0.737)。mRECIST1.1标准2组间OS(
P=0.955)及PFS(
P=0.093)差异均无统计学意义。对于EMC标准疗效good组(
n=18),其IM治疗后手术患者(
n=12)与未手术患者(
n=6)间的OS差异无统计学意义(
P=0.051,
图2)。分析PFS的组间差异时,为了减小确定PD的CT随访时间与患者PD的实际时间之间的误差,确定PD的CT随访时间与前一次CT随访时间间隔>1年的患者(
n=8)被排除。
2.4 EMC标准下不同疗效患者最佳手术时机分析结果
由于部分患者在最长径之和增大之前即进行了病灶切除手术,而无法确定其最长径之和最小时的CT随访时间,导致这些患者的BOR时间无法确定,故仅分析未手术患者(
n=33)首次评估不同反应者在治疗后不同阶段达PD及BOR的比例。由于仅EMC标准疗效good组和poor组间的OS、PFS均存在统计学差异,故仅分析了EMC标准不同疗效反应患者的手术时机。完全反应的患者在IM治疗后4~6个月、7~9个月、10~12个月的BOR与PD的比例差值均为16.7%。部分反应的患者在用药后6~9个月的BOR和PD的比例差值最大为38.4%。无反应的患者在用药后0~3个月BOR和PD的比例差值最大为7.2%,但有14.2%的患者发生PD。见
表3。
3 讨 论
GISTs患者在采用IM治疗后,早期、准确的疗效评估对指导后续治疗具有重要意义
[23],然而,对于疗效评估标准和治疗后手术时机的选择尚无定论。本研究显示EMC标准可以在首次随访时准确地对患者的OS及PFS进行分层;同时,经EMC标准评定为完全反应的患者在治疗后1年都不会发生PD且手术患者与未手术者间的OS未发现差异,此类患者也许可在IM治疗1年后再考虑手术或选择继续用药随访。
虽然目前被提出用于GISTs的疗效评估标准众多,但何种标准能早期、准确地对其IM治疗后的预后进行分层仍未可知。本研究表明在首次随访时采用EMC标准对患者的PFS及OS均有较好的分层能力,而Choi标准仅能反映PFS,RECIST1.1标准与OS、PFS均无联系,这与既往研究结果类似
[20-21]。首先,RECIST1.1标准仅基于肿瘤大小进行疗效评估,然而GISTs患者在IM给药后肿瘤大小变化缓慢,有研究报道一般需要3~4个月以上的时间才能于CT扫描观察到肿瘤缩小
[24],并且当肿瘤内出血坏死或黏液变性时反而导致肿瘤增大。因此,RECIST1.1标准易在治疗早期阶段低估GISTs患者对IM的反应。而Choi标准虽增加了对肿瘤密度的评估,但GISTs在治疗期间可能出现出血或钙化等影像征象,此时单纯CT值的测量会使疗效评估不准确甚至错误。并且肿瘤平均密度不能反映肿瘤外周区域的信息,对于GISTs肝转移病灶,肿瘤外周区域的代谢活性普遍比中心区域的代谢活性更活跃
[20]。此外,CT值测量繁琐且仅能在影像工作站进行,并且在临床工作中,许多患者不能定期于同一家医院随访,故临床医生往往无法直接获取既往CT值的具体数据,依据CT值的变化做出准确的疗效判断。EMC标准是通过观察肿瘤内部密度异质性、肿瘤边缘及外周强化等早期形态变化判断疗效。既往研究证实了EMC标准形态分类与残留肿瘤细胞百分比密切相关,分类级别越低,残留肿瘤细胞百分比越低
[21],而残余肿瘤细胞百分比已被证明与生存相关
[25],因此,EMC标准可以通过肿瘤形态学变化在治疗早期对预后进行良好分层,并且其不受CT、MR等检查方式的限制,也可适用于无法测量CT值的打印胶片。然而,EMC标准也存在一定的局限性。首先,本研究数据显示其观察者间一致性相对于RECIST1.1标准及Choi标准均较低,这可能是由于其疗效评估均基于医生主观判断的形态学变化导致的。其次,由于其对2类患者的定义模糊可能使部分对IM有反应的患者被分为疗效差组,从而降低该标准对疗效反应的分类效能。因此,虽然EMC标准在GISTs患者IM治疗后首次随访时具有较好的预后分层能力,但仍需进一步完善其对各类患者的形态学定义及辅助定量指标以提高其一致性及疗效反应分类能力。
GISTs患者IM术前用药时间目前尚无定论
[3],理论上应选择疗效反应最佳且进展风险较小的时机进行手术。本研究显示EMC标准的不同疗效反应患者达到BOR或发生PD的时间并不相同,或许可以为临床医生选择合适的手术时机提供一定参考。对于治疗无反应的患者,在治疗早期即有患者发生PD,1年内发生PD的患者高达64.1%,这些患者或许应及时替换二线药物治疗。而对于部分反应的患者,本研究发现在治疗后6~9个月达BOR与PD的比例差值最大,且一半以上患者达到了BOR,这些患者如果条件允许可考虑在此段时间进行手术。而完全反应的患者,在治疗后1年一半患者达BOR且无PD,因此,这些患者可用药随访1年再考虑行手术切除。EMC标准定义完全反应为病灶转变为无强化、光滑均匀低密度的肿块
[20],这些病灶也许几乎没有存活的肿瘤细胞,类似于直肠癌患者放化疗后CCR状态
[26]。而本研究中完全反应患者手术与未手术组的OS未发现差异,既往直肠癌新辅助放化疗与预后的研究也发现治疗后达CCR的患者进行手术并不能改善预后
[11,27]。因此,EMC标准完全反应的患者或许可以借鉴低位直肠癌CCR患者的处理措施,对手术易损伤重要解剖结构或需联合器官切除的患者考虑用定期监测替代手术治疗。此外,本研究中完全反应未手术患者中2例患者于后期随访中病灶完全消失,1例患者病灶完全钙化,且至研究截止(随访期限3.5~7.5年)均未发生PD,这些患者若有停药需求,如高龄、不良反应重等或许可尝试停药。当然,这仍需大样本、长周期研究进一步验证哪些患者可以停药以及停药时机。
本研究存在以下不足:①本研究为回顾性研究,结果可能产生偏倚;②本研究为初步研究、总体病例量较少导致部分亚组病例有限,可能影响统计结果,但是或许也可为GISTs患者IM治疗后手术时机选择提供一些参考,未来将继续收集GISTs患者IM治疗信息及影像随访资料,开展多中心、大样本研究;③首次疗效评估时间不一致,部分患者由于自身条件或医生的判断延长了首次CT随访时间,为了减少因基线与首次随访CT检查时间间隔过长对疗效评估的影响,本研究已排除基线与首次随访CT检查时间间隔>1年的患者并且85%的患者于6个月内进行了首次随访。
综上,EMC标准能够早期、准确地对GISTs患者IM治疗后的预后进行分层;依据EMC标准,完全反应患者可用药随访1年后再考虑行手术切除,且对于这部分患者未来可能通过大样本、长周期的研究来证实是否能够选择定期监测等更为保守的治疗措施来代替手术。
重庆医科大学未来医学青年创新团队发展支持计划资助项目(03020202Y2021284)