2012年起,原国家卫生部医政医管局要求三级医院实时上传出院患者的病案首页,从病案首页中可以直接获取或计算用于医院评审、绩效考核和医疗安全的重要指标
[1]。住院病案首页通过结构化数据元素(文字、符号、代码及数值)对患者诊疗信息进行整合与转换,最终生成与每份病历唯一对应的标准化数据摘要,它是整个住院过程所有关键信息的高度概括,也是所有健康医疗大数据应用中最基础和最核心的数据来源
[2]。
病案首页具备医疗作用、研究作用、管理作用、医保支付作用四大功能
[3]。卫生健康委、医保局、医院行政部门,包括患者对病案首页数据的关注侧重点不同,同时也对数据起到了一定的监管作用。但现阶段,在临床研究方面,可用数据更为复杂,专业性更强,无论行政管理部门或医院、科室自身均无有效监管措施
[4-5]。随着《“十四五”全民健康信息化规划》工作的逐步推动,全国已有7 000余家二级以上公立医院接入区域全民健康信息平台
[6]。通过电子病历,数据的获取需求已得到初步解决,而原始数据质量能否满足科研需要,则可能关乎未来我国病案首页来源数据临床研究的真实性。
甲状腺恶性肿瘤是51个国家卫生健康委纳入单病种质量监测的病种之一
[7],其组织类型来源相对单一,手术方案、诊疗过程相对固定,数据录入和病案首页编码复杂性较低。因此,甲状腺癌病案首页中的科研数据质量,理论上应高于其他恶性肿瘤。本研究通过对省级甲状腺中心的病案首页编码数据进行回顾性分析,以期明确甲状腺恶性肿瘤单一病种的诊断编码和手术编码准确性。
1 资料与方法
1.1 研究设计与数据采集
回顾性纳入2018年1月—2020年12月期间于昆明医科大学第一附属医院甲状腺疾病诊治中心行手术治疗并经石蜡病理确诊为甲状腺癌患者的病历信息进行鉴定。鉴定内容为病案首页中诊断编码和手术编码准确性,包括甲状腺恶性肿瘤诊断(主要诊断)、颈部淋巴结继发恶性肿瘤(次要诊断)和甲状腺切除范围(主要手术操作)、淋巴结清扫范围(其他手术操作)。这些编码是目标病种监测、三四级手术占比等公立医院绩效考核指标以及病种权重、CMI值等医保疾病诊断相关分组(DRG)支付计算指标,并且未来可能作为全国甲状腺恶性肿瘤抓取指标用于科研数据库的建设应用
[3]。昆明医科大学第一附属医院甲状腺疾病诊治中心是云南省甲状腺外科临床研究中心,在3年研究周期中,收治的甲状腺恶性肿瘤病例覆盖云南省该病种的1/4以上,具有区域代表性。
从昆明医科大学第一附属医院甲状腺癌数据库中获取术后石蜡病理报告和手术记录,分别作为诊断和手术范围的标准,用于评价病案首页中上报信息编码的准确性。由2名甲状腺外科医师独立录入数据并交叉验证。同期病案首页中诊断编码及手术编码由另1名甲状腺外科医师录入。当病理报告和手术记录中文本信息与编码对应字段不一致时,由1名数据库录入医师和病案首页录入医师共同确认,以减少混杂因素。
病案疾病编码库和手术操作编码库版本分别为ICD-10国家临床版、ICD-9-CM3国家临床版1.1(2018年1月—2019年7月),ICD-10国家临床版、ICD-9-CM3国家临床版2.0(2019年8月—2019年12月)和ICD-10国家临床版、ICD-9-CM3国家医保版1.0(2020年1月—2020年12月)。本研究经昆明医科大学第一附属医院伦理委员会批准,并豁免知情同意。
1.2 诊断编码
筛选病理报告中符合甲状腺恶性肿瘤(C73x00)定义的所有病例,记录病理诊断及淋巴结转移情况。审查病案首页每条出院诊断的上报编码,遗漏编码和错误编码被记录,用于计算编码错误率。
1.3 手术编码
手术记录中主要手术部位文本信息首先被分类为甲状腺全切术(total thyroidectomy,TT)和单侧甲状腺手术(thyroid lobectomy,TL)。前者包括TT和甲状腺近全切除术,后者包括所有TL病例。淋巴结清扫范围记录包括中央区淋巴结清扫和颈侧区淋巴结清扫。主要手术操作编码及其对应的手术方式如
表1所示。
审查病案首页每条手术编码,与手术记录文本信息不一致的病例被单独登记。随后,由病案首页录入医师向手术医师或手术助手确认编码信息,并计算编码正确率。此外,本研究分别计算了编码为TL经审核后需更改为TT的比例,和TT需更改为TL的比例。
2 结 果
2.1 病例信息纳入情况
通过提取病案首页,共纳入4 230例病例信息;其中3 453例经手术治疗和术后组织学病理诊断为甲状腺恶性肿瘤,92例再次手术患者被排除,最终共计3 361例甲状腺恶性肿瘤病例数据纳入后续分析。此外,手术编码评价中,额外的10例主要手术编码重复(同时录入TL和TT)和13例其他手术编码病例数据被排除(
图1)。
2.2 诊断编码评价
在所有3 361例病理报告为甲状腺恶性肿瘤(C73x00)病例中,3 320例(98.8%)病案首页主诊断录入信息一致,41例(1.2%)主诊断错误录入为其他良性甲状腺疾病诊断编码(如结节性甲状腺肿、甲状腺良性肿瘤、甲状腺肿瘤等)。2018、2019和2020年主要诊断编码正确率分别为98.7%,98.7%和99.0%,整体准确率持续维持在较高水平。
在3 361例病理报告为甲状腺恶性肿瘤的病例中,1 368例(40.7%)病理报告提示存在颈部淋巴结转移(颈部淋巴结继发恶性肿瘤),其中67.8%(927/1 368)的病案首页次要诊断未录入淋巴结转移相关诊断(漏录);0.8%(11/1 368)次要诊断录入为淋巴结继发恶性肿瘤(C77.900x001),0.2%(3/1 368)次要诊断为头部淋巴结继发恶性肿瘤(C77.000x005),仅有27.2%(372/1 368)次要诊断录为颈部淋巴结继发恶性肿瘤(C77.002)和4.0%(55/1 368)颈部继发恶性肿瘤(C79.834);仅31.2%(427/1 368)的病案首页次要诊断和转移部位录入信息均符合规范。在59.3%(1 993/3 361)病理报告未提示颈部淋巴结继发恶性肿瘤(颈部淋巴结阴性)病例中,99.6%(1 985/1 993)的病案首页次要诊断填写信息一致,0.4%(8/1 993)的病例错误录入淋巴结转移的相关次要诊断(
图2)。
2.3 手术编码评价
2.3.1 主要手术操作编码(原发肿瘤切除范围)
排除10例主要手术操作编码录入重复和13例行部分切除术或次全切除术的病例,3 338例主要手术操作编码为TL或TT的病例被纳入后续分析。TL定义为单侧甲状腺叶切除伴或不伴甲状腺峡部切除,其对应手术操作编码为(06.2x00-06.2x04和06.3905)。TT定义为双侧甲状腺近全切除术或双侧甲状腺全部切除术,其对应手术操作编码为(06.4x00、06.4x02)。
在原始手术记录信息中,共计1 764例主要手术操作记录为TL,其中1 508例(85.5%)病案首页主要手术操作编码与手术记录一致,223例(12.6%)主要手术操作编码错误录入为TT,此外,33例(1.9%)的主要手术操作编码错误录入为其他手术方式(如:甲状腺次全切除术、峡部切除术或部分切除术等)。在1 574例原发部位手术记录为TT病例中,1 511例(96.0%)病案首页主要手术操作编码与手术记录一致,42例(2.7%)主要手术操作编码错误录为TL,21例(1.3%)录为甲状腺次全切除术等手术方式(
表2)。原始手术范围为TL病例录入准确率远低于TT病例。在错误编码病例中,70.0%(223/319)的编码需由TT更改为TL,13.2%(42/319)需由TL更改为TT。
2.3.2 其他手术操作编码(淋巴结清扫范围)
如
图3所示,3 338例纳入病历手术记录中,2 910例(87.2%)资料显示同期行中央区淋巴结清扫术,其中99.7%(2 902/2 910)病案首页中其他手术操作信息录入一致;8例(0.3%)漏填该手术操作。391例(11.7%)患者同期行颈侧方淋巴结清扫术(单侧或双侧)。具体手术操作编码种类见
表3。
此外,1.1%(37/3 338)患者手术记录中未记录颈部淋巴结清扫(包括中央区或颈侧方),其中31例病案首页录入手术操作编码与真实术式一致;而有6例错误录入淋巴结清扫相关编码,可能涉及手术编码高编。
2.4 按年度的主要手术编码正确率评价
主要手术编码错误是影响病案首页数据科研应用的主要指标,
表4展示了分年度的病案首页主要手术编码准确率。值得注意的是,相比于2018年和2019年,2020年的主要手术操作编码错误比例大幅上升,其中绝大多数为执行TL的病例误填为TT。此外,共计54例病案首页编码录入为其他非甲状腺恶性肿瘤规范术式,这可能与填报人编码选择疏忽有关。
3 讨 论
本研究利用一个省级甲状腺中心的肿瘤数据库资料评价病案首页信息中诊断编码和手术操作编码的准确性。调查显示,在已提交至国家病案首页数据采集通道的2018—2020年病历信息数据中,甲状腺恶性肿瘤总体主要诊断编码准确率为98.8%;在伴有淋巴结转移病例中次要诊断编码(含转移部位)准确率为31.2%。主要手术操作编码准确率为90.4%,经核对,319例编码错误病例中,80.3%需修正为TL,19.7%需修正为TT。而次要手术操作缺乏固定编码,尤其是中央区清扫术式,录入编码高达14种。此外,研究还发现,2020年主要手术操作编码准确率较2018和2019年明显降低。
长期以来,我国肿瘤临床数据库建设不尽如人意,相比于美国SEER、NCDB等肿瘤数据库建设差异巨大
[8-9]。尽管中国具有更大规模的人口基数和病例数,但以中国人群为样本的临床研究成果十分有限,大量肿瘤临床实践指南的制定事实上仍以参考国外研究证据和欧美国家临床指南为主。近年来,国家卫生健康委出台多项措施,推进病案首页书写规范、疾病分类与代码、手术操作分类与代码、医学名词术语“四统一”,以期进一步提高我国病案首页利用率。通过病案首页抓取患者住院过程诊疗信息,多角度地统计、观察研究群体数据的医疗效果,研究疾病发生发展的规律,分析人群特征和预后转归,预测疾病的发展和演变趋势。可以预见其能够大幅提升我国临床研究和流行病学研究水平,发挥病案首页科研价值,并在未来有助于基于中国人群研究证据的疾病临床指南制定
[3]。随着我国各级医院信息化建设的不断完善,病案首页编码采集平台建设趋于完善,临床数据可用性已无技术瓶颈。然而,在本研究中,肿瘤临床诊疗过程中的关键信息(主要手术操作编码)准确性仍亟待提高。
无论是通过病案首页数据采集,或是美国肿瘤登记系统,如何确保临床关键信息的记录准确,均是影响临床研究结果,甚至是临床实践指南制定的核心指标
[10]。美国一项研究
[11]审查了田纳西州癌症登记处甲状腺癌病历数据质量,尽管该登记中心通过北美中央癌症登记中心协会金牌认证,但在2004—2011年间,该中心发现40%(369/921)的TL记录中“原发部位手术”编码错误。经过审查,有27%(247/921)的病例从TL编码更改为TT。而该中心登记数据广泛应用于SEER和NCDB的相关研究中,并且在病例对照研究中直接干扰病例分组
[11]。
调查发现,即使在同一份病案首页中,不同类别数据的准确性亦良莠不齐,这可能与不同数据受监管程度不一所致。例如,本研究中主要诊断准确率(98.8%)基本满意;甲状腺恶性肿瘤是国家卫生健康委监测病种之一,其作为公立医院绩效考核的核心指标直接影响年度医院排名,受医院各级行政管理部门重点关注,甚至医院会将国家监测病种作为各个临床科室月评、季评、半年评的科室责任目标严格监管。而次要诊断(颈部淋巴结继发恶性肿瘤)则不会影响公立医院绩效考核排名;增加该诊断可以提高DRG权重,进而提高医保支付价格,并影响科室和医生个人薪资报酬
[12]。然而,伴有淋巴结转移病例中有高达67.8%(927/1 368)的漏报率,这可能是由于病案首页上传时限要求与淋巴结术后病理时效性相矛盾,一些病例在未获得淋巴结转移病理诊断时,为避免因诊断编码高靠的医保处罚,病案首页即完成上传,现阶段该指标的准确率可能无法满足临床研究需要。值得一提的是,病历提交时限同样是医院对临床科室的考核指标之一,为此,建议院内多部门协作,优化病案首页的提交流程,通过分阶段填报或动态更新病案首页数据的方式提高数据的完整性和准确性。
与诊断编码相仿,四级手术比例同样是公立医院绩效考核指标,按手术病例数作为医院对科室和医生个人考核和薪酬激励的措施之一
[4]。然而,甲状腺恶性肿瘤的标准手术范围推荐,无论TL或TT均被列为四级手术,手术操作编码填报准确与否并未实际影响考核指标。此外,病案首页中缺少与临床实践指南对应的淋巴结清扫术式编码,尤其是中央区淋巴结清扫,现有编码无法准确表达手术范围。无疑,手术范围是所有恶性肿瘤临床研究指标变量中的重中之重,现有的病案首页质量评价体系可能无法满足临床研究的数据质量要求。
2023年,国家卫生健康委办公厅颁布了包含甲状腺癌在内10个癌种的肿瘤专业医疗质量控制的通知
[13]。通过监测甲状腺癌术前血清学评估、超声、细胞和术中术后病理检查、TNM分期、术后并发症和术后碘治疗等15个质控指标,以提高甲状腺恶性肿瘤诊疗全过程的规范化程度
[14]。然而,从科研数据库角度出发,住院病历信息的质量管理仍任重道远,手术或其他文字记录转录为编码数据可以视为临床数据可利用性的改善,其同时必然面临数据真实性的下降;减少此过程的数据损耗是所有肿瘤数据库建设的基础
[15]。而现阶段,提高病历书写、信息转录中的临床病例数据真实性和准确性,改善病案首页编码准确性,可能需要从提升文字病历结构化水平,加强行政管理监管,优化信息系统逻辑,以及宣传提高医生个人的责任心和使命感等多个维度共同发力。
随着人工智能(artificial intelligence,AI)技术的快速发展,其在医疗数据质量管理中的潜力日益凸显。在病案首页编码的准确性优化方面,自然语言处理技术可自动解析手术记录和病理报告中的非结构化文本,精准提取关键信息(如肿瘤分期、手术范围、淋巴结转移情况),并与标准编码库(如ICD-10、ICD-9-CM3)智能匹配,减少人工转录的主观误差
[16]。此外,机器学习模型可通过历史数据训练,识别编码过程中的常见错误模式(如“TL与TT混淆”或“淋巴结清扫术式编码混杂”),实时提供修正建议,显著提升编码一致性。在数据采集流程中,AI驱动的自动化工具可集成电子病历系统,实现病案首页字段的智能填充,避免重复录入和遗漏
[17]。例如,通过结构化模板实时抓取手术记录的关键参数(如切除范围、清扫区域),结合病理结果自动生成诊断编码,确保数据的时效性与完整性。同时,AI系统可嵌入实时质控模块,对异常编码或逻辑矛盾(如“未清扫淋巴结却录入清扫编码”)进行预警,辅助医护人员及时修正
[18]。未来,结合区块链技术,AI还可构建去中心化的数据验证网络,确保多中心研究数据的透明性与可追溯性。通过标准化算法与临床指南的深度结合,AI不仅能提升病案首页的科研可用性,还可为DRG支付、绩效考核等管理需求提供高质量数据支持。然而,AI的应用需以医疗数据的规范化和结构化为前提,并需通过多学科协作完善伦理与隐私保护机制,最终实现数据质量与临床价值的双向提升。
本研究存在以下局限性。首先,本调查基于单中心甲状腺恶性肿瘤数据进行,不能推广至其他国内机构的病案首页编码水平,尤其是甲状腺手术操作编码涉及的四级手术问题,与其他癌种编码特征有所差异。然而,受统一的公立医院绩效考核指标影响,我们认为,至少本研究的部分特征可能对其他地区或机构具有一定的参考价值;同时,本研究提示未来有必要进行多中心的数据质检,验证其他中心病案首页诊断编码及手术操作编码的准确性。其次,这是一项针对病案首页编码准确率的初步调查,据笔者了解,目前病案首页信息并未广泛应用于全国性或区域性的临床肿瘤研究。
综上,本研究通过系统分析单中心甲状腺恶性肿瘤病案首页数据质量,显示手术操作编码错误率较高是现行人工编码模式下数据质量的主要缺陷,未来亟须构建多学科协作平台,借助AI技术优势推动病案首页从“被动录入”向“主动质控”转型,为甲状腺癌精准诊疗、卫生政策制定及真实世界研究提供高质量数据基石。