随着我国人口老龄化持续加剧,认知障碍已成为威胁老年人健康与生活质量的重要公共卫生挑战之一
[1]。认知障碍作为一类涵盖轻度认知功能减退(MCI)至各型痴呆的综合征,其患病规模不容忽视。2020年一项全国性流行病学研究显示,我国约有3877万名60岁及以上老年人罹患MCI,另有1507万人患有痴呆,且总体患病率呈上升趋势
[2, 3]。然而,现有研究多以城市地区为对象,研究样本多为受教育水平较高或社会经济条件较好的群体,对农村老年人认知障碍的流行病学特征及危险因素关注不足
[4]。
农村地区老年人群体的认知障碍患病率普遍高于城市,部分研究指出其患病风险较城市老年人高1.3~1.5倍
[5, 6]。这可能与其教育水平偏低、慢病管理能力不足及卫生服务利用受限等因素有关。同时,基层医疗机构普遍缺乏专业记忆门诊与认知障碍诊疗力量,限制了早期筛查与干预的实施。这些现实问题提示,农村老年群体在认知健康方面面临更大的脆弱性,不仅体现在更高的患病风险,也反映在筛查工具缺失、干预延迟与服务可及性不足等多方面。因此,开发切合其特征的风险评估工具,已成为基层认知障碍防控中的关键任务。
国内外已开发的认知障碍风险预测工具多以城市或混合人群为研究对象,往往忽略农村地区老年群体的独特流行病学特征与生活背景
[7-9]。在农村社区中,仍缺乏基于中国本土大样本数据、方法学严谨且具备良好临床可操作性的模型。中国健康与养老追踪调查(CHARLS)作为覆盖全国的纵向队列研究,系统采集了老年人健康、社会经济和行为等多维信息,为开发适用于本土老年群体的认知障碍风险评估工具奠定了基础
[10]。本研究基于2011年CHARLS数据库,整合人口特征、行为习惯、慢性病及身体功能等变量,采用LASSO回归筛选特征,并结合多因素Logistic回归构建列线图模型,系统评估其鉴别能力、校准性及临床实用价值。旨在为农村地区老年人群体认知障碍的早期识别与精准管理提供实用、量化的辅助工具。
1 资料和方法
1.1 研究对象
本研究基于CHARLS 2011年基线数据(北京大学国家发展研究院提供),已完成匿名化处理,伦理审批由项目负责单位北京大学生物医学伦理委员会通过(伦理批号:IRB00001052-11015)。本研究团队仅进行二次数据分析,未涉及原始信息采集,相关数据使用符合国家公开数据库研究的伦理规范。2011年基线调查共包含17 708名参与者。根据研究目的与人群特征,制定如下纳入与排除标准:纳入标准:年龄≥60岁;常住地为农村地区。排除标准:缺失认知功能评分等关键变量的数据。最终共纳入2228名符合条件的研究对象。
1.2 研究指标及资料收集
1.2.1 认知功能评估
本研究借鉴美国健康与退休研究的方法对CHARLS研究人群的认知功能进行评估
[11]。认知功能测评涵盖两个维度:精神状态和情景记忆。精神状态通过数字识别、计算能力及图形绘制任务评估,总分为11分。情景记忆则通过词语回忆任务进行测试,总分为20分。两部分得分相加构成认知功能总评分,满分为31分。根据既往研究标准
[12, 13],认知障碍定义为认知功能总评分低于11分。
1.2.2 研究变量
本研究纳入的变量主要包括人口社会学特征(性别、年龄、婚姻、教育水平、生活满意度)、生活方式与行为习惯(吸烟、饮酒、睡眠时间、社交活动、有自来水)、慢性病史(高血压、糖尿病、癌症、肺病、心脏病、中风、关节炎、血脂异常、肝病、肾病、胃病、哮喘、髋骨骨折、视力障碍、听力障碍、抑郁、疼痛)、主观健康状况与身体功能[自评健康、日常生活活动能力(ADL)、工具性日常生活能力(IADL)、腰围、BMI、握力、收缩压、舒张压、残疾、跌倒史、牙齿脱落]。
1.3 统计学分析
采用R软件(版本4.4.1)进行数据统计分析。连续变量采用中位数(四分位间距)表示,组间比较使用Mann-Whitney U检验或Kruskal-Wallis H检验。分类变量以频数(百分比)表示,组间差异比较采用卡方检验或Fisher精确检验。为筛选与老年人认知障碍相关的潜在影响因素,应用LASSO回归进行变量选择,随后采用多因素Logistic回归分析确定独立危险因素,并基于回归结果构建列线图以实现模型可视化。通过受试者工作特征(ROC)曲线分析模型的判别能力,以曲线下面积(AUC)衡量预测准确性;采用校准曲线评估模型预测值与实际观察值的一致性;同时利用决策曲线分析(DCA)评估模型在不同风险阈值下的临床实用性。P<0.05为差异具有统计学意义。
2 结果
2.1 基本情况
分别纳入训练集和内部验证集研究对象1560例和668例,认知障碍的发生率分别为17.2%和17.4%。在训练集中,多项基线特征在认知障碍组与非认知障碍组之间的差异有统计学意义(
P<0.05,
表1),包括性别、年龄、婚姻状况、受教育年限、腰围、BMI、收缩压、舒张压、握力、睡眠时间、社交活动参与、自评健康状况、ADL、IADL、自来水使用情况、饮酒行为、高血压、血脂异常、胃病、抑郁症状、慢性疼痛、身体残疾、跌倒史、视力和听力障碍以及牙齿脱落情况。
2.2 模型构建
在训练集中应用LASSO回归模型对候选变量进行降维筛选,通过10折交叉验证确定最优惩罚系数λ。结果显示,当λ=0.017时,模型误差位于其最小值的一个标准差范围内,故选取该值作为最终参数。LASSO分析筛选出13个非零系数变量,包括年龄、教育水平、睡眠时间、社交活动、ADL、IADL、握力、饮酒、收缩压、抑郁、残疾、自评健康及牙齿脱落(
图1)。
多因素Logistic回归分析显示,在训练集中,以下因素为认知障碍的独立影响因素:饮酒行为、抑郁状态、年龄、握力、收缩压以及受教育水平(
P<0.05,
表2)。根据上述显著变量构建列线图模型,用于预测老年人群认知障碍的个体风险(
图2)。
2.3 模型评价
基于筛选出的独立影响因素,构建适用于老年人群的认知障碍风险预测模型。模型性能经训练集与内部验证集评估,结果显示,其AUC分别为0.839(95%
CI: 0.814~0.864)和0.840(95%
CI: 0.801~0.879),模型具有良好的区分能力。校准曲线结果显示,训练集与验证集的预测概率与实际发生率高度一致,拟合曲线接近理想对角线,斜率近似为1,模型具备良好的校准性能。DCA显示,在较宽的风险阈值范围内,该列线图预测模型可获得较高的净临床收益(
图3)。
3 讨论
本研究结果显示,我国农村地区老年人认知障碍的患病率约为14.72%,与既往研究报道基本一致
[5, 14]。然而,在多数基层地区,由于缺乏认知障碍诊疗中心、记忆门诊及专业医师,早期识别率较低,导致误诊与漏诊问题较为突出
[15]。列线图作为一种简明、直观的风险可视化评估工具,在提升社区老年人认知障碍筛查准确性方面具有重要辅助价值。但目前已建立的认知障碍风险预测模型多以全人群为研究对象
[7, 8],在农村地区人群中仍缺乏针对性工具。本研究基于农村社区大样本人群,整合人口学特征、生活方式、慢性病史及身体功能等多维信息,构建了适用于基层的认知障碍风险预测模型。该模型结构清晰、便于应用,具有良好的预测性能和临床可操作性,尤其适用于基层医疗机构及养老照护场所对高风险老年人群的早期识别与分层管理。
本研究基于大样本农村老年人数据,识别出年龄、教育水平、饮酒行为、收缩压、握力及抑郁状态等6个独立影响认知障碍风险的重要因素,丰富了当前针对农村群体的认知障碍病因谱。上述变量不仅在统计模型中表现稳定,也在相关文献中得到不同程度支持。如年龄被广泛认为是认知障碍最关键的不可干预危险因素,随着年龄增长,抗氧化能力下降、突触功能减退、慢性炎症与表观遗传异常等多重机制交互作用,导致神经退行性变进展,进而加速认知功能的下降。研究表明,认知障碍的发生风险与年龄呈指数级上升趋势,尤其在高龄阶段更加显著
[16, 17]。一项全国性调查也提示,农村老年人的整体认知功能低于城市老年人,且这种差异随年龄增长而扩大
[18],提示农村人群在认知衰退方面具有更高的风险暴露。教育水平作为认知储备的核心指标,在本研究中亦表现出显著的保护效应,受教育年限越长,发生认知障碍的风险越低。这与既往关于教育延缓临床认知症状出现的研究一致
[19, 20],进一步强化了通过终身学习与早期教育干预预防认知障碍的可行性。值得注意的是,饮酒行为在本研究中被识别为保护因素。一项具有10年随访周期的研究表明,适量饮酒可能延缓脑功能退化
[21],但也有研究表明长期过量饮酒可能损害认知能力
[22],提示其对认知的影响可能具有剂量依赖性与双向效应。本研究在农村人群中获得与此一致的发现,提示适量饮酒在基层老年人中的特殊影响路径,需结合其饮酒结构、频率与文化背景进一步探讨干预门槛与机制,具有重要的现实意义与理论价值。
除人口学与生活方式因素外,本研究还识别出3项可干预的生理与心理因素:高收缩压、握力下降及抑郁状态。这些变量不仅在统计学上表现为独立影响因子,更契合农村人群的健康特征与医疗短板,具有高度可干预性与转化价值。高收缩压可能通过影响脑血流灌注、诱发小血管病变等途径,导致认知退化。有研究表明,在50岁以上人群中,持续升高的收缩压与新发痴呆风险显著相关
[23],而血压变异性亦可影响认知进程
[24]。握力作为机体整体功能状态的重要指标,已被认为与认知障碍高度相关,反映了躯体功能衰退与神经系统损伤的协同过程
[25, 26]。本研究在农村老年人中观察到握力下降与认知障碍高度相关,考虑到该群体多从事体力劳动,肌少症作为早期信号的识别价值或更为显著,提示应在基层防控策略中加强身体功能评价与干预。抑郁状态亦是认知障碍的核心共病与潜在前驱症状之一
[27, 28],尤其在农村地区,情绪管理与精神卫生服务尚未普及,孤独、生活压力与家庭支持缺失等问题较为普遍。本研究发现即便在控制多重混杂因素后,抑郁状态仍显著关联认知障碍,提示心理健康服务在基层认知障碍防控中的不可忽视作用。
本研究构建的认知障碍预测模型具有显著优势与创新性,尤其在针对农村地区老年人群的研究视角上体现突出:(1)依托CHARLS全国性数据库,重点分析具有代表性的农村社区老年人群体,样本规模大、地域分布广,增强了研究结果的推广性与现实指导意义;(2)采用LASSO回归方法筛选变量,避免传统方法中变量冗余与过拟合问题,提升了模型的稳定性与解释性;(3)通过构建列线图实现模型可视化,有助于基层医疗工作者在实践中快速识别农村老年人认知障碍风险,提升风险早筛效率;(4)结合ROC曲线、DCA曲线等多维度评估指标,系统验证模型在准确性、拟合优度与临床应用价值方面的良好性能,为农村地区认知障碍早期筛查提供了切实可行的工具。尽管如此,研究仍存在一定局限性。首先,认知障碍定义采用CHARLS既有标准(总分<11分),虽具较强可比性,但未区分轻度认知障碍与各型痴呆,可能限制模型对不同亚型的识别能力,影响其临床适用性。该问题主要受限于CHARLS数据库缺乏明确诊断信息与系统性认知测评工具。其次,研究基于2011年横断面数据,部分社会行为及健康指标可能随时间变化,影响模型的时效性。第三,尽管本研究采用7∶3数据划分及多种方法对模型进行内部验证,但尚缺乏外部独立样本的验证,模型的泛化能力仍待进一步评估。后续研究应结合多中心、前瞻性队列数据,纳入更全面的认知评估与生物学指标,以提升模型的稳定性与转化价值。
综上所述,本研究基于LASSO和多因素Logistic回归方法,构建了一套适用于我国农村老年人群的认知障碍风险预测列线图。该模型预测性能良好,结构简洁、便于应用,有望为基层社区老年人群的早期筛查与干预提供实用的量化工具和理论依据。本研究不仅在方法路径与模型性能上进行了系统优化,更在农村地区认知障碍早筛的策略制定与政策实践中提供了量化依据。