多维贫困视角下返贫风险识别及预测研究

张劲松 ,  丁同根 ,  马林茂

中南民族大学学报(自然科学版) ›› 2025, Vol. 44 ›› Issue (01) : 126 -137.

PDF (2269KB)
中南民族大学学报(自然科学版) ›› 2025, Vol. 44 ›› Issue (01) : 126 -137. DOI: 10.20056/j.cnki.ZNMDZK.20250729
数学与统计学科学

多维贫困视角下返贫风险识别及预测研究

作者信息 +

Research on risk identification and prediction of returning to poverty from the perspective of multidimensional poverty

Author information +
文章历史 +
PDF (2322K)

摘要

后扶贫时代,从多维度精准识别并预测已脱贫人口的返贫风险是巩固脱贫攻坚成果与乡村振兴有效衔接的必要举措.基于中国家庭追踪调查(CFPS)2012—2018年的数据构建了多维贫困指标,通过A-F双临界值法对农村多维贫困及返贫情况进行测度,通过指标加总和分解讨论了不同指标对于多维贫困的贡献度.在此基础上,利用VMD和BiLSTM模型建立返贫风险预测模型.结果表明:中国农村的多维返贫问题基本集中于二维或三维返贫,社会发展能力维度对多维返贫指数的贡献率最高,贡献率为43.12%,其次是健康和教育维度.返贫风险预测方面,BiLSTM的预测总体准确率为88.9%,对有返贫风险的个体其预测准确性仅有87.6%.AOA-VMD-BiLSTM模型对测试集的整体的预测准确性达到99.81%,其中对存在多维返贫风险的个体预测准确性是99.6%,无风险个体的预测准确性达到100%,说明该模型可以准确并稳定预测多维贫困群体和地区的潜在返贫风险,为贫困治理工作提供更加准确的数据支撑.

Abstract

In the post-poverty alleviation era, accurately identifying and predicting the risk of returning to poverty of people who have been lifted out of poverty from multiple dimensions is a necessary measure to consolidate the effective connection between the achievements of poverty alleviation and rural revitalization. Based on the data of China Family Panel Studies ( CFPS ) from 2012 to 2018, a multidimensional poverty index is constructed, the multidimensional poverty and return to poverty in rural areas are measured based on the A-F double critical value method, and the contribution of different indicators to multidimensional poverty is discussed through the sum decomposition of indicators. On the basis, VMD and BiLSTM models are used to establish a risk prediction model for returning to poverty. The results show that the problem of multidimensional poverty return in rural China is basically concentrated in two-dimensional or three-dimensional poverty return. The dimension of social development ability has the highest contribution rate to the multidimensional poverty return index, with a contribution rate of 43.12%, followed by the health and education dimensions. In the prediction of the risk of returning to poverty, the overall prediction accuracy of BiLSTM is 88.9%, and the prediction accuracy for individuals at risk of returning to poverty is only 87.6%. The overall prediction accuracy of the AOA-VMD-BiLSTM model for the test set reaches 99.81%, of which the prediction accuracy for individuals with multidimensional poverty-returning risk is 99.6%, and the prediction accuracy for risk-free individuals reaches 100%, indicating that the model can accurately and stably predict the potential poverty-returning risk of multidimensional poverty groups and regions, and provide more accurate data support for poverty governance.

Graphical abstract

关键词

多维贫困 / 返贫风险 / 风险识别 / 风险预测 / 贫困治理 / 乡村振兴

Key words

multidimensional poverty / risk of returning to poverty / risk identification / risk prediction / poverty governance / rural revitalization

引用本文

引用格式 ▾
张劲松,丁同根,马林茂. 多维贫困视角下返贫风险识别及预测研究[J]. 中南民族大学学报(自然科学版), 2025, 44(01): 126-137 DOI:10.20056/j.cnki.ZNMDZK.20250729

登录浏览全文

4963

注册一个新账户 忘记密码

2020年中国实现全面脱贫,然而在取得巨大成就的同时返贫问题也相伴而生.建档立卡数据显示,全国2016—2018年分别有68.4万、20.8万、5.8万返贫人口1,除收入因素外,因病、因学、因灾等不同原因返贫压力依然巨大.例如,因病致贫和因病返贫的比例从2013年占比42.2%上升到2015年的44.1%2.后扶贫时代,多维相对贫困成为中国反贫困斗争的主要任务3.多维贫困是指在经济贫困的基础上,考虑教育、健康、住房、社会保障等多个方面的因素,对贫困问题进行更全面和深入的分析.从这个角度出发,中国的反贫困斗争将更加注重提高贫困人口的综合生活水平,以实现可持续脱贫.2020年,习近平总书记在决战决胜脱贫攻坚座谈会上的讲话中指出“已脱贫人口中有近200万人存在返贫风险,边缘人口中还有近300万存在致贫风险”4.新背景下,学术界对于贫困问题的研究也从以收入这一单一静态维度拓展到现在的多维贫困5.为更好地应对新时代背景下的贫困治理问题,中国在基层管理组织中设立了对应的机构,监测地区和个人的脱贫状况,旨在发现潜在的返贫风险,但由于识别指标的多样性和监测人群的广泛性,现有的人工识别和评估方法无法提前准确预测有风险的潜在对象.而只能在返贫发生后做出判断,导致失去了阻止返贫风险扩散的最佳时机,导致重复贫困的出现,增加了新时期贫困治理的成本.

1 文献综述

贫困是一个复杂的社会问题,消除贫困是人类的共同目标.随着社会的发展,学术界对贫困问题的认识和解决方法也在不断演进,从以收入为标准的单维贫困逐渐过渡到以收入、健康、教育、社会发展水平等多维度来测度贫困.贫困长期来看是多维的6,对于多维贫困的研究可以追溯到SEN提出的“可行能力理论”7,SEN认为贫困的本质是基本可行能力被剥夺,强调从多维度提高生活质量.ALIKIRE在已有研究的基础上,对生活质量、跨文化心理学、基本需求理论及参与式发展理论中关于贫困维度的研究进行归纳,指出人类社会的发展是多维的,在研究贫困问题时需要从多维度进行讨论8.在多维贫困的测算研究中,HAGENAARS基于收入和闲暇两个维度构建多维贫困指数,首次对多维贫困进行了定量测算9.2007年ALIKIRE和FOSTER提出A-F方法用于测算多维贫困指数(MPI)10.基于A-F方法,ALKIRE团队测算了104个发展中国家的MPI并在联合国2010年《人类发展报告》中公布11.此后A-F方法的应用进一步得到拓展.除此之外,陈立中采用WATTS多维贫困指数,从收入、知识和健康三个维度对中国转型时期多维贫困进行测算,并进行夏普里分解12.包国宪13基于事故链理论对返贫诱因进行探究,发现自然环境差、政策保障不全面、自身发展动力不足及劳动力质量低共同作用于返贫现象的发生,把返贫诱因归类为制度政策型返贫、资源环境型返贫、灾祸风险型返贫及能力习惯型返贫四种.14.一些研究者也把A-F方法扩展到特定领域,NUSSBAUMER等人构建了多维贫困能源指数(MEPI)对部分非洲国家的能源贫困状况进行测量,以更加准确测量能源贫困的发生率和强度15.ABBAS基于此构建了多维能源贫困指数,并利用OLS回归模型和Tobit模型研究了南亚国家能源贫困程度及影响多维能源贫困的因素,结果表明家庭规模、家庭财富、教育程度、职业以及户主的性别是家庭多维能源贫困的显著负面社会经济决定因素.居住地点、房屋所有权状态和主要劳动力的年龄在多维能源贫困方面发挥了显著的正面作用16.杨惠敏则构建了UNDP-MPI指数对生态敏感区域农户多维贫困测度,发现有较大比例多维贫困农户为非收入贫困,家庭收入来源、房屋结构及医疗支出为家庭贫困主要因素,家庭劳动人口比例、家庭成年人口受教育程度、水电设施配备等都会对农村多维贫困产生中重要影响17.中国的贫困人口退出标准以户为单位,其收入超过国家扶贫标准,同时家庭生活条件也要满足“两不愁、三保障”,这一标准同样体现了非收入指标的重要性18.

为防止返贫现象的发生,需要采用精确的预测方法来预测返贫风险.现有文献大多集中在某一维度对家庭现有贫困状况进行识别,对于返贫风险的预测研究较为缺乏.陈文美19采用ESA模型测算脱贫农户的返贫风险指数,发现金融资本和人力资本是主要返贫因素,构建返贫预警时应以重视.TANG20首次使用遥感数据通过卷积神经网络预测了发展中国家社区的贫困状况.TIAN21探讨了水资源发展与贫困之间的关系,通过关联规则挖掘和分类回归树进行贫困敏感因素识别,发现水资源利用率、人均水资源可利用量和水库密度对贫困等级的预测至关重要.PUURBALANTA22提出了一种空间依赖有序数据的截断高斯地理分类模型将其与现有的家庭贫困分类方法进行比较,该模型的分类和预测精度优于Probit等分类模型.

综上所述,国内外关于多维贫困的研究集中在对因素分析、贫困形成机理的解析及贫困治理框架构建等方面的研究.而对于多维贫困情境下如何预测潜在的返贫风险缺少量化研究.本文则在A-F多维贫困测量方法的基础上,结合长短期神经网络(Long Short-Term Memory:LSTM)模型构建多维贫困预测模型,同时结合变分模态分解(Variational Mode Decomposition:VMD)技术对多维贫困指标进行序列分解提取其中有效信息以提升模型预测精度,为中国乡村振兴中的贫困治理工作提供更加高效的技术保障.

2 研究方法

2.1 A-F双临界值法

本文采用ALKIRE和FOSTER10于2007年基于SEN23的可行能力剥夺理论提出多维贫困测量方法,即A-F法.通过剥夺情况识别、维度加总和维度分解对个体在各个维度的被剥夺情况进行评价.首先,识别个体在单个指标上的贫困情况.用矩阵Xijt表示个体的指标信息,其中,t表示时间维度,i表示个体总数,j表示指标的数量.指标j的剥夺临界值为Zj,判断个体i在指标j是否被剥夺用gijt表示:

gijt=1,xij<Zj0,xijZj

根据构建指标体系中所确定的临界值,结合数据矩阵得到剥夺矩阵gij0.剥夺矩阵用来存储个体被剥夺的情况,若个体在该指标下被剥夺,则矩阵中对应值为1,否则为0.用pjt表示t时刻个体ij纬度的贫困率,公式表示为:

pjt=i=1ngijtn

hijtqijt表示t时刻个体ij维度的返贫状态和返贫率,公式表示为:

hijt=1,    gijt+1=0gijt=10,   其他
qijt=1=1ngijt1=1n(1-gijt-1)

通过识别每个个体在各指标上的被剥夺情况,统计出贫困人口数量,进而计算多维贫困发生率(H)、平均剥夺份额(A)、以及多维贫困指数(MPI)HAMPI分别表示研究区域的多维贫困人口数量、平均被剥夺的指标数量及该地区的贫困程度.其中,q为研究区域的多维贫困人口数,n表示区域人口总数,ci(k)为个体i在临界值为K时被剥夺的指标数量.

H=qn
A=i=1nci(k)q
MPI = HA

最后,按照不同维度或指标对MPI进行分解,计算研究区域各维度或指标对MPI的贡献度,即研究区域各维度或指标与该地区贫困程度的关系.同时可以得到第j个指标对MPI的贡献度MPIj,如公式(8)所示.

MPIj=wjCHjMPI×100.

2.2 AOA-VMD-BILSTM模型

2.2.1 阿基米德优化算法

阿基米德优化算法(Archimedes Optimization Algorithm:AOA)是2020年HASHIM等人基于物理学中阿基米德原理提出的启发式优化算法.该算法通过将每个搜索空间中的解视为浮力作用下漂浮的物体,并根据环境压力和重力等因素进行动态调整,以找到全局最优解.相较于传统优化算法,阿基米德优化算法具有全局寻优性能好、适应性强、参数少易于实现、能够跳出局部最优解等特点,是一种有效的全局优化算法.具体实现步骤如下:

初始阶段:

对阿基米德优化算法个体的密度(den)、体积(vol)、加速度(acc)进行初始化,选择具有最佳适应度的个体(best)、最优密度(den)、最优体积(vol)及最优加速度(acc).通过公式(9)-(12)更新密度、体积、转移因子TF及密度降低因子d.

TF=expt-tmaxtmax
dt+1=exptmax-ttmax-ttmax
denit+1=denti+rand×deni-denit
volit+1=volti+rand×volbest-volit

其中:t表示迭代次数、tmax表示最大迭代次数、rand是一个在[0,1]之间随机生成的D维向量、denitdenit+1分别为第i个个体在第t代和第t+1代的密度;volitvolit+1为第i个个体在第t代和第t+1代的体积.

全局探索阶段:

TF0.5时,算法进行全局探索阶段,个体的加速度更新数学模型如式(13)所示.为了确保数值稳定性,使用公式(14)对加速度进行标准化处理,以便用于更新碰撞个体的位置,通过公式(15)进行更新碰撞个体的位置.

accit+1=denmr+volmr+accmrdenit+1×volit+1
acci-normt+1=u*accit+1min(acc)max(acc)×min(acc)+l
xit+1=xit+c1×rand×acci-normt+1×d×xrand-xit

其中:accit+1为第i个个体在第t+1代的加速度,denmrvolmraccmr分别为随机选择碰撞个体的密度、体积和加速度,c1为常数;xit表示第i个个体在第t次迭代的位置向量.

局部搜索阶段:

 TF>0.5时,算法处于局部搜索阶段.通过式(16)更新个体加速度.为确保数值稳定性,通过式(17)对加速度进行标准化处理.在此引入变量F,用于决定个体位置更新的方向,定义如(18)式所示.

accit+1=denbest+volbest+accbestdenit+1×volit+1
xit+1=xbestt+F×c2×rand×acci-normt+1×d×T×xbest-xit
F=+1  if p0.5-1  if p>0.5

其中:xbest表示全局最优个体,c2为常数,T=c3×TFc3为常数,p=2×rand-c4,c4为常数.

2.2.2 变分模态分解

变分模态分解(Variational Mode Decomposition:VMD)是一种用于处理非平稳信号的自适应信号分解方法.它是基于变分方法和稀疏表示的一种新型信号处理技术,可以将非平稳信号分解为一组带宽有限的固有模态函数.实现步骤如下:

建立变分模型:将原始信号f(t)解成N个分量,每个分量具有中心频率的有限带宽.然后使用Hilbert变换对这些分量进行解调解析,平移到基带并混合中心频率,以估计信号带宽.通过构造变分函数模型,如式(19)所示,使得各模态的估计带宽之和最小,并保证各个分量之和与原始信号相同.

min{un},{ωn}tδ(t)+jπ-1t-1×un(t)e-jωnt22s.t.n=1Nun=f(t)

其中unωn分别为分解后第N个模态分量和中心频率,t为时间t的偏导数,δ(t)为狄拉克函数,j为虚数单位,un(t)为模态函数.

求解变分模型最优解:引入拉格朗日乘数法算子λ(t),拉格朗日参数λ和二次惩罚参数α,将式(19)转化为增广拉格朗日函数如式(20)所示.

L({un},{ωn},λ)=αn=1Ntδ(t)+jπ-1t-1un(t)e-jωnt22+f(t)-n=1Nun(t)22+λ(t),f(t)-n=1Nun(t)

经迭代计算,得到第N个模态分量如式(21)所示.

u^nn+1(ω)=(f^(ω)-i<nu^nn+1(ω)-i>nu^1n(ω)+λ^(ω)/2)/[1+2α(ω-ωm)2]

其中:f^(ω)u^n(ω)λ^(ω)分别为f(t)un(t)λ(t)的傅里叶变换.

变分模态分解能够将多分量信号一次性分解成多个单分量调幅调频信号,同时避免了迭代过程中遇到的端点效应和虚假分量问题,克服了经验模态分解的缺陷.该方法能有效处理非线性及非平稳信号,但在使用中需要提前确定待分解的模态数量N及算法中的惩罚因子α,这两个参数的取值也会直接影响模型分解后数据的质量和效果.

2.2.3 双向长短期记忆神经网络

HOCHREITER和SCHMIDHUBER在1997年提出了长短时记忆神经网络(LSTM)模型,有效地解决了传统RNN的梯度消失和梯度爆炸问题.LSTM通过门结构向细胞状态添加或移除信息,其网络结构如图1所示.

每个LSTM单元由以下4个部分构成:

遗忘门:决定该单元在某一时刻保留或者遗忘某些信息,具体计算如公式(22)所示.

ft=σ(Wf×[ht-1,xt]+bf) .

输入门:接收当前时刻输入的信息并更新当前单元存储的相关信息,如公式(23)所示.

it=σ(Wi×[ht-1,xt]+bi) .

细胞状态:通过对前一时刻该单元的状态信息及当前时刻单元的输入信息进行计算,得到此刻的状态信息,如公式(24)所示.

Ct=ft×Ct-1+it×C˜t
其中C˜t=tanhWht-1,  xt+b.

输出门:计算得到单元的隐藏特征及该时刻的输出信息,如公式(26)-(27)所示.

Ot=σWo[ht-1,xt]+bo
ht=Ot×tanh(Ct)

其中:ft为遗忘门的输出值,Wfbf分别表示遗忘门的权值矩阵和偏置矩阵,xt为输入特征,ht-1为前一时刻输出的隐藏特征,Wibi分别表示输入门的权值矩阵和偏置矩阵,it表示输入门的输出值,C˜t表示新的状态候选向量,Ct为新的记忆细胞单元,Ot为输出门的输出值,Wobo分别是输出门的权值矩阵和偏置矩阵,ht为当前LSTM的单元输出,σ和tanh为激活函数.

双向长短期记忆神经网络(Bi-directional LSTM:BiLSTM)24是LSTM的一种变体,LSTM只能处理单一方向的输入序列,在时间序列数据处理时具有较大局限性.BiLSTM从两个方向(前向和后向)分别处理输入序列,其结构如图2所示,使得BiLSTM能够同时捕捉过去和未来的信息,从而更好地学习到序列中的依赖关系.

3 模型构建

本文首先基于A-F多维贫困测量法对多维贫困进行测量,并在此基础上利用多维属性因素构建预测指标体系;其次基于BiLSTM模型构建多维贫困风险预测模型,同时以VMD方法对多维特征进行分解以提取更多有效信息;最后为了弥补VMD方法分解数据中受到模态数量及惩罚因子影响较大的缺陷,引入AOA优化方法对其参数组合进行优化以达到最佳预测效果.模型具体思路如图3所示.

模型具体步骤如下:

步骤1:基于A-F多维贫困测量方法对个体多维贫困进行度量,并分析其整体多维贫困率及各因素对多维贫困发生的影响及作用.

步骤2:将A-F方法对个体的评判结果作为个体贫困是否发生的衡量指标.

步骤3:基于AOA算法优化VMD方法.

步骤3.1:设定AOA算法的初始化参数包括最大迭代次数、种群数量以及初始化个体的密度(den)、体积(vol)、加速度(acc);

步骤3.2:以VMD分解后各分量的包络熵作为评价AOA算法中个体优劣的标准,即评价函数;

步骤3.3:根据AOA算法步骤更新迭代,达到算法终止条件并输出最优的模态分量N及惩罚因子α.

步骤4:根据获得的最优参数组合,利用VMD算法对多维贫困指标进行分解,得到最优本征模态分量,并将各个特征分解后的本征模态分量进行整合,并作为BiLSTM神经网络模型的输入数据.

步骤5:将数据划分为训练集、验证集和测试集.

步骤6:设定BiLSTM的网络层数、神经元的数量、最大训练次数、初始学习速率、学习权重调整方法、训练精度要求等参数.

步骤7:以训练集及验证集训练神经网络,并输入最优神经网络网络模型.

步骤8:基于测试集测试构建的模型的准确性.

4 实证分析

4.1 数据来源与指标体系构建

本文采用中国家庭追踪调查(CFPS)2012、2014、2016和2018年四个年度的调查数据,CFPS数据样本覆盖我国25个省区,目标样本量达16000户,覆盖样本家庭的全部家庭成员,涵盖经济、教育、健康、生活水平、社区环境等方面.通过Stata17.0进行数据清洗,最终得到4176个有效家庭样本.借鉴王小林、ALKIRE25和郭熙保、周强5的研究,参考联合国与牛津大学共同提出的多维贫困指数,结合中国实际情况基于现有数据选取经济、健康、教育、生活水平和社会发展能力等5个维度的12项指标、采用等权重法26-27构建本文指标体系,如表1所示.

4.2 单维贫困测度结果

从时间维度来看,随着中国脱贫攻坚工作的不断推进,贫困率和返贫比例整体呈现普遍下降趋势,尤其是人均纯收入维度的返贫比例下降较为显著,下降了25.5个百分点,表明中国在减少收入贫困方面成效显著.受发展观念、生活习惯等因素影响,其他非收入维度相对收入维度更加稳定,多数为持续性贫困,短时间内难以实现脱贫,意味着中国在收入外其他指标减贫方面还具有较大压力.从指标维度来看,截至2018年,各个维度的返贫率及返贫比例均位于较低水平,健康自评、成人受教育程度、劳动力水平等维度返贫率及返贫比例有较为显著的下降,尤其是健康自评维度返贫率下降了48.5个百分点.总体来看,各指标在贫困发生率方面具有较大差异,因此,相较于单一收入为度,从多维贫困视角考察贫困及返贫问题更具有合理性,如表2所示.

4.3 多维贫困测度结果

多维返贫测度结果如表3所示.从2014-2018年中国多维返贫率下降了18.2%,多维返贫户比例下降了27.7%,返贫指数从2014年的20%下降到2018年的6.4%,这表明中国脱贫攻坚取得了巨大成效.2020年中国历史性地解决了绝对贫困问题,但相对贫困的问题依然存在,在解决相对贫困问题时,要多维度并进,不可让某些维度成为制约贫困治理的短板问题.

本文通过对不同临界值下的多维贫困状况进行测算,如表4所示.K值为多维贫困指数的临界值数量,当K值为1时,贫困发生率H为0.995,这表明研究样本中至少在一个维度上发生贫困的概率达到99.5%,当K值大于等于9时,多维贫困发生率为0,说明不存在9个及以上指标全部贫困的家庭.随着K值的增加,贫困发生率和多维贫困指数逐渐下降,平均剥夺强度呈现逐渐上升趋势,这表明随着维度的增加,多维贫困发生率下降的同时,农户被剥夺的深度逐渐增加,这些多维被剥夺农户具有较大的脱贫难度及返贫风险,在反贫困工作中应当加以重视.

表5是K值为4时各指标的多维返贫贡献率.根据表5,医疗保险、儿童教育、成人受教育程度、劳动力水平的返贫贡献率较为显著,其中返贫贡献率最高的为劳动力水平,2018年贡献率为48.3%,医疗保险次之,为15.1%.4年内,医疗保险和儿童教育的返贫贡献率有所上升,上升幅度分别为8%和7%,但人均纯收入和健康自评两个指标的贡献率下降明显,分别下降了9.2%和8.1%.

4.4 多维贫困指数分解

本文使用A-F法计算出了经济、健康、教育、生活水平和社会发展能力5个维度在不同K值下对多维贫困指数的贡献度,如表6图4所示.随着K值的增大,健康和教育两个维度的贡献率逐渐下降,这一变化趋势表明对于被剥夺程度深的农户来说,健康和教育两个维度比经济和社会发展能力两个可以通过开发式扶贫达到脱贫和不返贫的维度的重要性要小.生活水平维度随K值的变化波动较小,这与贫困地区或贫困户固有的生活生产模式具有重要关系.同时,在K值较小的时候,经济维度的贡献率较低,随着维度增加贡献率逐渐增加,经济资本的缺失将直接影响到农户的脱贫难度及返贫风险的大小,多维贫困户往往缺少扩大再生产的机会,缺乏改善家庭现有生活状况的机会.总体来看,社会发展能力的贡献率最高,随着K值的增大,呈现先上升后下降的波动趋势,K值为4时的贡献率为40.18%,K值为8时的贡献率为24.23%,但总体被剥夺率依然处于高位,K值为8时的贡献率为24.23%.一方面,以血缘、地缘关系为纽带的社会网络,使得多维贫困户长期自给自足的生活方式难以改变;同时多维贫困程度较深的农户多为老弱病残群体,大多要通过社会救助及国家政策兜底保障实现脱贫及防止返贫.

4.5 结果分析

基于CFPS数据从经济、健康、教育、生活水平、社会发展能力五个维度共12项指标从一维和多维两个角度对贫困及返贫情况进行测算并进一步对多维贫困指数进行分解以评估各个维度对总体贫困指数的重要性.从单维角度看,近年来中国的返贫率大幅下降,但返贫风险仍然存在,尤其是健康、教育等非收入因素受内外部环境影响较大,短期内难以彻底改善.从多维角度看,多维返贫问题集中于二维和三维返贫,社会发展能力维度对多维返贫指数的贡献率最高,其次是健康和教育维度.社会发展能力维度对多维返贫指数的贡献率高达31.22%.

基于A-F方法对多维返贫因素的识别及分析,清晰展现了各因素对多维贫困发生的作用,这也为预测潜在多维贫困发展奠定了基础.而预测农户是否具有返贫风险对于政府防返贫工作的及时性和科学性具有重要实践意义,本文将在此基础上利用AOA-VMD-BiLSTM模型对农户的返贫风险进行预测.

5 多维贫困预测

5.1 数据选取

本文基于CFPS2012-2018年数据来检验所提出的预测模型的性能,基于A-F方法对多维因素的研究,本文选取了14个指标作为返贫风险预测的输入因素,并对数据进行编码如表7所示.为消除奇异样本数据的影响,加快求解速度并提高模型预测精度,通过公式x'=(x-xmin)/(xmax-xmin)对指标数据进行归一化处理,其中x,x',xmin,xmax分别为原始数据、归一化处理后的数据、原始数据的最小值与最大值.

5.2 结果与分析

5.2.1 AOA算法优化VMD

本文构造的预测模型中,利用VMD模型对多维特征进行分解,并且为保证分解得的最优的结果,需要根据各维度信息利用AOA优化算法对VMD模型中的关键参数进行优化处理.设定AOA算法种群数量10,最大迭代次数为20次,并随机初始化个体的密度(den)、体积(vol)、加速度(acc).最终分别得到14个特征指标进行VMD分解是的最优参数组合如表8所示.

将处理后的数据作为VMD算法的输入,同时各指标分解时采用AOA优化后获得的最优参数,对其进行分解处理,得到各指标的本征分解变量.

5.2.2 返贫风险预测

将各指标分解后的变量作为最终预测的输入变量,并将数据的80%作为训练集,10%的数据作为验证集,10%作为预测集.BiLSTM神经网络模型的主要结构参数如表9所示.为了防止神经网络出现过拟合,本文设定输出的神经网络为验证集损失最优的神经网络,并利用测试集检验最终得的AOA-VMD-BiLSTM神经网络和BiLSTM神经网络的预测效果,二者训练过程曲线如图5图6所示.

图5图6中二者的预测准确率收敛曲线可知,AOA-VMD-BiLSTM神经网络模型与传统BiLSTM神经网络模型相比,其收敛速度更快,在第2轮训练中就已经达到收敛,此后网络处于稳定状态,预测准确率曲线基本没有明显波动且准确性基本达到100%.而传统BiLSTM神经网络模型在前70轮的训练过程中准确率一直有较大的波动,最佳准确性也不足90%,并且在70轮后预测准确性有了一定提升,但仍然没有超过90%.说明传统BiLSTM模型在多维返贫风险预测中收敛过程不稳定且准确性不高,会对预测结果产生较大影响.同时,根据图6图7中的损失函数曲线也可以看出,本文构造的AOA-VMD-BiLSTM模型在第2轮迭代中其损失值已经达到最优,并且接近于0;而传统BiLSTM模型则出现较大波动,并且最优损失值只能接近0.2.再次验证了本文构造的模型可以更好地处理多维贫困数据,可以提供根据准确的返贫风险预测结果.

训练过程反应了模型的准确性和稳定性,但是其泛化能力需要通过测试集单独验证,同时分类预测中混淆矩阵更能直观地反应模型的预测效果,AOA-VMD-BiLSTM神经网络模型和BiLSTM模型对测试集数据进行预测,其预测结果的混淆矩阵如图7图8所示,其中1表示存在多维返贫风险,2表示无多维返贫风险.

图8可以看出AOA-VMD-BiLSTM模型对测试集的整体的预测准确性达到99.81%,其中对存在多维返贫风险的个体预测准确性是99.6%,无风险个体的预测准确性达到100%.而图7的结果显示出BiLSTM对测试集的预测效果,其总体准确率只有88.9%,而对有返贫风险的个体其预测准确性仅有87.6%.这一结果也显示出传统BiLSTM模型在多维贫困返贫风险的预测中可能会对潜在返贫风险存在严重误判,造成更大规模的返贫风险.

为进一步说明本文构造的AOA-VMD-BiLSTM模型的预测效果,本文从测试集的预测的准确性、精确性、召回率及调和平均数(F1 Score)等性能指标对比了BiLSTM和AOA-VMD-BiLSTM神经网络模型的预测效果如表10所示.从表中可以看出本文构造的模型个性能指标均达到99.5%以上,明显优于传统的BiLSTM模型,说明该模型可以准确并稳定预测多维贫困群体和地区的潜在返贫风险,模型可以为贫困治理工作提供更加准确的数据支撑.

6 研究结论

针对中国乡村振兴中面临的返贫风险问题,本文提出了一种基于A-F多维贫困测度模型,融合阿基米德优化算法及变分模态分解方法的BiLSTM多维返贫风险预测模型.研究结果说明了A-F在多维贫困识别中的重要作用,并且发现中国农民的多维返贫问题基本集中于二维和三维返贫.总体而言,多维返贫户呈现出广而不深、易发生的特征.社会发展能力维度对MPI的贡献率最高,继而是健康和教育维度.社会发展能力维度对多维返贫指数的贡献率高达31.22%,表明中国农村当前多维返贫原因主要为家庭缺少劳动力,其次为因病、因学返贫.当前的医疗、教育支出费用较高,且农村收入来源不稳定成为农民多维返贫的主要因素.

同时,基于实际调查数据单独划分的测试集的实验结果也显示了本文提出的预测模型的对多维返贫风险的预测准确性能够达到99.8%以上,与传统BiLSTM模型相比其识别准确性提高了10%,而精确性提高了25%;充分说明了模型的有效性.该模型也可以应用于实际贫困治理工作中,提高中国贫困治理中对贫困风险的预测精度,进一步保证中国乡村振兴建设目标的实现.

参考文献

[1]

檀学文, 白描. 论高质量脱贫的内涵、实施难点及进路[J]. 新疆师范大学学报(哲学社会科学版)202142(2): 29-40, 2.

[2]

吴国宝. 改革开放40年中国农村扶贫开发的成就及经验[J]. 南京农业大学学报(社会科学版)201818(6): 17-30, 157.

[3]

王小林, 冯贺霞. 2020年后中国多维相对贫困标准:国际经验与政策取向[J]. 中国农村经济2020(3): 2-21.

[4]

习近平. 在决战决胜脱贫攻坚座谈会上的讲话[J]. 中国民政2020(7): 4-7.

[5]

郭熙保, 周强. 长期多维贫困、不平等与致贫因素[J]. 经济研究201651(6): 143-156.

[6]

HULME DMOORE KSHEPHERD A. Chronic Poverty: Meanings and Analytical Frameworks[J/OL]. SSRN Electronic Journal2001[2023-04-21].

[7]

SEN A. Poverty: An ordinal approach to measurement[J]. Econometrica197644(2): 219.

[8]

ALKIRE S. Dimensions of human development[J]. World Development200230(2): 181-205.

[9]

HAGENAARS A. A class of poverty indices[J]. International Economic Review198728(3): 583.

[10]

ALKIRE SFOSTER J. Counting and multidimensional poverty measurement[J]. Journal of Public Economics201195(7-8): 476-487.

[11]

UNDP. Sustainability and equity: A better future for all[M]. Houndmills: Palgrave Macmillan, 2011.

[12]

陈立中. 转型时期我国多维度贫困测算及其分解[J]. 经济评论2008(5): 5-10, 25.

[13]

包国宪, 杨瑚. 我国返贫问题及其预警机制研究[J]. 兰州大学学报(社会科学版)201846(6): 123-130.

[14]

尚卫平, 姚智谋. 多维贫困测度方法研究[J]. 财经研究200531(12): 88-94.

[15]

NUSSBAUMER PBAZILIAN MMODI V. Measuring energy poverty: Focusing on what matters[J]. Renewable and Sustainable Energy Reviews201216(1): 231-243.

[16]

ABBAS KLI S XXU D Yet al. Do socioeconomic factors determine household multidimensional energy poverty? Empirical evidence from South Asia[J]. Energy Policy2020146: 111754.

[17]

杨慧敏, 罗庆, 李小建, . 生态敏感区农户多维贫困测度及影响因素分析——以河南省淅川县3个村为例[J]. 经济地理201636(10): 137-144.

[18]

中共中央办公厅,国务院办公厅.关于建立贫困退出机制的意见[J]. 中华人民共和国国务院公报2016(14): 7-8.

[19]

陈文美, 张昌柱, 李春根. 农村脱贫家庭返贫风险测度及预警机制构建研究——基于生计脆弱性的分析框架[J]. 贵州财经大学学报2023(2): 73-82.

[20]

TANG BLIU Y YMATTESON D S. Predicting poverty with vegetation index[J]. Applied Economic Perspectives and Policy202244(2): 930-945.

[21]

TIAN F YWU B FZENG H Wet al. Identifying the links among poverty, hydroenergy and water use using data mining methods[J]. Water Resources Management202034(5): 1725-1741.

[22]

PUURBALANTA R. A Clipped Gaussian Geo-Classification model for poverty mapping[J]. Journal of Applied Statistics202148(10): 1882-1895.

[23]

SEN A. Development as freedom[M]. New York: Anchor books, 2000.

[24]

GRAVES ASCHMIDHUBER J. Framewise phoneme classification with bidirectional LSTM and other neural network architectures[J]. Neural Networks200518(5-6): 602-610.

[25]

王小林, ALKIRE S. 中国多维贫困测量: 估计和政策含义[J]. 中国农村经济2009(12): 4-10, 23.

[26]

邹薇, 方迎风. 关于中国贫困的动态多维度研究[J]. 中国人口科学2011(6): 49-59, 111.

[27]

程威特. 中国家庭多维相对贫困及其影响因素研究[D]. 武汉: 中南财经政法大学, 2021.

基金资助

国家社会科学基金重点资助项目(19AGL029)

AI Summary AI Mindmap
PDF (2269KB)

369

访问

0

被引

详细

导航
相关文章

AI思维导图

/