基于支持向量机和增强学习算法的岩爆烈度等级预测

杨玲 ,  魏静

地球科学 ›› 2023, Vol. 48 ›› Issue (05) : 2011 -2023.

PDF (1531KB)
地球科学 ›› 2023, Vol. 48 ›› Issue (05) : 2011 -2023. DOI: 10.3799/dqkx.2022.251

基于支持向量机和增强学习算法的岩爆烈度等级预测

作者信息 +

Prediction of Rockburst Intensity Grade Based on SVM and Adaptive Boosting Algorithm

Author information +
文章历史 +
PDF (1567K)

摘要

岩爆烈度等级的准确预测对减轻乃至消除岩爆危害具有重要意义.针对岩爆烈度等级预测模型特征选取模糊和预测准确度不高问题,提出了一种ReliefF-Pearson特征选择下基于SSA-SVM-AdaBoost算法的岩爆等级预测模型.结合ReliefF的权值思想和Pearson系数的相关性原理对特征指标进行选择,利用麻雀搜索算法(SSA)优化支持向量机(SVM)以获得最优模型初始参数,将多个SSA优化后的SVM作为弱分类器组成自适应增强学习算法(AdaBoost)的强分类器.首先通过收集分析国内外岩爆案例数据,选取7种特征指标构成原始特征空间,然后利用ReliefF-Pearson从原始特征空间中筛选出4维优势特征,采用随机过采样对数据进行处理,最后将其输入到SSA-SVM-AdaBoost模型中进行分类预测.研究结果表明:基于ReliefF-Pearson的特征选择方法能够有效提取优势特征;基于多SSA-SVM的AdaBoost模型预测准确率相较于SSA-SVM和单层决策树AdaBoost模型均提高12.5%,相较于SVM提高31.25%,说明SSA-SVM作为弱分类器在分类性能上要优于单层决策树,AdaBoost增强算法集成多个单分类器要优于单个分类模型,且数据过采样处理没有影响模型预测集准确率,表明SSA-SVM-AdaBoost模型可有效应用于岩爆烈度等级预测,为岩爆预测问题提供新思路.

关键词

岩爆烈度等级 / 特征选择 / 支持向量机 / 麻雀搜索算法 / 增强学习算法 / 工程地质

Key words

rockburst intensity grade / feature selection / support vector machine / sparrow search algorithm / AdaBoost algorithm / engineering geology

引用本文

引用格式 ▾
杨玲,魏静. 基于支持向量机和增强学习算法的岩爆烈度等级预测[J]. 地球科学, 2023, 48(05): 2011-2023 DOI:10.3799/dqkx.2022.251

登录浏览全文

4963

注册一个新账户 忘记密码

岩爆是在开挖或其他荷载扰动作用下,处于高应力状态的硬、脆性围岩快速释放蓄积的弹性能,从而产生岩石剥落、碎化、弹射的动力失稳灾害(汤志立和徐千军, 2020).随着工程建设的不断深入,岩爆成为常见灾害之一,岩爆的发生不仅给施工人员带来巨大的安全隐患,也会造成较大的经济损失.因此,如何较为准确地预测岩爆已经成为众多学者亟需解决的问题(王成虎等, 2019).
近年来,随着机器学习的发展且逐渐应用于工程领域,基于机器学习的岩爆等级预测迅速发展(Pu et al., 2019).Dong et al.(2013)将随机森林分类方法应用于岩爆等级判定问题中,建立有监督学习模型,在岩爆等级分类中取得良好效果;汤志立和徐千军(2020)汤志立等(2021)通过引入9种经典机器学习算法建立了9个考虑多因素的岩爆预测模型,且研究了5种过采样方法及5种客观赋权方法对模型预测性能的影响;高磊等(2021)选取80组数据建立基于混合粒子群算法优化的径向基(RBF)神经网络预测模型,该模型兼顾个体最优和全局最优且预测结果较好;杨小彬等(2021)建立基于SOFM神经网络的岩爆烈度等级预测模型,并根据竞争层拓扑结构的不同将预测模型拓展为3个模型以获得最优模型;李明亮等(2021)引入T-分布邻域嵌入降维方法,对数据进行降维可视化,采用6种机器学习算法结合随机交叉验证方法分别建立岩爆烈度等级预测模型,在水电站及隧道案例中预测效果良好.岩爆等级预测的机器学习模型是通过学习已有数据并进行分类以此来预测现有工程的岩爆等级,其本质为识别分类问题,目前岩爆等级预测多采用单一的分类预测模型,分类性能参差不齐.Boosting是一种组合单一分类方法的集成学习算法,通过对样本集的操作获得样本子集,然后用弱分类算法(弱分类器)在样本子集上训练生成一系列的基分类器.AdaBoost(adaptive boosting)自适应增强算法作为Boosting算法家族最具代表性的算法,其参数设置简单且无需先验知识(Freund and Schapire, 1997),其分类精度在一定程度上依赖弱分类器的分类性能.
支持向量机(support vector machine, SVM)作为一种具有强大泛化能力的机器学习模型,已广泛应用于道岔故障诊断、信号处理等方面(孔令刚等, 2020).但在实际应用中,对于SVM最优参数的选择在理论上尚未得到较好解决.麻雀搜索优化算法(sparrow search algorithm, SSA)是 2020年Xue and Shen(2020)提出的一种新型仿生群体智能优化算法,源于对麻雀种群捕食行为和反捕食行为的研究.SSA具有很强的全局寻优能力,且具有可调节参数少、结构清晰等优点.本文尝试建立以基于麻雀搜索优化支持向量机算法为弱分类器的AdaBoost强分类器算法模型.
特征选择是机器学习非常重要的预处理步骤,主要是从原始数据中挖掘出对象识别、分类最有效的特征.目前岩爆等级预测机器学习模型中的特征指标选取方法主要有基于特征参数的物理意义而确定(高磊等, 2021)、基于不同特征组合对模型训练分析进而确定最优特征组合(汤志立和徐千军, 2020)等.特征指标选择各有不同,进而影响模型预测精度.ReliefF算法是一种原理简单、计算快速的过滤式特征选择方法,在许多场景中有着广泛应用(Robnik-šikonja and Kononenko, 2003).将ReliefF算法引入岩爆等级预测中,选取预测模型的优势特征,进而利用Pearson相关系数判断优势特征选取的合理性并进行二次筛选,以期提供新的特征选择方法.
针对已有研究存在的问题,本文提出一种ReliefF-Pearson特征选择下的基于SSA-SVM-AdaBoost算法的岩爆等级预测模型.选取国内外86组岩爆案例工程数据,结合ReliefF算法和Pearson相关系数确定优势特征指标并利用箱线图对数据进行清洗,建立以基于麻雀搜索优化支持向量机算法为弱分类器的集成强分类器算法预测模型,获得比单一学习器具有更优越泛化能力的模型.为探究数据不均衡对模型的影响,采用随机过采样对数据进行处理,输入SVM、SSA-SVM、基于单层决策树的AdaBoost模型和SSA-SVM-AdaBoost模型中,并与原始数据集的预测结果进行对比分析,通过预测桑珠岭隧道岩爆样本点的烈度等级验证该模型的可行性和适用性.

1 指标和数据

1.1 特征指标选取

岩爆发生机制十分复杂,受应力、地质、开挖等多种因素共同影响,根据发生机制和条件的不同,岩爆可以分为多种类型,其中应变型岩爆是最为常见的岩爆类型,工程扰动导致应力重分布是此类岩爆发生的主要外因(Ortlepp, 2001严孝海, 2022).目前不同学者在进行岩爆等级预测时所选择的特征指标不尽相同,其岩爆烈度分级标准也不完全相同,通过查阅文献,将部分研究中所选择的特征指标和分级标准汇总于表1.

表1可知,已有研究中多选取的特征指标为围岩洞壁最大切向应力( σ θ)、岩石单轴抗压强度( σ c)、岩石单轴抗拉强度( σ t)、岩石应力系数( σ θ / σ c)、岩石脆性系数( σ c / σ t)和岩石弹性能指数(Wet ),亦有部分学者考虑了埋深(H)的影响,根据岩爆发生的剧烈程度及破坏特征,将岩爆烈度等级分为无岩爆(I级)、轻微岩爆(II级)、中等岩爆(III级)和强烈岩爆(IV级),不同等级所对应的分级标准也存在不同,主要表现在 σ θ / σ c,大多 σ θ / σ c分级标准采用二郎山判据,即<0.3、0.3~0.5、0.5~0.7、>0.7,周航等(2022) σ θ / σ c值划分为<0.20、0.20~0.30、0.30~0.55、>0.55,这种划分方式可能会将之前判定等级为轻微和中等的岩爆案例提高一个等级,即当岩石单轴抗压强度相同,在围岩洞壁最大切向应力较小的情况下就可能发生等级较高的岩爆.除此之外,隧洞跨度、隧洞高度、开挖方式等对岩爆的产生均有一定影响,但目前研究中较少考虑这些指标.

为保证指标筛选的合理性和尽量获得较多案例数据,本文选取埋深(H)、围岩洞壁最大切向应力( σ θ)、岩石单轴抗压强度( σ c)、岩石单轴抗拉强度( σ t)、岩石应力系数( σ θ / σ c)、岩石脆性系数( σ c / σ t)和岩石弹性能指数(Wet )为特征指标,记为X1、X2、X3、X4、X5、X6和X7.埋深H和围岩洞壁最大切向应力 σ θ表征地应力特征,通常情况下围岩洞壁最大切向应力越大,埋深越大,则地应力越大,发生岩爆的可能性和危险性等级越高(贾月卿, 2018);岩石应力系数 σ θ / σ c综合反映了围岩应力这一因素对岩爆的影响,其值越大则岩爆发生的概率和强度越大;岩石单轴抗压强度 σ c、岩石单轴抗拉强度 σ t、岩石脆性系数 σ c / σ t和岩石弹性能指数Wet 均表征围岩的岩性,岩石脆性系数越小,弹性能指数越大,发生岩爆的可能性和危险性等级越高.查阅文献收集到国内外86组岩爆案例(Zhou et al., 2012Afraei et al., 2019),部分岩爆案例数据见表2.

在进行机器学习时,过多的指标不仅会增加预测过程的复杂性 ,而且会增加模型的训练时长,甚至会影响预测模型的精度.指标过少则导致信息缺失,不能全面反映岩爆发生的条件而导致预测错误.为此,合理选择特征指标作为预测模型的输入变量是非常有必要的.上文提到的7个特征指标对岩爆预测结果的作用大小可能不同,特征之间也可能存在相关性.为确定最优特征组合,本文提出基于 ReliefF-Pearson的指标选择方法,流程图见图1,具体步骤如下:首先使用ReliefF算法客观地寻找已有特征指标数据与岩爆等级之间的关系,并以权重表示特征指标对岩爆等级的影响程度,确定阈值并剔除小于阈值的指标;为消除ReliefF算法的冗长性,引入Pearson相关系数对选出的特征指标进行二次筛选,求解特征指标之间的相关性,并剔除相关性较高的特征指标,最后得到最优特征指标.

ReliefF是一种处理多分类问题的特征选择方法,其核心为权值思想,即根据某个特征和类别的相关性赋予特征不同的权重,权重小于某个阈值的特征将被移除.该算法中特征和标签类别的相关性是基于特征对近距离样本的区分能力度量的.具体计算过程如下:对任意特征,首先从训练集中随机选择一个样本 R i,从与 R i 同类样本和不同类样本中分别选择K个最近邻样本,根据权值单次迭代式不断更新该特征对应的权值,循环计算m次直至所有样本依次计算完毕,得到单个特征的最终权值(张小内等, 2021).权值单次迭代式为:

           W i + 1 ( A l ) = W i ( A l ) - j = 1 k d i f f ( A l , R i , H j ) m K + C C l a s s ( R i ) P ( C ) 1 - P ( C l a s s ( R i ) ) j = 1 k d i f f ( A l , R i , M j ( C ) ) / ( m K ),

式中, W i ( A l )为第i个样本中第l个特征 A 的权值; H j ( j = 1,2 , , K )为与 R i同类的K个最近邻样本中的第j个样本;P C )为在训练样本中属于类别 C 的样本所占比值;P(Class( R i ))为与 R i 同类的样本占总样本的比值,其中Class( R i )为 R i 的标签类别; M j ( C ) ( j = 1,2 , , K )为与 R i 不同类的K个最近邻样本中的第j个样本(标签类别为 C ).函数 d i f f ( A , R 1 , R 2 )的计算方法为:

            d i f f ( A , R 1 , R 2 ) = R 1 [ A ] - R 2 [ A ] m a x ( A ) - m i n ( A ) 0 1 A 连续 A 离散 , R 1 [ A ] = R 2 [ A ] A 离散 , R 1 [ A ] R 2 [ A ]   ,,

式中, d i f f ( A , R 1 , R 2 )为样本 R 1 R 2在特征 A上的归一化距离, R 1 [ A ] R 2 [ A ]分别为样本 R 1 R 2所对应特征 A的取值, m a x A m i n A分别为所有样本中所对应特征 A的最大值和最小值.已有研究表明,当 K = 10时,对大部分的分类任务最为可靠有效(Zhang et al., 2016).

在本文研究中,取最近邻样本数10,每次取50组数据,重复计算20次,得到特征指标权重和按权重从大到小排序情况如图2所示.特征权值越大表明特征越有利于分类,故应尽量选择较大阈值且特征数量不宜过少.由图2可知,特征X7、X5、X2和X1所对应权值较大,X3和X6的权重之和才与X2、X1的权重相当,最终确定特征选择阈值为0.03,故选择埋深 H、围岩洞壁最大切向应力 σ θ、岩石应力系数 σ θ / σ c和岩石弹性能指数Wet 作为预测模型的输入特征变量.

对于模型来说,若其输入特征变量之间存在较大相关性,其对模型的预测精度和稳定性会产生影响.为消除ReliefF算法的冗长性和探究前文所选取的4个特征之间是否具有较强相关性问题,利用Pearson相关系数求解特征之间的相关性,其计算公式为:

R X , Y = E X - X ¯ Y - Y ¯ i = 1 n ( X i - X ¯ ) 2 i = 1 n ( Y i - Y ¯ ) 2 ,

式中, R X , YXY间的Pearson相关系数,范围为 [ - 1,1 ]E为数学期望, X ¯是所有X的平均值, Y ¯是所有Y的平均值(张小内等, 2021).求得4个特征指标之间的相关性矩阵见表3,由此可知,其中最大值为 σ θWet 的相关系数为0.37,其他均小于0.3,说明特征指标之间呈现弱相关性或极弱相关性,不需要进行二次剔除,即特征指标选择合理.

1.2 特征指标分级

1.2.1 埋深

埋深在一定程度上反映了地应力中自重应力的大小,埋深大表示上覆岩体自重应力大.工程扰动导致的应力重分布是应变型岩爆发生的主要外因,应力重分布是否会达到危险程度是根据地应力场的具体情形而定的,故本文选择埋深作为特征指标是合理的.从本文86组案例数据中埋深与岩爆等级的散点图图3可知(岩爆烈度的4个等级对应图中1、2、3、4),岩爆等级和埋深无明显规律关系,但81.4%的岩爆发生在埋深超过200 m的区段,亦有埋深超过1 000 m也没有发生岩爆的情况.张乐文等(2010)在进行岩爆预测时使用了埋深这一指标,将其分为<50、50~200、200~700、>700,分别对应岩爆烈度4个等级(表1),利用埋深判据时岩爆预测准确度为19.77%.

1.2.2 围岩洞壁最大切向应力

围岩洞壁最大切向应力反映了岩爆区段地应力中构造应力的特征,一般围岩洞壁最大切应力越高,发生岩爆的危险性等级和风险性越高,图4统计了岩爆等级与围岩洞壁最大切向应力的关系,76.74%的岩爆区段发生在应力值超过24 MPa的围岩中,多处于高地应力环境.随着最大切向应力的增大,岩爆等级逐渐向高等级靠拢,呈现明显台阶状.目前还未见单独将最大切应力单独作为判据分类,由表1可知,张乐文等(2010)将岩石应力系数划分为 <0.3、0.3~0.5、0.5~0.7、>0.7,岩石单轴抗压强度划分为<80、80~120、120~180、>180,而岩石应力系数为围岩洞壁最大切向应力与岩石单轴抗压强度之比,故可求得最大切向应力划分为<24、24~60、60~126、>126,分别对应岩爆烈度4个等级,此判据岩爆预测准确率为44.19%.

1.2.3 岩石应力系数

岩石应力系数为围岩洞壁最大切向应力与岩石单轴抗压强度之比,综合考虑了围岩最大切向应力与岩体单轴抗压强度的影响.由表1可知,此判据存在两种划分方式 ,岩爆烈度4个等级对应范围分别为 <0.3、0.3~0.5、0.5~0.7、>0.7(张乐文等, 2010)和<0.20、0.20~0.30、0.30~0.55、>0.55(周航等, 2022).采用<0.20、0.20~0.30、0.30~0.55、>0.55划分方式时预测准确度为36%,图5为岩爆等级与岩石应力系数的关系,由图5可以看出其将部分实际等级为轻微的岩爆划分为中等岩爆,实际等级为中等岩爆划分为强烈岩爆,从而高估岩爆等级,这种划分方式对于岩爆等级是偏于保守的预测,会在一定程度上使其安全性得到保障,但若存在较多的高估情况,会造成资源浪费(李明亮等, 2021).当采用<0.3、0.3~0.5、0.5~0.7、>0.7作为岩石应力系数判据时,岩爆预测准确度为52%,故本文选择此划分方式作为岩石应力系数单判据.

1.2.4 岩石弹性能指数

岩石弹性能指数反映岩石储存和释放弹性能的能力,能量理论认为如果岩体‒围岩系统的力学平衡体系被破坏且其所释放的能量大于消耗的能量就会发生岩爆(温韬等, 2021).表1中给出了两种能量判据,岩爆烈度4个等级所对应的岩石弹性能指数为 <2、2~3.5、3.5~5、>5(张乐文等, 2010)和<2、2~4、4~6、>6(周科平等, 2013),分别计算其预测准确度为57%和55%,选取准确度较高的<2、2~3.5、3.5~5、>5作为本文的能量判据.图6给出了岩爆等级与岩石弹性能指数的关系,Wet 越大,岩爆等级向高等级靠拢,由图6可以明显看出轻微岩爆岩石弹性能指数多聚集在1.8~3.2范围内,中等岩爆岩石弹性能指数聚集在3.5~5.2内,强烈岩爆的岩石弹性能指数多高于5.当采用能量判据时岩爆预测准确度达57%,是4个单指标判据中准确度最高的.

1.3 数据集构建

本文岩爆案例数据均来自于已发表论文,针对于上述86组岩爆案例,选取所对应的埋深H、围岩洞壁最大切向应力 σ θ、岩石应力系数 σ θ / σ c和岩石弹性能指数Wet 作为输入特征变量,实际等级为输出变量,综上分析每一烈度等级所对应的指标分级标准如表4所示.获得的案例数据利用箱形图去除异常值(Zhou et al., 2016),如图7所示,共有5组数据异常,去除后剩余81组数据构成本文岩爆数据集,其中岩爆烈度等级为无岩爆(I级,14组)、轻微岩爆(II级,24组)、中等岩爆(III级,33组)和强烈岩爆(IV级,10组),按照样本的80%作为训练集,20%作为测试集,且各等级的样本也按照4:1划分,最终得到训练集包含65组数据(无岩爆14组、轻微岩爆19组、中等岩爆27组、强烈岩爆8组),测试集包含16组数据(无岩爆3组、轻微岩爆5组、中等岩爆6组、强烈岩爆2组).

2 岩爆烈度等级预测模型

2.1 弱分类器(SSA-SVM)构建

SVM分类模型是将样本空间映射到高维空间,然后在高维特征空间构造最优决策函数,间接实现对样本的分类(孔令刚等, 2020),其惩罚因子参数c和核函数参数g的取值会直接影响分类准确率.本文通过新型元启发式算法SSA对SVM的参数进行优化,可以加快c、g参数的寻优速度,缩短模型建立的时间,提高模型的准确率(吕鑫等, 2021).SSA中麻雀觅食过程可抽象为发现者-跟随者模型,并加入侦察预警机制.发现者本身适应度高,搜索范围广,引导种群搜索和觅食.跟随者为获得更好的适应度,跟随发现者进行觅食.同时,跟随者为提高自身捕食率,部分跟随者会监视发现者以便于进行食物争夺或在其周围进行觅食.而当整个种群面临捕食者的威胁或者意识到危险时,会立即进行反捕食行为(黄敬宇, 2021).发现者、跟随者和警戒者更新位置的数学模型依次如下:

X i , j t + 1 = X i , j t e x p - i α i t e r m a x , R 2 < S T , X i , j t + 1 + Q L , R 2 S T ,

式中,t表示迭代次数,j=1,2,…, d; itermax表示最大的迭代次数;Xi,j 表示第i个麻雀在第j维中的位置信息; α ( 0,1 ]是一个随机数; R 2 [ 0,1 ]表示预警值; S T [ 0.5,1 ]表示安全值;Q是服从正态分布的随机数;L表示一个一行多维的全一矩阵.

X i , j t + 1 = Q e x p X w o r s t t - X i , j t i 2 , i > n / 2 , X b t + 1 + X i , j t - X b t + 1 A + L , o t h e r w i s e ,

式中, X b t + 1表示当前发现者在t+1次迭代占有的最优位置; X w o r s t t表示第t次迭代全局最差的位置;A表示一个一行多维矩阵,且每个元素随机赋值为1或-1,且 A + = A T ( A A T ) - 1.

X i , j t + 1 = X b e s t t + β X i , j t - X b e s t t , f i > f g , X i , j t + K X i , j t - X w o r s t t f i - f w + ε , f i = f g ,

式中,X best表示全局当前最优的位置; β是步长控制参数,服从均值是0方差为1的正态分布的随机数;K是一个范围在[-1,1]的随机数;fi 代表当前麻雀的适应度值;fg 是当前全局最优的适应度值;fw 表示当前全局最差的适应度值; ε是一个避免分母为0的极小常数.

2.2 强分类器(SSA-SVM-AdaBoost)集成

假设训练数据集 T = { ( x i , y i ) , , ( x m , y m ) } x i X为特征矩阵, y i { 1,2 , , N }为对应的类别标签.首先需要初始化训练数据的权值分布,每个训练样本最开始时都被赋予相同权值: w i = 1 / m;然后开始迭代,依次遍历弱分类器,选取当前误差率最低的弱分类器h作为第t个基本分类器 h t并计算其误差et 为:

             e t = i = 1 m w t ( i ) I ( h t ( x ) y i ),

结合多分类指数损失函数的主见叠加建模(SAMME)(Zhu et al., 2009)算法构造强分类器 ,并对AdaBoost算法的权值分配策略进行改进,计算的权值分配系数ht

             α t = 1 2 l n 1 - e t e t + l n ( K - t + 1 ),

式中, K为弱分类器个数,更新训练数据的权值分布

             w t + 1 ( i ) = W t ( i ) Z t e x p ( - α t y i h t ( x i ) ),
             Z t = i = 1 m w t ( i ) e x p ( - α t y i h t ( x i ) ),

式中, Zt 为归一化因子.第K个弱分类器分类结束后,训练得到的所有弱分类器组成最终的强分类器 G ( x ),输出所属类别的决策值:

             G ( x ) = s i g n ( i = 1 K α t h t ( x i ) ),

AdaBoost在循环中反复调用弱分类器,根据训练样本的预测结果,更新每个周期后的分布 w t,使得正确分类的样本权重较低,而错误分类样本权重较高,不断改善分类精度.最后,所有的弱分类器线性组合成一个最终强分类器(纪雪等, 2021).

2.3 基于SSA-SVM-AdaBoost的岩爆等级预测模型

SSA-SVM-AdaBoost算法通过构造SSA优化后的SVM分类器作为弱分类器,综合训练样本集的分类结果及准确率,重新给每个训练样本分配权值,不断提高被弱分类器分类错误的样本权值,降低分类正确的样本权值,通过不断迭代进而改善分类精度(Schapire and Singer, 2000).首先通过ReliefF-Pearson算法确定优势特征指标,利用箱线图去除异常值并将优势特征指标和实际等级组合为数据集,划分训练集和预测集后,建立以基于麻雀搜索优化支持向量机算法为弱分类器的AdaBoost强分类器算法的预测模型,输出预测值并与实际情况进行对比,评估模型性能.基于SSA-SVM-AdaBoost的岩爆等级预测模型流程如图8所示,具体建模步骤如下:

(1)将预处理后的岩爆案例工程数据按照样本的80%作为训练集,20%作为测试集.对输入的训练数据和测试数据进行归一化处理,消除数据之间量纲差异.输出部分由“1”、“2”、“3”、“4”表示岩爆烈度的4个等级(无岩爆I级、轻微岩爆II级、中等岩爆III级和强烈岩爆IV级).

(2)初始化麻雀种群,给定种群的初始数量、麻雀群体成员在解空间中的初始位置、种群中发现者和跟随者的比例、预警值、安全值、随机值等参数;

(3)为提高模型的预测准确率,以测试集的预测准确率作为适应度函数,计算每只麻雀的适应度值,确定解空间中适应度值最优和最差的麻雀个体的位置.

(4)更新麻雀种群中发现者、跟随者和警戒者的位置,计算每只麻雀的适应度值,确定解空间中适应度值最优的位置信息.

(5)如果达到算法的最大迭代次数,则输出全局适应度值最优参数c、g;否则继续转到(4)执行.

(6)给定样本初始权重,wi =1/m将训练集按照4∶1的比例划分为训练子集和测试子集,将得到的最优参数c、g带入SVM模型中对训练子集进行训练,得到SSA-SVM弱分类器,并用训练好的 SSA-SVM弱分类器对测试子集进行预测,计算样本误差率,进而计算弱分类器的权值分配系数,根据误差率和权值分配系数更新样本的权重值.

(7)根据当前权重值,重新划分训练子集和测试子集,循环此步骤,直到训练的SSA-SVM弱分类器个数达到设定值K,最后将K个SSA-SVM弱分类器线性组合,构成最终的强分类器.

(8)对测试集进行分类预测,得出预测结果并计算预测精度.

3 模型预测与分析

3.1 建模分析

本文机器学习算法均在MATLAB R2019a平台上实现.调用LIBSVM工具箱实现SSA-SVM,采用支持向量回归中常用的高斯径向基核函数,适应度函数设为测试集的准确率,通过SSA算法寻找最优参数cg的组合.SSA优化算法中,麻雀种群大小为30,最大迭代次数为100,采用5折交叉验证,发现者比例为70%,意识到有危险麻雀比例为20%,安全阈值为0.6.通常参数cg的取值范围比较广,故cg值边界范围分别设置为[0.1,100]、[0.001,1 000],最后得到参数cg的最优组合为(1.458,39.758),将最优参数带入SVM中构成 SSA-SVM弱分类器.如果弱分类器个数设置过多会使运算时间过长,设置过少会使分类精度不够,经过多次尝试,将弱分类器个数设置为3,每次循环过弱分类器后重新更新权重值,最后构成一个强分类器,将测试集样本带入训练好的模型,计算预测准确率.

为验证SSA-SVM-AdaBoost模型在岩爆等级预测中的有效性和优势性,将训练数据分别输入,对SVM、SSA-SVM和基于单层决策树的AdaBoost分类模型进行训练学习,进而构建4个岩爆预测模型,然后用测试集数据进行测试,并采用准确率对预测模型进行性能评估,可得到模型各等级预测准确率见图9,模型各等级预测情况及总体准确率见表5.

图9可知,单个模型如SVM、SSA-SVM均存在对某一类或两类预测效果不佳的问题.从表5可以看出,预测准确率最高的为SSA-SVM-AdaBoost,达到87.5%,其次为SSA-SVM和单层决策树AdaBoost,准确率均为75%.SSA对SVM的参数优化使得SVM总体预测准确率提高18.75%;基于多SSA-SVM的AdaBoost模型预测准确率相较于SSA-SVM和单层决策树AdaBoost模型均提高12.5%,相较于SVM提高31.25%,这充分说明了SSA-SVM作为弱分类器在分类性能上要优于单层决策树,AdaBoost增强算法集成多个单分类器要优于单个分类模型.SSA-SVM-AdaBoost模型在单类预测中也表现出明显的优势,对于烈度等级为1、3、4的岩爆均可准确识别,烈度等级为2的岩爆可能会出现错误,其原因可能是数据样本较少且等级为2和3的不同特征指标值存在复杂的互相交错情况.

3.2 随机过采样的影响

不同等级数据样本数量不同导致数据存在不均衡性.为消除数据不平衡性,采用随机过采样方法对样本较少的等级数据进行补充.原始训练集样本中包括11组I级、19组II级、27组III级和8组IV级,故保持其中等级为3的训练集样本数量27不变,将其他3个等级样本通过随机过采样增加至27个训练集样本,此时训练集为108组数据.将随机过采样后的训练集输入SVM、SSA-SVM、基于单层决策树的AdaBoost和SSA-SVM-AdaBoost分类模型中构建预测模型,利用测试集测试模型性能并与原始数据集训练的模型进行对比.其计算结果如表6所示.

表6可知,数据随机过采样处理会不同程度地增加SVM、SSA-SVM的预测准确率,其中SVM模型预测准确率提高12.5%,为68.75%,虽有提高但仍然不能满足岩爆预测准确率的要求;SSA-SVM模型的预测准确率模型预测准确率提高6.25%,为81.25%;对于基于单层决策树的AdaBoost模型和SSA-SVM-AdaBoost模型,随机过采样处理数据后预测准确率未发生变化,故数据随机过采样处理对SSA-SVM模型的影响最大,对集成模型的影响较小,表明SSA-SVM-AdaBoost模型可以较好地应用于数据不均衡情况.

3.3 模型适用性验证

为验证模型的适用性,选用周航等(2022)论文中桑珠岭隧道发生岩爆的18个样本点,其中10个样本点加入训练集中,用SSA-SVM-AdaBoost模型预测剩余8个样本点岩爆等级,详细数据和预测结果如表7所示.

SSA-SVM-AdaBoost模型正确预测了7个样本等级,低估了DK189+430~DK189+450处岩爆等级,其实际等级为III,预测等级为II.对比两个样本点特征指标数据,若按照单判据判断则4个单判据判定等级均为III( H)、II( σ θ)、I( σ θ / σ c)、III(Wet ),其中样本6的 H σ θ σ θ / σ c均较样本5小,Wet 值相等,但其实际预测等级为III比样本5大,故猜测样本6的特征指标值可能有误,从而导致预测结果不准确.周航等(2022)论文中利用组合赋权和未知测度的评价方法也低估了样本6的岩爆等级,并指出原因为前期地质勘察阶段的岩石参数选取有误或存在地质构造异常带,与上述分析一致.由于机器学习是学习已有岩爆案例数据并对未知岩爆等级进行预测,其预测准确率依靠于所取特征指标值,若特征指标值错误,则大概率会导致预测结果错误,故应尽量确保特征指标值的正确性.由此可知,通过SSA优化SVM的弱分类器组合成AdaBoost强分类器算法的岩爆等级预测模型具有较高的适用性和可行性.

4 结论

(1)根据前人研究成果和案例统计,利用ReliefF算法和Pearson 相关系数确定优势特征指标,选择埋深H、位移洞壁最大切向应力 σ θ、岩石应力系数 σ θ / σ c和岩石弹性能指数Wet 作为预测模型的输入特征变量,确定每一烈度等级所对应的特征指标分级标准,利用埋深单判据时准确度为19.77%,利用最大切向应力单判据时准确率为44.19%,利用岩石应力系数判据时准确度为52%,利用能量判据时准确度达57%,能量单判据的准确度最高.

(2)利用SSA算法自适应全局优化搜索能力与SVM有机结合,通过发现者、跟随者和警戒者的不断更新迭代计算得到SVM模型最优参数惩罚因子c和核函数参数g,极大地提高了SVM模型的预测准确率.

(3)SSA-SVM-AdaBoost算法通过多个SSA-SVM弱分类器组合成AdaBoost强分类器,建立基于SSA-SVM-AdaBoost算法的岩爆等级预测模型,其准确率为87.5%,相较于其他3种模型,预测效果良好,且数据随机过采样处理对SSA-SVM-AdaBoost模型的预测结果无明显影响.结果表明,基于SSA-SVM弱分类器的AdaBoost增强学习算法可以集成多个SSA-SVM分类器的优势,分类效果由于单一分类器和传统的AdaBoost模型.

(4)将SSA-SVM-AdaBoost模型应用于桑珠岭隧道岩爆样本中,正确预测了7个样本,表明在确保输入特征指标值的正确前提下通过SSA优化SVM的弱分类器组合成AdaBoost强分类器算法的岩爆等级预测模型具有较高的适用性和可行性.

参考文献

[1]

Afraei, S., Shahriar, K., Madani, S.H., 2019. Developing Intelligent Classification Models for Rock Burst Prediction after Recognizing Significant Predictor Variables, Section 1: Literature Review and Data Preprocessing Procedure. Tunnelling and Underground Space Technology, 83: 324-353. https://doi.org/10.1016/j.tust.2018.09.022

[2]

Dong, L.J., Li,X.B., Peng, K., 2013. Prediction of Rockburst Classification Using Random Forest. Transactions of Nonferrous Metals Society of China, 23(2): 472-477.

[3]

Freund,Y.,Schapire,R.E.,1997.A Decision-Theoretic Generalization of On-Line Learning and an Application to Boosting. Journal of Computer and System Sciences, 55(1): 119-139. https://doi.org/10.1006/jcss.1997.1504

[4]

Gao, L., Liu, Z. K., Zhang, H. Y., 2021. Prediction of Rockburst Classification of Railway Tunnel Based on Hybrid PSO-RBF Neural Network. Journal of Railway Science and Engineering, 18(2): 450-458 (in Chinese with English abstract).

[5]

Huang, J.Y., 2021. Research on Sparrow Search Algorithm Combining t Distribution and Tent Chaotic Mapping (Dissertation). Lanzhou University, Lanzhou (in Chinese with English abstract).

[6]

Ji, X., Tang, Q.h., Chen, Y.l., et al., 2021. Multibeam Acoustic Seabed Classification Combining SVM and Adaptive Boosting Algorithm. Acta Geodaetica et Cartographica Sinica, 50(7): 972-981 (in Chinese with English abstract).

[7]

Jia,Y.Q.,2018. Study on the Tendency Prediction and Control Techniques of Rock Burst in Laobi Mountain Tunnel of Chengdu to Kunming Railway (Dissertation). Xi’an University of Architecture and Technology, Xi’an, 44-45 (in Chinese with English abstract).

[8]

Kong, L.G., Jiao, X.M., Chen, G.W., et al., 2020. Turnout Fault Diagnosis Based on Mallat Wavelet Decomposition and Improved GWO-SVM. Journal of Railway Science and Engineering, 17(5): 1070-1079 (in Chinese with English abstract).

[9]

Li, M. L., Li, K. G., Qin, Q. C., et al., 2021. Discussion and Selection of Machine Learning Algorithm Model for Rockburst Intensity Grade Prediction. Chinese Journal of Rock Mechanics and Engineering, 40(S01): 2806-2816 (in Chinese with English abstract).

[10]

Lyu, X., Mu, X. D., Zhang, J., et al., 2021. Chaos Sparrow Search Optimization Algorithm. Journal of Beijing University of Aeronautics and Astronautics, 47(8): 1712-1720 (in Chinese with English abstract).

[11]

Ortlepp,W.D.,2001.The Behaviour of Tunnels at Great Depth under Large Static and Dynamic Pressures. Tunnelling and Underground Space Technology, 16 (1): 41-48. https://doi.org/10.1016/s0886-7798(01)00029-3

[12]

Pu, Y.Y., Apel, D.B., Liu,V., et al., 2019.Machine Learning Methods for Rockburst Prediction State of the Art Review. International Journal of Mining Science and Technology, 29(4): 565-570.

[13]

Robnik-šikonja, M., Kononenko, I., 2003.Theoretical and Empirical Analysis of ReliefF and RReliefF. Machine Learning, 53(1/2):23-69. https://doi.org/10.1023/A:1025667309714

[14]

Schapire, R. E., Singer, Y., 2000. BoosTexter: A Boosting-Based System for Text Categorization. Machine Learning, 39(2-3): 135-168. https://doi.org/10.1023/A:1007649029923

[15]

Tang, Z.L., Wang, X., Xu, Q.J., 2021. Rock Burst Prediction Based on Oversampling and Objective Weighting Method. Journal of Tsinghua University (Science and Technology), 61(6): 543-555 (in Chinese with English abstract).

[16]

Tang, Z. L., Xu, Q. J., 2020. Rockburst Prediction Based on Nine Machine Learning Algorithms. Chinese Journal of Rock Mechanics and Engineering, 39(4): 773-781 (in Chinese with English abstract).

[17]

Wang, C. H., Gao, G. Y., Yang, S. X., et al., 2019. Analysis and Prediction of Stress Fields of Sichuan-Tibet Railway Area Based on Contemporary Tectonic Stress Field Zoning in Western China. Chinese Journal of Rock Mechanics and Engineering, 38(11): 2242-2253 (in Chinese with English abstract).

[18]

Wang, Y., Xu, Q., Chai, H.J., et al., 2013. Rock Burst Prediction in Deep Shaft Based on RBF-AR Model. Journal of Jilin University (Earth Science Edition), 43(6): 1943-1949, 1965 (in Chinese with English abstract).

[19]

Wen, T., Zhang, X., Sun, J. S., et al., 2021. Brittle Evaluation Based on Energy Evolution at Pre-Peak and Post-Peak Stage. Earth Science, 46(9): 3385-3396 (in Chinese with English abstract).

[20]

Wu, S. C., Zhang, C. X., Cheng, Z. Q., 2019. Prediction of Intensity Classification of Rockburst Based on PCA-PNN Principle. Journal of China Coal Society, 44(9): 2767-2776 (in Chinese with English abstract).

[21]

Xue, J. K., Shen, B., 2020. A Novel Swarm Intelligence Optimization Approach: Sparrow Search Algorithm. Systems Science & Control Engineering, 8(1): 22-34. https://doi.org/10.1080/21642583.2019.1708830

[22]

Yan, X. H., Guo, C. B., Liu, Z. B., et al., 2022. Physical Simulation Experiment of Granite Rockburst in a Deep-Buried Tunnel in Kangding County, Sichuan Province, China. Earth Science, 47(6): 2081-2093 (in Chinese with English abstract).

[23]

Yang, X. B., Pei, Y. Y., Cheng, H. M., et al., 2021. Prediction Method of Rockburst Intensity Grade Based on SOFM Neural Network Model. Chinese Journal of Rock Mechanics and Engineering, 40(S01): 2708-2715 (in Chinese with English abstract).

[24]

Zhang, J. H., Chen, M., Zhao, S. K., et al., 2016. ReliefF-Based EEG Sensor Selection Methods for Emotion Recognition. Sensors (Basel, Switzerland), 16(10): 1558. https://doi.org/10.3390/s16101558

[25]

Zhang, L.W.,Zhang,D.Y.,Qiu,D.H.,2010.Application of Extension Evaluation Method in Rockburst Prediction Based on Rough Set Theory. Journal of China Coal Society, 35(9): 1461-1465 (in Chinese with English abstract).

[26]

Zhang, X. N., Zhai, W. P., Hou, H. R., et al., 2021. ReliefF-Pearson Based Olfactory ElectroEncephaloGram Channel Selection. Journal of Electronics & Information Technology, 43(7): 2032-2037 (in Chinese with English abstract).

[27]

Zhou, H., Liao, X., Chen, S. K., et al., 2022. Rockburst Risk Assessment of Deep Lying Tunnels Based on Combination Weight and Unascertained Measure Theory: A Case Study of Sangzhuling Tunnel on Sichuan-Tibet Traffic Corridor. Earth Science, 46(6): 2130-2148 (in Chinese with English abstract).

[28]

Zhou, J., Li, X.B., Shi, X.Z., 2012.Long-Term Prediction Model of Rock Burst in Underground Openings Using Heuristic Algorithms and Support Vector Machines. Safety Science, 50(4): 629-644. https://doi.org/10.1016/j.ssci.2011.08.065

[29]

Zhou, K. P., Lei,T., Hu, J.H., 2013. RS-TOPSIS Model of Rockburst Prediction in Deep Metal Mines and Its Application. Chinese Journal of Rock Mechanics and Engineering, 32(S2): 3705-3711 (in Chinese with English abstract).

[30]

Zhou, K. P., Lin, Y., Deng, H.W., et al., 2016. Prediction of Rock Burst Classification Using Cloud Model with Entropy Weight. Transactions of Nonferrous Metals Society of China, 26(7): 1995-2002. https://doi.org/10.1016/S1003-6326(16)64313-3

[31]

Zhu, J., Zou, H., Rosset, S., et al., 2009. Multi-Class AdaBoost. Statistics and Its Interface, 2: 349-360.

[32]

高磊, 刘振奎, 张昊宇, 2021. 基于混合PSO-RBF神经网络的铁路隧道岩爆分级预测. 铁道科学与工程学报, 18(2): 450-458.

[33]

黄敬宇, 2021. 融合t分布和Tent混沌映射的麻雀搜索算法研究(硕士学位论文). 兰州: 兰州大学.

[34]

纪雪, 唐秋华, 陈义兰, 等, 2021. 联合支持向量机和增强学习算法的多波束声学底质分类. 测绘学报, 50(7): 972-981.

[35]

贾月卿, 2018.改建铁路成昆线老鼻山隧道岩爆倾向性预测分析与防治技术研究(硕士学位论文).西安: 西安建筑科技大学, 44-45.

[36]

孔令刚, 焦相萌, 陈光武, 等, 2020. 基于Mallat小波分解与改进GWO-SVM的道岔故障诊断. 铁道科学与工程学报, 17(5): 1070-1079.

[37]

李明亮, 李克钢, 秦庆词, 等, 2021. 岩爆烈度等级预测的机器学习算法模型探讨及选择. 岩石力学与工程学报, 40(S01): 2806-2816.

[38]

吕鑫, 慕晓冬, 张钧, 等, 2021. 混沌麻雀搜索优化算法. 北京航空航天大学学报, 47(8): 1712-1720.

[39]

汤志立, 王雪, 徐千军, 2021. 基于过采样和客观赋权法的岩爆预测. 清华大学学报(自然科学版), 61(6): 543-555.

[40]

汤志立, 徐千军, 2020. 基于9种机器学习算法的岩爆预测研究. 岩石力学与工程学报, 39(4): 773-781.

[41]

王成虎, 高桂云, 杨树新, 等, 2019. 基于中国西部构造应力分区的川藏铁路沿线地应力的状态分析与预估. 岩石力学与工程学报, 38(11): 2242-2253.

[42]

王羽, 许强, 柴贺军, 等, 2013. 工程岩爆灾害判别的RBF-AR耦合模型. 吉林大学学报(地球科学版), 43(6): 1943-1949, 1965.

[43]

温韬, 张馨, 孙金山, 等, 2021. 基于峰前和峰后能量演化特征的岩石脆性评价. 地球科学, 46(9): 3385-3396.

[44]

吴顺川, 张晨曦, 成子桥, 2019. 基于PCA-PNN原理的岩爆烈度分级预测方法. 煤炭学报, 44(9): 2767-2776.

[45]

严孝海, 郭长宝, 刘造保, 等, 2022. 四川康定某深埋隧道花岗岩岩爆物理模拟实验研究. 地球科学, 47(6): 2081-2093.

[46]

杨小彬, 裴艳宇, 程虹铭, 等, 2021. 基于SOFM神经网络模型的岩爆烈度等级预测方法. 岩石力学与工程学报, 40(S01): 2708-2715.

[47]

张乐文, 张德永, 邱道宏, 2010. 基于粗糙集的可拓评判在岩爆预测中的应用. 煤炭学报, 35(9): 1461-1465.

[48]

张小内, 翟文鹏, 侯惠让, 等, 2021. 基于ReliefF-Pearson的嗅觉脑电通道选择. 电子与信息学报, 43(7): 2032-2037.

[49]

周航, 廖昕, 陈仕阔, 等, 2022. 基于组合赋权和未确知测度的深埋隧道岩爆危险性评价: 以川藏交通廊道桑珠岭隧道为例. 地球科学, 46(6): 2130-2148.

[50]

周科平, 雷涛, 胡建华, 2013. 深部金属矿山RS-TOPSIS岩爆预测模型及其应用. 岩石力学与工程学报, 32(S2): 3705-3711.

基金资助

国家自然科学基金资助项目(42172291)

AI Summary AI Mindmap
PDF (1531KB)

144

访问

0

被引

详细

导航
相关文章

AI思维导图

/