基于参数相关性分析和机器学习算法的高强混凝土徐变预测

梅生启 ,  刘晓东 ,  王兴举 ,  李旭峰 ,  武腾 ,  程相旭

吉林大学学报(工学版) ›› 2025, Vol. 55 ›› Issue (05) : 1595 -1603.

PDF (3255KB)
吉林大学学报(工学版) ›› 2025, Vol. 55 ›› Issue (05) : 1595 -1603. DOI: 10.13229/j.cnki.jdxbgxb.20230814
交通运输工程·土木工程

基于参数相关性分析和机器学习算法的高强混凝土徐变预测

作者信息 +

Prediction of high strength concrete creep based on parametric MIC analysis and machine learning algorithm

Author information +
文章历史 +
PDF (3332K)

摘要

针对预测混凝土徐变的机器学习模型已有较多研究,但区分混凝土强度的研究较少的问题,基于NU-ITI数据库,采用3种机器学习模型,即反向传播人工神经网络、支持向量回归和极端梯度提升(XGBoost)建立了混凝土徐变的预测模型。结果表明,XGBoost能很好地预测混凝土的徐变(R2=0.972 9)。通过对高强混凝土参数的相关性分析,筛选出相关系数最高和最低的参数组。基于参数筛选后的XGBoost模型重新对高强混凝土徐变进行计算,发现筛除弱相关参数会显著降低计算结果的鲁棒性。本文研究表明,高强混凝土徐变影响参数之间存在不同程度的相关性,筛除强相关参数对模型计算准确性影响较小,而筛除弱相关参数影响较大。研究成果可为高强混凝土徐变的建模提供参考。

Abstract

Although machine learning models for predicting concrete creep have been numerous studied, but only a few studies have distinguished concrete strength. Firstly, based on NU-ITI database, three machine learning models BPANN, SVR and XGBoost are used to build a prediction model for concrete creep. The results indicate that XGBoost can effectively predict the creep of concrete (R2=0.972 9). Secondly, through the analysis of correlations among parameters of high strength concrete, the parameter groups with the highest and lowest correlation coefficients were identified. Based on the parameter selection, the XGBoost models was recalculated for high strength concrete creep, revealing that excluding weakly correlated parameters significantly reduces the robustness of the computational results. This study demonstrates that there are varying degrees of correlation among parameters affecting the creep of high strength concrete. The exclusion of strongly correlated parameters has a minor impact on the accuracy of the model calculations, while the exclusion of weakly correlated parameters has a more significant effect. The research findings can serve as a reference for modeling the creep of high strength concrete.

Graphical abstract

关键词

结构工程 / 高强混凝土徐变 / 机器学习模型 / 最大信息相关系数 / 鲁棒性

Key words

structural engineering / high strength concrete creep / machine learning model / maximum information coefficient, robustness

引用本文

引用格式 ▾
梅生启,刘晓东,王兴举,李旭峰,武腾,程相旭. 基于参数相关性分析和机器学习算法的高强混凝土徐变预测[J]. 吉林大学学报(工学版), 2025, 55(05): 1595-1603 DOI:10.13229/j.cnki.jdxbgxb.20230814

登录浏览全文

4963

注册一个新账户 忘记密码

0 引 言

混凝土徐变会引发基础设施长期变形过大甚至开裂,进而影响工程的耐久性和持续性1。随着高强混凝土(High strength concrete,HSC)的快速发展与应用,研究人员对HSC的徐变行为开展了大量研究和探讨23。研究表明,与普通强度混凝土(Normal strength concrete, NSC)相比,HSC凝结硬化后孔隙率较低,且骨料-水泥浆体界面结构不同4,导致其徐变行为发生改变。

对于混凝土徐变的预测,国内外研究人员通过大量研究,建立了若干混凝土徐变预测模型,如美国混凝土学会提出的ACI209模型5,国际结构混凝土协会(fib)提出的MC2010模型6,Gardner等7提出的GL2000模型,Bazant等8提出的B3模型以及提出的B4模型9。然而,上述模型对HSC徐变预测效果有待验证。

目前,已有各种机器学习模型用于预测混凝土的强度和徐变。Peng等10采用人工神经网络(Artificial neural network, ANN)、支持向量回归(Support vector regression, SVR)、基于粒子群优化的SVR模型(PSO-SVR)和基于灰狼优化的SVR模型(GWO-SVR)对再生骨料混凝土(Recycled aggregate concrete, RAC)的抗压强度进行预测;Yang等11利用ANN对海水海砂珊瑚骨料混凝土的短期徐变进行了预测;Pham等12使用萤火虫模型优化SVR的超参数预测HPC抗压强度;Liang等13利用贝叶斯优化和交叉验证优化了随机森林(Random forest, RF)、极端梯度提升(extreme gradient boasting, XGBoost)和轻量级梯度增强机(Light gradient boosting machine, LGBM)3个模型,并将其用于预测混凝土徐变;曲广雷等14基于神经网络和回归分析分别建立了28 d抗压强度和透水系数两项指标的预测模型,结果表明经遗传算法优化的神经网络抗压强度预测模型的精度高于统计回归模型。也有研究人员通过机器学习研究了输入变量的影响。Xu等15应用灰色系统理论(Grey system theory, GST)检验RAC的参数敏感性。研究结果表明,通过GST使用确定的RAC混合物的关键参数,多元非线性回归(Multiple nonlinear regression, MNR)和ANN可以更准确地预测RAC的力学性能。

以上研究表明,ANN和SVR模型没有提供各参数的相对重要性信息16,导致关于输入和输出变量间关系以及输入变量对模型预测性能影响的研究仍然不足。因此,有必要比较不同机器学习模型在混凝土徐变预测中的准确性,同时研究输入与输出变量的关系,明确输入变量对输出变量的影响。在数据量和数据维度增加的情况下,传统方法难以处理数据之间的相关性。Reshef等17提出了一种基于信息熵的最大信息相关系数(Maximal information coefficient, MIC)分析方法。Li等18通过对徐变参数的MIC计算,证明了混凝土强度与骨料水泥比、水灰比和水泥用量有很强的相关性,其中水灰比与混凝土徐变的相关性最强。

本文首先基于徐变数据库采用经典徐变模型进行计算,然后计算数据库中NSC和HSC之间徐变影响参数的MIC,基于3种机器学习模型对数据库中数据进行训练来预测混凝土徐变,最后基于参数筛选后的XBoost模型对HSC徐变进行分析。

1 混凝土徐变对比分析

1.1 混凝土徐变数据库

RILEM Committee TC 107收集的NU-ITI数据库包含1 403组混凝土徐变数据和1 809组收缩试验数据19

根据数据库徐变数据信息完整程度和本文后续研究需求,在数据库中筛选6 966个HSC(fc≥60 MPa)和14 904个NSC(fc<60 MPa)徐变数据进行分析。图1为HSC和NSC徐变对比。

1.2 混凝土经典徐变模型的计算

目前混凝土徐变预测主要采用ACI209、MC2010、GL2000、B3、B4等模型,其中MC2010模型适用于20~130 MPa的强度范围,相比于B3(17~68 MPa)、B4(15~70 MPa)等模型的范围更广,因此选取MC2010对数据库中的数据进行计算。

MC2010模型5将混凝土在加载龄期为t0、应力级别为σct0时,加载至t时刻的徐变系数表示为名义徐变系数和依时发展系数的乘积,即:

φt,t0=φ0βct-t0

式中:φ0为名义徐变系数。

φ0=φRHβfcmβt0

式中:φRH为考虑环境相对湿度的函数;βfcm为考虑强度的函数;βt0为时间发展函数。

MC2010计算徐变结果如图2所示。

图2可以看出,基于MC2010模型的HSC徐变预测精度较低。既有徐变模型预测精度受模型参数数量影响,参数数量过多会增加模型计算的复杂性,而过少则会降低模型的适用性和准确性。现有徐变模型在建立时主要考虑计算精度,尚未考虑混凝土内部参数之间相关性的量化分析。因此,有必要基于机器学习和数据库对混凝土徐变参数的相关性进行分析。

2 混凝土徐变参数相关性分析

2.1 混凝土徐变的影响参数

混凝土徐变的影响参数可分为外部影响参数和内部影响参数。外部影响参数是指混凝土成型过程中的环境条件,包括养护时间、构件体表比、环境湿度、环境温度等。内部影响参数是指混凝土材料及物理性质等参数,包括水泥含量、粒径级配、堆积密度、水灰比、抗压强度、弹性模量等。表1列出了MC2010和B4模型需考虑的影响参数。

基于数据库中影响参数的完整程度和现有徐变研究成果,本文选取了7个内部影响参数和4个外部影响参数以确保覆盖影响混凝土徐变的主要影响参数18。内部影响参数有水灰比(w/c)、水泥含量(c)、骨料水泥比(a/c)、抗压强度(fc)、体表比(v/s)、应力(σ)、弹性模量(E),外部影响参数有加载龄期(t0)、环境温度(T)、环境相对湿度(RH)和持荷时间(Δt)。

2.2 最大信息相关性分析

MIC是Reshef等17提出的大数据探索性统计分析工具,能够有效挖掘大量信息中数据的相关性。MIC可以对变量之间的非线性关系进行检测,常用于数据分析和特征选择。它的原理是通过计算影响因素之间的信息熵来确定它们之间的相关性。信息熵的表达式为:

H(X)=-pxilogpxi(i=1,2,,n)

式中:X为随机变量;xi 为随机变量的值;pxixi 发生的概率。MIC值越大,说明参数对结果的影响越大20

分别计算数据库中HSC和NSC的MIC,图3是根据HSC和NSC的MIC比值由大到小排列的混凝土徐变基本影响参数相关系数。MIC主要反映参数对结果影响的程度,因此采用HSC和NSC的MIC比值反映二者之间影响程度的大小。

根据图3的结果可以发现,影响NSC徐变的主要参数包括σa/ccE,影响HSC徐变的主要参数则包括σa/ccE以及t0。这表明内部参数在混凝土徐变中起到了关键作用。通过对NSC和HSC的相关系数进行比较,发现二者的差异主要体现在t0v/sfc,这些参数同时包含了外部和内部参数的影响因素。

3 基于机器学习的HSC徐变预测

3.1 机器学习模型

反向传播人工神经网络(Back propagation artificial neural Network, PANN)具有良好的非线性映射、泛化和容错能力,其多层感知机结构在理论上能够逼近任意连续函数,通过信息前向传播和误差反向传播不断更新和优化每个神经元的权重。将得到的结果通过激活函数21转换为输出,从而建立基于真实非线性关系数据的模型。

本文采用全连接多层神经网络结构构建混凝土徐变模型,并对该模型进行训练,以用于徐变预测。图4展示了网络的拓扑结构,通常包括输入层、隐藏层和输出层。本研究中,输入层为水灰比、水泥含量等11个参数,输出层为徐变柔量。本文选择了具有3个隐藏层的网络架构,并初始设置隐藏层神经元的数量如下18:第一层[8,10,12],第二层[6,8,10],第三层[6,8,10],利用K折交叉验证确定最优交叉组合。本文使用的BPANN结构参数见表2

支持向量机(Support vector machine, SVM)是由Cortes等22提出的一种监督学习方法,可以分为支持向量分类机和SVR。

一般情况下,SVM通过内积函数定义的非线性变换将输入空间转化至高维空间,然后在该空间中确定广义最优分类曲面。输入空间中的线性不可分问题,通过适当的映射函数,可以转化为特征空间中的线性可分问题。SVM主要用于分类和回归,而SVR通常用于解决预测和回归相关问题。

本文采用网格搜索法选取惩罚参数(C)和核函数(γ),该方法的原理是通过尝试各种可能的(C,γ)值进行交叉验证,然后找出交叉验证精确度最高的(C,γ)值。本文采用机器学习库scikit-learn中的GridSearchCV23超参数搜索函数对SVR中的超参数组进行最优选取。选取的惩罚参数C为1、10、100、1 000,选取的核函数γ为0.01、0.1、1、10018图5为SVR原理图。

XGBoost是Chen等24开发的开源机器学习框架,高效地实现了梯度提升决策树(Gradient boosting decision tree, GBDT)模型并进行了模型和工程上的改进。XGBoost被认为是梯度提升的高级实现,它可以通过使用更正则化的模型来更有效地控制过拟合。XGBoost由多个分类回归树(Classification and regression tree, CART)集成,训练过程中的目标函数为:

OBJ(t)=i=1nLyi,y^it+Ωft

式中:L为损失函数;Ω为度量模型复杂度的正则化项;t为生成第t个CART的第t次迭代;n为CART的总数;fi 为第i个CART的映射函数。每个CART的模型复杂度可以表示为:

Ω(f)=γT+12λj=1Twj2

式中:T为节点的总数;w为每个节点的分数;γλ为用于正则化以避免过拟合的惩罚项。

本文采用均方误差为损失函数,选取的超参数有① n_estimators(生成树的数量)、②learning_rate(学习率)、③ max_depth(每个树的最大深度)、④ gamma(指定了节点分裂所需的最小损失函数下降值)、⑤ min_child_weight(节点权重的最小总和)、⑥ colsample_bytree(列采样比率)。

本文利用贝叶斯优化分析了XGBoost模型的超参数选取,但优化后的模型与使用默认参数训练的模型性能相差不大。为确保研究的可重复性,本文取XGBoost默认超参数的值,见表3

3.2 机器学习模型预测准确性的评价指标

为提升机器学习模型的泛化能力,按3:1的比例划分训练集和测试集18,分别对两种机器学习的模型进行训练和测试。在数据训练之前,通常要对数据进行归一化来加快模型收敛的速度,本文采用最大-最小归一化对数据进行预处理,并将结果映射到[0,1]。函数如下:

x'=x-min(x)max(x)-min(x)

通过均方根误差(Root mean squared error, RMSE)、平均绝对误差(MAE)和决定系数(R2)来评价模型的性能。表达式如下:

RMSE=1ni=1ny*-y2
MAE=1ni=1ny*-yi
R2=1-i=1nyi-yi*2i=1nyi-y¯2

式中:n为对应数据集的组数;yi为第i组实际徐变值;yi*为第i组预测徐变值;y¯n组对应徐变平均值。

目标函数值(OBJ)作为一个综合参数,也可用来评估模型的效率,其定义如下25

OBJ=ntrnall×RMSEtr+MAEtrRtr2+1+
ntsnall×RMSEtes+MAEtesRtes2+1

式中:下标tr和tes分别代表训练集和测试集;n为数据集中数据的数量。

3.3 机器学习模型预测结果对比

基于数据库中的数据,3种机器学习模型都能很好地预测混凝土的徐变。表4列出了不同机器学习模型的预测性能,R2越高,OBJ值越低,则表示训练结果越好。3种机器学习模型测试集和训练集的预测结果如图6所示。

通过表4图6可以看出,相比于传统徐变预测模型,基于机器学习的混凝土徐变预测模型具有良好的预测能力,BPANN、SVR和XGBoost的相关系数分别为0.796、0.744和0.972 9,不同模型训练集和测试集上的相关系数比较接近,这表明在机器学习训练的过程中并没有出现过拟合或者欠拟合。BPANN和SVR的OBJ分别为24.41和32.9,而XGBoost的OBJ仅有5.8。无论是决定系数还是OBJ的结果,XGBoost的效果都好于BPANN和SVR,这表明XGBoost模型的性能远优于BPANN和SVR。

4 考虑参数筛选的HSC徐变预测

为了研究输入变量对HSC徐变预测结果的影响,本文基于徐变数据库,进一步计算了任意两个影响参数之间的MIC。图7呈现了MIC计算的结果。MIC越大,说明参数之间的耦合程度越高。例如,抗压强度和弹性模量之间的相关系数为0.95,表明弹性模量的变化和抗压强度的变化存在强相关性。相反,MIC越小,表明参数之间的耦合程度越低。例如,抗压强度和持荷时间之间的相关系数为0.14,表明抗压强度和持荷时间几乎没有关联。

图7所示,骨料水泥比和水灰比、骨料水泥比和水泥含量、骨料水泥比和弹性模量、弹性模量和抗压强度之间存在强相关性。

根据相关性分析结果,考虑了3种输入组合,组合1为原始组合,组合2筛除了相关性最高的参数组合(a/cc),组合3筛除了相关性最低的参数组合(Δtfc),具体组合见表5。考虑XGBoost预测混凝土徐变具有很好的效果,本文选择XGBoost作为相关性分析的基本模型。基于XGBoost的3种组合的预测结果见表6图8

图8表6中可以看出,XGBoost的性能在参数筛选之后发生了改变,当筛除a/cc之后(组合2),模型的预测能力下降不明显,这可能是因为a/c不仅与c强相关性,还和v/sEσ强相关性,cv/sEσ也有较强的相关性。当筛除Δtfc之后(组合3),R2相比组合1降低13.5%,OBJ提高9.36,模型的预测效果下降比较明显,其原因可能是Δt和其他参数之间都不具有强相关性。

为验证这一结果,将数据库中的c(组合4)和Δt(组合5)参数筛除后,用XGBoost重新进行训练,结果见表7图9表8为筛除后的参数组合。

通过图9表7可以看出,当筛除c之后(组合4),模型的预测结果与组合2相近,这表明当一种参数与多种参数都具有强相关性时,筛除这个参数对结果的影响不大。当筛除Δt之后(组合5),模型的预测结果与组合3相近,表明一种参数与其他参数都不具有强相关性时,必须考虑这个参数对结果的影响。

5 结 论

(1)选取的3种机器学习模型对预测混凝土徐变具有良好的精度,其中XGBoost的预测效果最好,R2、RMSE、MAE分别为0.972 9、9.46×10-6 με/MPa、5.28×10-6 με/MPa。XGBoost模型的R2比MC2010模型高0.485 3。

(2)计算了高强徐变数据库中任意两个变量之间的MIC,其中相关性最强的是骨料水泥比和水泥含量、骨料水泥比和体表比。基于相关性分析的结果对XGBoost进行训练,结果表明去除了弱相关性的参数,会明显降低机器学习的鲁棒性。

(3)对于HSC,当一种参数与其他参数都不具有强相关性时,这个参数对结果的影响较大,在机器学习建模时,必须考虑这个参数对结果的影响。当同时考虑水灰比、骨料水泥比、水泥含量作为输入变量时,筛除水泥含量对模型的结果影响较小。

参考文献

[1]

Vandamme M, Ulm F J. Nanogranular origin of concrete creep[J]. Proceedings of the National Academy of Sciences, 2009, 106(26): 10552-10557.

[2]

黄永辉, 刘爱荣, 傅继阳, 高强钢管高强混凝土徐变特性试验研究[J]. 工程力学, 2021,38(8): 204-212.

[3]

Huang Yong-hui, Liu Ai-rong, Fu Ji-yang, et al. Experimental study on the creep characteristics of high-strength concrete filled high-strength steel tube [J]. Engineering Mechanics, 2021, 38(8): 204-212.

[4]

柯敏勇, 刘海祥, 陈松.桥用高强混凝土双轴徐变试验研究[J].建筑结构学报,2012, 33(6): 116-122.

[5]

Ke Min-yong, Liu Hai-xiang, Chen Song. Biaxial creep experiment for high strength concrete in bridge engineering [J]. Journal of Building Structures, 2012, 33(6): 116-122.

[6]

Le Roy R, Le Maou F, Torrenti J M. Long term basic creep behavior of high performance concrete: data and modelling[J]. Materials and Structures, 2017, 50(1): 1-11.

[7]

ACI Committee 209.209R1-92: Prediction of creep, shrinkage and temperature effects in concrete structures. manual of concrete practice part 1 [S/OL]. [1992-01-03].

[8]

Betonbau. Fib model code for concrete structures 2010[J]. Ernst Shon, 2013: 97834336.

[9]

Gardner N J, Lockman M J. Design provisions for drying shrinkage and creep of normal strength concrete [J]. ACI Materials Journal, 2001, 98(2): 159-167.

[10]

Bažant Z P, Baweja S. Creep and shrinkage prediction model for analysis and design of concrete structures: model B3[J]. Materials and Structures, 1995, 28(6): 357-365.

[11]

Bažant Z P, Wendner R. RILEM draft recommendation. TC-242-MDC multi-decade creep and shrinkage of concreteL Material model and structural analysis Model B4 for creep, drying shrinkage and autogenous shrinkage of normal and high-strength concretes with multi-decad applicability[J]. Materials Structures, 2015, 48(4): 753-770.

[12]

Peng Y, Unluer C. Modeling the mechanical properties of recycled aggregate concrete using hybrid machine learning algorithms[J]. Resources, Conservation and Recycling, 2023, 190: 106812.

[13]

Yang Z, Zhu H, Zhang B, et al. Short-term creep behaviors of seawater sea-sand coral aggregate concrete: An experimental study with rheological model and neural network[J]. Construction and Building Materials, 2023, 363: 129786.

[14]

Pham A D, Hoang N D, Nguyen Q T. Predicting compressive strength of high-performance concrete using metaheuristic-optimized least squares support vector regression[J]. Journal of Computing in Civil Engineering, 2016, 30(3): No.06015002.

[15]

Liang M, Chang Z, Wan Z, et al. Interpretable ensemble-machine-learning models for predicting creep behavior of concrete[J]. Cement and Concrete Composites, 2022, 125: 104295.

[16]

曲广雷, 闫宗伟, 郑木莲, 基于神经网络与回归分析的多孔混凝土性能预测[J]. 吉林大学学报:工学版, 2025, 55(1): 269-282.

[17]

Qu Guang-lei, Yan Zong-wei, Zheng Mu-lian, et al. Performance prediction of porous concrete based on neural network and regression analysis[J]. Journal of Jilin University (Engineering and Technology Editon), 2025, 55(1): 269-282.

[18]

Xu J, Zhao X, Yu Y, et al. Parametric sensitivity analysis and modelling of mechanical properties of normal-and high-strength recycled aggregate concrete using grey theory, multiple nonlinear regression and artificial neural networks[J]. Construction and Building Materials, 2019, 211: 479-491.

[19]

Park D, Rilett L R. Forecasting freeway link travel times with a multilayer feedforward neural network[J]. Computer‐Aided Civil and Infrastructure Engineering, 1999, 14(5): 357-367.

[20]

Reshef D N, Reshef Y A, Finucane H K, et al. Detecting novel associations in large data sets[J]. Science, 2011, 334(6062): 1518-1524.

[21]

Li K, Long Y, Wang H, et al. Modeling and sensitivity analysis of concrete creep with machine learning methods[J]. Journal of Materials in Civil Engineering, 2021, 33(8): 04021206.

[22]

Hubler M H, Wendner R, Bazant Z P. Comprehensive database for concrete creep and shrinkage: Analysis and recommendations for testing and recording[J]. ACI Materials Journal, 2015, 112(4): 547-558.

[23]

Tang L, Na S H. Comparison of machine learning methods for ground settlement prediction with different tunneling datasets[J]. Journal of Rock Mechanics and Geotechnical Engineering, 2021, 13(6): 1274-1289.

[24]

Hastie T, Tibshirani R, Friedman J H, et al. The Elements of Statistical Learning: Data Mining, Inference, and Prediction[M]. New York: Springer, 2009.

[25]

Cortes C, Vapnik V. Support-vector networks[J]. Machine Learning, 1995, 20: 273-297.

[26]

Pedregosa F, Varoquaux G, Gramfort A, et al. Scikit-learn: machine learning in python[J]. Journal of Machine Learning Research, 2011, 12: 2825-2830.

[27]

Chen T, Guestrin C. XGBoost: a scalable tree boosting system[C]∥Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, San Francisco, USA, 2016: 785-794.

[28]

Zeghal M. Modeling the creep compliance of asphalt concrete using the artificial neural network technique[C]∥GeoCongress 2008: Characterization, Monitoring, and Modeling of GeoSystems, New Orleans, USA, 2008: 910-916.

基金资助

国家自然科学基金项目(52108161)

河北省自然科学基金青年项目(E2021210030)

河北省高等学校科学研究项目(BJK2024127)

AI Summary AI Mindmap
PDF (3255KB)

261

访问

0

被引

详细

导航
相关文章

AI思维导图

/