基于PBT-DeepTCN和数字孪生的烧结终点多步预测

宋小龙 ,  栗潇通 ,  杨欢 ,  吴朝霞

东北大学学报(自然科学版) ›› 2026, Vol. 47 ›› Issue (01) : 99 -106.

PDF (2605KB)
东北大学学报(自然科学版) ›› 2026, Vol. 47 ›› Issue (01) : 99 -106. DOI: 10.12068/j.issn.1005-3026.2026.20240126
材料与冶金

基于PBT-DeepTCN和数字孪生的烧结终点多步预测

作者信息 +

Multi-step Prediction of Sintering Terminal Point Based on PBT-DeepTCN and Digital Twin

Author information +
文章历史 +
PDF (2666K)

摘要

烧结终点位置是影响烧结矿质量和生产效率的关键参数.针对烧结终点预测中存在的指导性不足、时效性差和可视化效果弱等问题,本文构建了包括物理实体、虚拟环境、多步预测、孪生数据和虚实连接在内的数字孪生五维模型,为烧结过程提供工艺参数监控和优化指导.在预测方面,首先进行数据预处理,然后采用灰色关联度分析(GRA)筛选特征变量,最后利用基于群体的训练方法(PBT)优化的深度时间卷积网络(DeepTCN)对烧结终点进行多步预测.实验结果表明,所提数字孪生模型在不同预测步长下具有较高预测精度,为烧结领域数字化、智能化转型提供了先进思路与技术方法.

Abstract

The position of the sintering terminal point is a key parameter that affects the quality and production efficiency of sinter. To improve insufficient guidance, poor timeliness, and weak visualization effect in sintering terminal point prediction, a five-dimensional digital twin model was constructed, including physical entity, virtual environment, multi-step prediction, twin data, and virtual and real connection, which provided process parameter monitoring and optimization guidance for the sintering process. In terms of prediction, the data was first preprocessed, and then the feature variables were screened by grey relation analysis (GRA). Finally, the deep temporal convolutional network (DeepTCN)by using population based training(PBT) was constructed for multi-step prediction of the sintering terminal point. The experimental results show that the proposed digital twin model has high prediction accuracy under different prediction steps, and it provides advanced ideas and technical methods for digital and intelligent transformation in the sintering field.

Graphical abstract

关键词

烧结终点 / 多步预测 / 数字孪生 / 深度时间卷积网络 / 超参数优化

Key words

sintering terminal point / multi-step prediction / digital twin / deep temporal convolutional network / hyperparameter optimization

引用本文

引用格式 ▾
宋小龙,栗潇通,杨欢,吴朝霞. 基于PBT-DeepTCN和数字孪生的烧结终点多步预测[J]. 东北大学学报(自然科学版), 2026, 47(01): 99-106 DOI:10.12068/j.issn.1005-3026.2026.20240126

登录浏览全文

4963

注册一个新账户 忘记密码

烧结是钢铁工业的关键环节,其效率直接影响到烧结矿质量的稳定性和后续生产环节的进行.在烧结过程中,烧结终点的位置过早会导致铁矿石未完全烧结,从而影响烧结矿的质量;过晚则会增加燃料和能源的消耗,降低生产效率1.
近年来,国内外学者对烧结终点的预测进行了深入研究,并取得了一系列的研究成果.目前烧结终点的研究主要分为两类:基于机理模型和基于数据驱动模型.例如,Tamura等2利用烧结台车速度、料层厚度等参数直接预测烧结终点位置.然而,当建立烧结过程的机理模型时,不可避免地需要引入一些假设以简化其复杂性.同时,许多参数在实际条件下难以获取.为了解决这一问题,结合烧结过程大滞后、非线性和多工况等特点,研究者将更多的注意力集中在数据驱动的建模方法上.Liu等3提出了一种基于梯度提升决策树算法和决策规则的烧结终点预测系统,其优势在于对非线性关系的处理能力较强,但在处理高维数据时可能会遇到性能瓶颈.Hu等4提出了一种基于加权核即时学习和模糊广义学习系统的烧结终点软测量模型,具有较高的预测精度和建模效率,适用于烧结生产线实时监测和控制.Toktassynova等5提出了一种基于粒子群优化的灰色理论烧结终点预测模型,该模型在小样本情况下表现良好,但对数据的初始参数较为敏感.Wang等6提出了一种将遗传算法和烟花算法应用于支持向量机参数优化的烧结终点预测方法,能适应不同规模和类型的优化问题,有较强的全局搜索能力.这些方法的优势在于它们能够更好地处理烧结过程的复杂特性,同时对参数获取的要求不像传统的机理模型那样严格.
目前对于烧结终点的研究主要集中在单步预测方面,即对下一个时间步的烧结终点进行预测.单步预测方法可以在一定程度上为生产提供参考,但无法提供未来时刻的变化趋势,也难以充分利用历史信息.由于烧结过程惯性大,烧结终点无法立即与控制量相对应,因此通过超前几个时间步长对烧结终点进行时间序列预测是必要且有意义的.通过从历史数据中提取丰富的时间特征信息,可以为现场操作人员调整工艺参数提供宝贵的时间窗口,从而保证烧结过程的稳定性和高效性.Xie等7提出了编码器-解码器烧结终点多步预测框架,通过对时间序列分解降低了预测的难度和噪声带来的不利影响.Yan等8提出了一种基于3D卷积的烧结终点多步预测模型,同时捕获时空依赖性.现有研究在烧结终点多步预测研究中取得了一定进展,但大多数都是基于递归架构实现的,未能解决多步预测过程中误差累积问题,并且实时响应能力有限,与实际生产场景的贴合程度有待提升,难以在复杂调度环境中取得良好效果.
现有的研究表明,将训练好的模型在实际生产中应用是极其复杂的9.在“工业4.0”和“制造强国”等战略的推动下,以智能制造为主导的第四次工业革命已经全面展开10.数字孪生的出现为烧结流程的数字化和智能化转型提供了广阔的前景.数字孪生系统集成了机器学习算法11、数据驱动方法12、通信协议[13]、三维建模方法[14]以及其他技术.文献[15]强调数字孪生对于加速智能节能领域的实际实施至关重要.数字孪生技术已经提出很长时间,但是目前研究主要集中在电力领域[16-17],公开文献中只有少数论文将数字孪生技术与烧结过程结合.
为了进一步解决烧结过程中海量运行数据难以快速处理且实时性不足的问题,本文将数字孪生技术应用于烧结过程,构建了数字孪生五维模型,为烧结过程提供了全面的工艺参数监控和优化指导.具体来说,首先对数字孪生系统框架进行详细描述;其次利用箱线图法和灰色关联度分析(grey relation analysis,GRA)对原始数据进行分析和预处理,并筛选出15个与烧结终点相关性较高的特征变量;最后利用基于群体的训练方法(population based training,PBT)优化的深度时间卷积网络(deep temporal convolutional network,DeepTCN)对烧结终点进行多步预测,通过与其他模型对比表明本文构建的模型对烧结终点预测具有较高精准性.

1 数字孪生框架

1.1 烧结工艺流程

烧结是一个连续性强且工艺参数复杂的工业过程,广泛应用于粉状或颗粒状的矿石、精矿、焦炭等原料的加工,使其形成具有一定强度和孔隙结构的块状物料,称为烧结矿.如图1所示,烧结矿的形成需要经过配料、加水混合、布料、点火、抽风烧结、冷却筛分等多个工序.合格的烧结矿会被堆存或输送至高炉进行下一生产环节.烧结过程涉及多个关键环节和工序,每一个步骤都对最终产品的质量和性能有着重要影响.

1.2 数字孪生五维模型

为了进一步优化和控制烧结工艺,提高产品质量和生产效率,本文引入了数字孪生技术.数字孪生概念最初由Grieves[18]于2003年提出,它反映了物理实体在数字空间中的行为和状态.数字孪生是一种将物理对象或系统的真实状态和动态行为映射到虚拟环境中的技术,通过数据和算法实现物理世界与数字世界的实时交互.陶飞等[19]提出的数字孪生五维模型将数字孪生系统分为物理实体、虚拟环境、服务、数据和连接5个维度,详细描述了数字孪生系统的构成及其相互关系.本文按照五维模型设计了烧结机数字孪生系统.

图2所示,该框架可分为5层,从上到下包括服务层、数据分析层、数据传输层、感知层和设备层.其中,设备层为烧结车间各类实体设备的集合,是运行状态预测的主要对象和基础,设备层向感知层提供烧结过程参数等信息,为整个系统提供了最基本的数据来源.感知层包含一系列传感器,如温度传感器、流量传感器和压力传感器等,对点火温度、烧结台车速度、风箱废气温度及煤气流量等信息进行采集和传输.数据传输层负责将感知层采集的数据传输到数据分析层,并确保数据的及时性和完整性.PLC(programmable logic controller)将传感器采集到的数据发送至控制室,实现数据的传输和存储.数据分析层通过API(application programming interface)接口从控制室获取实时数据,然后将数据分别发送至缓冲数据库(MySQL)和历史数据库(MongoDB).缓冲数据库存储实时数据,规模较小,用于实时传输;历史数据库存储所有历史数据,用于查询、建模、分析和统计.数据经过处理和筛选后,烧结终点预测模型对其进行深度分析与挖掘,进而对烧结终点进行准确的多步预测.数字孪生系统是在Unity 3D平台上搭建的,通过C Sharp脚本调用数据库信息和烧结终点预测模型.服务层通过数字孪生系统实时展示预测结果,并且对设备运行状态参数进行监控,确保烧结过程正常运行,通过数字孪生系统将设备运行状态可视化展示,为操作人员提供决策指导,进一步优化烧结过程.

数字孪生的核心在于通过先进的预测算法对采集到的海量数据进行深度学习与精准分析,从而保障烧结过程的稳定与高效运行.利用数字孪生技术的实时数据连接和深度分析优势,能够为烧结工艺的智能化升级和效率提升提供坚实支撑.

1.3 数据分析与预处理

为了实现准确的预测,首先需要对原始数据进行预处理.本文的实验数据来自某钢铁企业3号机2022年3月12日至2022年3月18日的10 000组生产数据,采样间隔为1 min.烧结过程参数主要分为原料参数、混合料参数、设备参数和状态参数.在实际采样中,有时会因设备损坏、停机维护等原因导致部分数据的缺失或异常.为了确保模型的正常运行和预测的准确性,本文采用箱线图法进行异常检测,该方法通过计算数据的四分位距和异常值上下界限,识别出数据中的异常值.对于缺失值和异常值数据点,本文采用前5个有效值的平均值进行替换.另外,为了确保不同特征数据之间的可比性和可解释性,需要对数据进行标准化处理,将其按照一定的比例缩放到一个特定的区间范围内,消除不同特征之间的数量级差异.经过标准化处理后的数据可以提高模型的收敛速度和预测性能,更好地适应预测任务的需求.

1.4 特征变量选择

特征变量选择在数据分析和建模中起着至关重要的作用.烧结过程涉及数百个变量,其中一些变量对烧结终点的影响显著,而其他变量的影响则可以忽略不计,因此为了提高数据传输和模型训练的速度,有必要对特征进行降维处理.为了解决这些问题,研究者提出了多种降维技术.其中,GRA作为一种有效的特征选择方法[20],近年来备受关注.

GRA通过量化特征之间的相关性实现数据集的降维.与传统方法相比,GRA具有独特的优势.首先,它在处理小样本和高维数据时表现出色,有效解决了维度灾难的问题.其次,GRA能够从数据中提取相关性高的特征,减少了信息冗余,有助于提升模型的泛化能力.此外,该方法不需要假设数据的分布情况,适用于各种类型的数据集.因此,本文引入GRA作为特征降维的手段,不仅可以有效地减少特征空间的维度,还能够提高模型的性能和鲁棒性.

定义烧结终点序列{A(t)}为参考序列,特征序列{Bi(t)}为比较序列,其中t为时间索引,i为特征索引,则烧结终点序列与特征序列的灰色关联度(γi)

γi=1nt=1nζi(t),
ζi(t)=minimintΔi+ρmaximaxtΔiΔi+ρmaximaxtΔi.

式中:ζi为烧结终点序列与特征序列的相关系数;Δi为烧结终点序列与特征序列的绝对差值;ρ为分辨系数,本文取0.5,能够平衡绝对差值和相对差值的影响,使关联度计算更为稳定和有效[20-21]n为参与灰色关联度计算的采样点总数.首先计算参考序列与比较序列在每个时间点的绝对差值Δi,然后通过标准化差值范围计算相关系数ζi,最后通过平均相关系数得到整体灰色关联度γi,并根据关联度大小选择特征变量.最终选择影响烧结终点的主要特征变量如表1所示.

2 烧结终点多步预测模型

2.1 DeepTCN算法

大多数多步预测框架都是基于自回归预测方法,如图3a所示.这些模型的输出依赖于之前的预测结果,而不是真实的观测值,即先根据过去的观测值生成一步预测结果,再将该结果作为新的观测值进行下一步预测.如果在预测过程中出现误差,这些误差会在时间步上逐步累积,导致预测序列越长,预测结果与真实值的偏差越大.由于依赖于以前的预测值,LSTM(long short-term memory)等递归神经网络难以进行并行计算,从而限制了其效率.本文采用的DeepTCN为非自回归预测方法,如图3b所示,可以一次性直接生成所有时间步的预测结果,避免了误差累积的问题,提高了预测效率.

DeepTCN是一种基于卷积神经网络的时间序列预测框架[22],通过采用并行运算方法避免了误差累积,同时还能够有效捕捉长时间依赖关系,克服传统递归神经网络在处理长时间序列时的局限性.图4展示了DeepTCN的框架结构,由编码器和解码器组成.

编码器模块如图5a所示,其由残差模块组成.每个残差模块由两层膨胀因果卷积组成:第1层后面是批标准化和ReLU激活函数,第2层后面批标准化的输出作为残差模块的输入,ReLU激活函数有助于避免深层网络中的梯度消失,批标准化可以帮助网络更快地收敛.因果卷积使得时间t对应的输出只能从不晚于t的输入中获得,避免了数据从未来到现在的泄露,保证了时间序列建模的因果性,膨胀因果卷积通过以特定步骤跳过一些输入值来将滤波器应用于大于其长度的区域.对于给定输入序列x,膨胀卷积与核函数wt时刻的输出s可以表示为

s(t)=x*dw(t)=k=0K-1w(k)x(t-dk).

其中:d是膨胀因子;K是卷积核大小;*表示卷积计算;k表示卷积核索引变量.通过堆叠多个膨胀卷积使网络具有非常大的感受野,并且用更少的层数捕获长时间的依赖性.图4的左侧是膨胀因子d={1,2,4,8}的膨胀因果卷积的示例,其中滤波器大小K=2,通过堆叠4层膨胀因果卷积,最终的感受野将覆盖时间步为1到16的信息.

解码器模块如图5b所示,其由残差神经网络的变体和全连接层组成.首先利用全连接层、批标准化和ReLU激活函数构成了残差函数R(),然后将R(Xt+ω(i))ht(i)通过ReLU激活函数得到δt+ω(i),可以表示为

δt+ω(i)=R(Xt+ω(i))+ht(i).

其中:ht(i)是编码器部分的输出;Xt+ω(i)是未来的协变量;δt+ω(i)是残差神经网络变体的输出;R()是作用于未来协变量Xt+ω(i)的残差函数;ω是预测步长,ωΩ,Ω是预测窗口总长度.

本文采用分位数回归进行预测,特定分位数水平q对应的分位数损失为

Lqy,y^q=qy-y^q++(1-q)y^q-y+.

其中:yy^q表示对应分位数的真实值和预测值;(y)+=max(0,y)q(0,1),对模型进行训练以使分位数损失最小化.

2.2 PBT算法

由于深度学习网络的结构复杂,不仅存在大量的权重需要优化,还有许多其他需要手动指定的参数,例如训练周期、批处理大小、网络层数等,这些参数统称为超参数.合理选择超参数对于模型性能和泛化能力至关重要.

常见的自动调优方法分为并行搜索和顺序优化.并行搜索可以并行利用计算资源更快地找到最优解;顺序优化只能使用先前的优化信息进行下一个超参数优化步骤,由于只能串行执行,因此会消耗大量时间.PBT作为一种可并行搜索的高效寻优方法,通过同时训练多个网络并允许它们相互交换信息,显著提高了寻优效率[23].因此,本文使用PBT算法来优化DeepTCN模型的超参数,以达到最佳预测效果.

PBT算法的优化过程主要包括以下步骤:1) 随机初始化一组模型及其对应的超参数;2) 并行训练每个模型;3) 评估和比较,根据其他模型的优缺点调整自身模型的参数,同时对性能较好的模型进行微调或随机扰动,以探索新的超参数空间;4) 重复上述步骤.通过这种方式,PBT能够动态地调整超参数,并在训练过程中发现并利用性能较好的模型的超参数配置,从而提高整体的训练效率和性能.根据数据集的特征和预测需求,超参数的调整范围如表2所示.

3 结果与分析

本文的实验是在Windows 11操作系统上进行的,硬件配置包括3.80 GHz AMD Ryzen 77840H with Radeon 780M Graphics和16 GB内存.预测框架是基于Python3.9编程语言构建的.经过PBT优化后的DeepTCN模型的超参数设置为:学习率为0.001;批处理大小为16;卷积核大小为2;滤波器数量为6;输入序列长度为32.

为了验证所提方法的有效性,选择均方根误差(eRMS)、平均绝对误差(eMA)和决定系数(R²)作为衡量不同模型预测效果的指标,表达式如下:

eRMS=1ni=1n(yi-y^i)2,
eMA=1ni=1n|yi-y^i|,
R2=1-i=1n(yi-y^i)2i=1n(yi-y¯i)2.

其中:n为样本数;yi为第i个样本的真实值;y^i为第i个样本的预测值;y¯i为真实值的平均值.

本文将PBT-DeepTCN与未进行参数优化的DeepTCN算法、长短期记忆(LSTM)网络和卷积神经网络(CNN)进行对比.图6展示了各模型对烧结终点的单步预测结果,其中PBT-DeepTCN模型的预测曲线拟合效果最佳.

表3总结了不同预测步长下的对比结果,结果显示,采用PBT优化的DeepTCN模型无论在单步预测还是多步预测中的三项指标均优于对照组.这是由于DeepTCN通过堆叠多层膨胀因果卷积获得了更大的感受野,从而更有效地捕捉长时间依赖关系,并且通过并行运算避免了误差累积.在PBT的优化下,DeepTCN的预测精度得到进一步提升.

此外,随着输出序列长度的增加,模型预测性能逐渐下降,如果盲目增加输出序列长度对烧结终点的预测精度提升不大,还会增加训练时间.通过与烧结车间现场操作人员深入交流后,了解到烧结终点的调整大约需要8 min.本文选择以1 min的时间间隔对烧结终点进行超前8步预测.通过提前预测烧结终点的变化趋势,可以为操作人员提供宝贵的时间窗口,从而对烧结工艺的正常运行提供建设性指导.因此,进行烧结终点的多步预测仍然是有意义和必要的.

本文提出的烧结机数字孪生系统如图7所示,可视化界面实时更新预测结果,为操作人员提供烧结过程的参数信息与烧结终点趋势信息.通过数字孪生系统实时采集数据并分析,实现了烧结过程的全方位、深层次、精细化管理.数字孪生技术的应用为烧结过程提供了强有力的技术支持,显著提升了烧结工艺的智能化水平.

4 结 论

1) 针对烧结终点预测中指导性不足的问题,本文提出了PBT-DeepTCN烧结终点多步预测模型,该模型具有良好的并行运算能力和时序特征提取能力.实验结果表明,PBT优化的DeepTCN模型在不同步长下的预测精度显著优于CNN模型和LSTM模型.

2) 针对烧结过程中数据处理时效性差和智能化水平低的问题,本文将数字孪生技术应用于烧结过程,构建了烧结机数字孪生系统.该系统不仅提升了对烧结过程的监控和预测水平,还为操作人员调整烧结终点位置提供决策依据,为烧结过程的数字化、智能化转型提供了先进的技术方案.

参考文献

[1]

Du SWu MChen Xet al. Intelligent integrated control for burn-through point to carbon efficiency optimization in iron ore sintering process[J]. IEEE Transactions on Control Systems Technology202028(6): 2497-2505.

[2]

Tamura NKonishi MMorita Tet al. Mathematical approach for the optimization of the sintering process operation[J]. IFAC Proceedings Volumes198720(8): 203-208.

[3]

Liu SLyu QLiu X Jet al. A prediction system of burn through point based on gradient boosting decision tree and decision rules[J]. ISIJ International201959(12): 2156-2164.

[4]

Hu JWu MCao W Het al. Soft-sensing of burn-through point based on weighted kernel just-in-time learning and fuzzy broad-learning system in sintering process[J]. IEEE Transactions on Industrial Informatics202420(5): 7316-7324.

[5]

Toktassynova NFourati HSuleimenov B. Modelling and control structure of a phosphorite sinter process with grey system theory[J]. The Journal of Grey System202032(2): 150-166.

[6]

Wang D DYang KHe Z Jet al. Application research based on GA-FWA in prediction of sintering burning through point[C]//Proceedings of 2018 International Conference on Computer, Communications and Mechatronics Engineering. Xiamen,2018: 378-385.

[7]

Xie Y HHe B CZhang X Met al. A decomposition-based encoder-decoder framework for multi-step prediction of burn-through point in sintering process[C]//2023 IEEE 6th International Conference on Industrial Cyber-Physical Systems (ICPS). Wuhan, 2023: 1-6.

[8]

Yan FYang C JZhang X Met al. A 3D convolution-based burn-through point multistep prediction model for sintering process[J]. IEEE Transactions on Industrial Electronics202471(4): 4219-4229.

[9]

Liu M NFang S LDong H Yet al. Review of digital twin about concepts, technologies, and industrial applications[J]. Journal of Manufacturing Systems202158: 346-361.

[10]

Bajic BRikalovic ASuzic Net al. Industry 4.0 implementation challenges and opportunities: a managerial perspective[J]. IEEE Systems Journal202115(1): 546-559.

[11]

Brynjolfsson EMitchell T. What can machine learning do? Workforce implications[J]. Science2017358(6370): 1530-1534.

[12]

Lyu W JLiu J. Artificial intelligence and emerging digital technologies in the energy sector[J]. Applied Energy2021303: 117615.

基金资助

河北省教育厅科学技术研究项目(BJ2021099)

AI Summary AI Mindmap
PDF (2605KB)

205

访问

0

被引

详细

导航
相关文章

AI思维导图

/