基于ConvGRU融合注意力机制的工业混合气体智能识别方法

孟凡利 ,  李书畅 ,  王浩 ,  苑振宇

东北大学学报(自然科学版) ›› 2025, Vol. 46 ›› Issue (07) : 37 -48.

PDF (4305KB)
东北大学学报(自然科学版) ›› 2025, Vol. 46 ›› Issue (07) : 37 -48. DOI: 10.12068/j.issn.1005-3026.2025.20240164
工业智能理论与方法

基于ConvGRU融合注意力机制的工业混合气体智能识别方法

作者信息 +

Intelligent Identification Method of Industrial Mixed Gases Based on ConvGRU Fusion Attention Mechanism

Author information +
文章历史 +
PDF (4407K)

摘要

针对传统半导体气敏传感器在气体识别方面存在的数据依赖度高和混合气体识别精度不足的问题,本研究提出了1种融合门控循环单元(GRU)、卷积与注意力机制的ConvGRUAttention网络模型.采用经验小波变换(empirical wavelet transform,EWT)对原始信号进行时频域转换与多尺度分解,抑制噪声并降低数据依赖,提高了模型的鲁棒性.本模型通过卷积层提取局部动态特征,利用GRU捕捉信号的长期依赖,并引入注意力机制动态优化多尺度信号的特征权重,增强模型的特征提取和泛化能力.通过实验验证,定性识别准确率达到了100%,定量识别的均方根误差为3.3×10-6.与传统方法相比,混合气体检测精度显著提高.

Abstract

To address the issue of high data dependency and insufficient accuracy in mixed gas identification for traditional semiconductor gas sensors, a ConvGRUAttention network model that integrates gated recurrent units (GRU), convolutional layers, and attention mechanism is proposed. Empirical wavelet transform (EWT) is employed to convert raw signals into the time-frequency domain and perform multi-scale decomposition, which suppresses noise, reduces data dependency, and enhances the model’s robustness. The model extracts local dynamic features through convolutional layers, captures long-term dependencies using GRU, and optimizes feature weights across multi-scale signals via the attention mechanism, thereby improving feature extraction and generalization capabilities. Experimental results demonstrate 100% accuracy in qualitative identification and a root mean square error (RMSE) of 3.3×10⁻⁶ in quantitative detection. Compared with the traditional methods, the detection accuracy for mixed gases is significantly improved.

Graphical abstract

关键词

半导体气敏传感器 / 经验小波变换 / 卷积门控循环注意力模型 / 定性识别 / 定量检测

Key words

semiconductor gas sensor / empirical wavelet transform (EWT) / ConvGRUAttention model / qualitative identification / quantitative detection

引用本文

引用格式 ▾
孟凡利,李书畅,王浩,苑振宇. 基于ConvGRU融合注意力机制的工业混合气体智能识别方法[J]. 东北大学学报(自然科学版), 2025, 46(07): 37-48 DOI:10.12068/j.issn.1005-3026.2025.20240164

登录浏览全文

4963

注册一个新账户 忘记密码

甲苯和二甲苯(toluene-xylene,TX)是常见的挥发性有机化合物(volatile organic compounds,VOCs),广泛应用在化工、制药、涂料、塑料及燃料等多种行业中1-3.TX不仅是重要的工业原料,也是工业排放中的主要成分.由于其具有较强的挥发性和毒性,在大气和水体中可能会对环境造成破坏,影响生态系统并危害人类健康4.目前,半导体气敏传感器因其便携性、小型化和快速响应等优点,已被广泛应用于VOCs的检测.然而,甲苯和二甲苯结构相似,通常以混合形式存在,单一传感器难以将两者区分,从而限制了检测的精度.
近年来,传感器检测技术的研究主要集中在有料技术5、传感器阵列6、动态调制技术7和机器学习8等方面.考虑到新材料的研发和传感器阵列的部署需要大量时间和资源,动态调制技术与机器学习的结合提供了1种新的解决方案9,有望提高传感器在复杂气体环境中的检测能力.
动态调制技术通过不同方式调制传感器,包括温度调制、光照调制10和压强调制11等.其中,温度调制通过周期性加热波形增加传感器灵敏度,赋予其对复杂气体时域响应的能力.1975年美国的Le最早报道了将动态温度调制技术用于半导体气敏传感器的研究,他提出通过控制传感器温度来实现对于CO气体的高温和低温检测的方法12.随后动态温度调制技术开始被广泛研究和使用.后续的研究探讨了不同加热波形对传感器性能的影响,并在识别不同VOCs气体方面取得了良好效果13.例如,Lee等14比较了方波和三角波等不同波形调制对传感器性能的影响,识别出了不同VOCs气体.Cai等15通过控制加热电压对CdO修饰的ZnO传感器进行矩形波加热,实现了丙醇、异丙醇和乙醇等同系物的识别,并研究了气体浓度与传感器响应之间的关系.Nakata等16发现,在“速升慢降”和“速降慢升”两种调制模式下,传感器能明显改善混合气体的动态响应.
随着数据增强方法的广泛应用,传感器采集时序数据的处理也日益受到关注.目前,传感器领域常用的数据处理技术包括主成分分析(principal component analysis,PCA)17和独立成分分析(independent component analysis,ICA)18等.其中,Ji等19使用PCA与支持向量机(support vector machine,SVM)相结合的方法,对动态调制后的信号进行了数据降维和特征选择,从而提高了信号处理的效率与准确性.Khurshid等20将PCA和ICA结合进行传感器故障检测,解决了非线性过程数据中存在的高斯特性等问题.Ji等21利用虚拟阵列技术来增加输出信息,以此克服了湿度的干扰.Zhang等22基于滑动窗口和傅里叶变换提出了1种加快传感器标定和模型部署的策略.然而,这些方法多用于单一气体检测,对混合气体环境的适用性尚不清晰.
随后,信号分解技术开始被广泛应用,如小波变换23或经验模态分解(empirical mode decomposition,EMD)24,可以有效地处理非线性、非平稳信号.然而,这些算法也存在一定的局限性.小波变换需要手动选择合适的小波基函数,EMD容易产生模态混叠现象.而EWT25在小波变换的基础上,融合了EMD自适应分解的理念,可以自适应地选择频带,同时克服了由于信号时频尺度不连续引发的模态混叠问题26.其中,Liu等27将EWT用于机械故障诊断,对信号进行分解,提取不同频带的特征,提高了故障诊断的准确性.Al-Musaylh等28搭建了EWT-决策树网络的混合模型,并预测了天然气的浓度,但该模型未涉及分类任务且其数据集庞大.
随着深度学习的快速发展,卷积神经网络(convolutional neural network,CNN)、长短期记忆(long short-term memory,LSTM)网络和门控循环单元(GRU)等模型被广泛用于处理传感器数据.Gao等29将EWT和CNN相结合构建了1种多尺度卷积神经网络,对旋转机械的健康状态进行了识别.de Bruin等30利用LSTM提取了多个轨道的电路信号之间的特征依赖,成功识别了铁路轨道的故障.在气体检测领域,Liu等31以乙烯-乙炔二元气体的检测为例,提出基于GRU模型的混合物多组分智能检测方法,可直接预测各组分含量.然而传统深度学习方法在非选择性传感器上缺乏区分复杂混合气体成分的适应性,表明有必要发展更为鲁棒的混合气体识别技术,提高定性识别32和定量检测33的性能.
针对上述问题,本文提出了1种基于EWT和ConvGRU融合注意力机制的神经网络用于识别甲苯和二甲苯混合气体的方法.该方法的主要创新点和贡献如下:
1) 通过对NiO气敏传感器采用阶梯加热波形进行动态调制,从而增强气体信号的动态特征.然后,使用EWT将传感器的时序信号分解为6个子波形(IMF1~IMF6),选取其中IMF1,IMF2和IMF6作为模型输入,去除其余成分以减少整体非线性趋势和漂移对模型的干扰.同时,利用EWT的频域特性,将一维信号扩展为二维特征,使数据更加稀疏,降低低维空间中的噪声干扰,并通过滑动窗口不重叠地对数据进行裁剪,丰富数据集特征,避免欠拟合.
2) 提出了1种结合卷积操作和注意力机制的ConvGRUAttention神经网络模型.ConvGRU模块在GRU的基础上,将所有线性层替换为卷积层,以提取信号中的局部特征,从而在时间和空间两方面进行特征计算,也在一定程度上减少了计算复杂度,避免过拟合问题.在ConvGRU和注意力模块之间添加了两层CNN连接,通过卷积操作聚焦局部特征,提高模型对噪声的鲁棒性;注意力机制则用于识别并强化信号内部的相关性,动态建模全局关系,减少信息损失并增强模型的可解释性.
3) 将气体的定性分类和定量回归任务集成到同一网络中,实现同步检测.该模型在处理混合气体环境下的分类和浓度预测任务时,能够准确识别甲苯、二甲苯及其混合物的类别,同时对其浓度进行精确估计,从而实现了定性与定量检测的多任务学习.

1 实验装置及数据集制作

1.1 NiO-Sn纳米材料的制备

本研究中使用的NiO-Sn纳米材料是通过水热合成法制备的.制备流程如下:将60 mL去离子水加入烧杯,并开始磁力搅拌;随后称量3 g(10 mmol)的草酸(H₂C₂O₄·2H₂O)和0.226 g(1 mmol)的氯化亚锡(SnCl₂·2H₂O)加入水中,搅拌至溶液澄清.然后,将聚乙烯吡咯烷酮(0.5 g)和NiCl2·6H2O(3.25 mg)混合到溶液中,保持磁力搅拌6 h.在溶液再次澄清后,将其转移到聚四氟乙烯衬里的不锈钢高压釜中,并在200 ℃下加热12 h.反应釜冷却至室温后,将反应釜中的沉淀物离心,用去离子水和乙醇反复洗涤3次,然后在60 ℃下干燥过夜,得到材料的前驱体.最后,将前驱体置于马弗炉中,在500 ℃下煅烧2 h,升温速率5 ℃/min,待其冷却后得到所需材料.图1为制备的材料和纯NiO材料的XRD表征图.由图1可以看出,2θ分别在37.24°,43.27°和62.89°时有良好衍射峰,表明材料制备成功.

1.2 气体智能测试平台

实验的气体数据采集在气体智能测试平台上完成,测试平台组成如图2所示.

该平台主要由密闭气室、可编程直流电源、数字源表、上位机的气体测试系统及合成干空气组成.

实验中,传感器置于1 L的密闭正方体气室内,气室包含3个气体流通口:注射口、进气口和排气口.进气口连接至合成空气气瓶,排气口通过管道与外界相连,确保气室中的气体可被完全更换.传感器的加热波形由可编程直流电源所控制,其本身带有正弦波和阶梯波等几种常见波形,也允许用户手动编写加热波形,可编程直流电源的型号为DP832A.传感器所需的两侧电压/电流由型号为B2920A数字源表提供.上位机的气体测试系统采集数字源表对应的电压/电流值,最后存储并绘制响应信号波形.

1.3 数据集制作

本文采集的是动态温度调制条件下的NiO-Sn气敏传感器对甲苯、二甲苯及其混合气体的响应信号,其体积分数分布范围为10至100×10-6之间.NiO作为传感材料,因其稳定性强、成本低等特点而被广泛应用,掺杂Sn进一步增强了其气体响应性能.本次实验动态温度调制选择的加热波形为下降阶梯波,高电压4.5 V,低电压2.5 V,周期60 s,每隔12 s改变1次温度,具体波形见图3.

此加热波形幅值对应的加热温度在150 ℃至320 ℃之间.传感器两端由B2920A数字源表施加10 V电压,测试系统采集数字源表的电流值,采样频率为10 Hz.

信号的采集流程如下:

1) 清洗气室:先将传感器置于密闭气室,打开数字源表和可编程直流电源,然后向气室通入干燥的合成空气1 min左右,关闭3个气口的阀门,保证气室内部干燥且封闭,排除干扰项,然后开始测量.

2) 稳定信号:在保持进气口和排气口关闭的情况下,从注射口向气室内快速注入待测气体,待传感器信号稳定后(最少保证连续3个周期没有出现明显波动),选取该稳定信号作为数据集.

3) 梯度采集:打开排气口和进气口,向气室通入合成空气,将上一浓度的待测气体排出,大约1 min,此时信号的响应几乎达到峰值,停止通入合成空气,待信号稳定后,按体积分数每梯度20×10-6注入气体,重复第二步,直至完成所有浓度梯度的信号采集.

实验采集得到的信号如图4所示,分别为不同体积分数的甲苯、二甲苯及其混合气体的响应波形,对相应信号添加类别标签和浓度标签.从图4可以看出,甲苯、二甲苯及其混合气体的响应波形几乎没有差别,可见凭借单一传感器的选择性直接进行识别是困难的,因此需要进行下一步的信号处理.

2 模型理论

本章详细介绍本文所采用的关键技术,包括经验小波变换、卷积门控循环单元(ConvGRU)以及注意力机制.这些技术共同构建了1个能在复杂混合气体环境中高效识别气体种类和浓度的深度学习模型.

2.1 经验小波分解

EWT是1种基于数据自适应的信号分解方法,它通过分析信号的局部特征来自动选择合适的小波基函数进行信号分解.与传统的固定小波基函数不同,EWT能够更好地适应不同类型的信号,能够同时在不同的尺度上分析信号的局部和全局特征,对噪声和异常值具有较强的鲁棒性,可以提供更准确的分解结果.同时,它具备完整可靠的数学理论基础,计算复杂度低,还能够克服EMD方法中过包络和欠包络的问题.

EWT方法的原理是将信号的傅里叶频谱划分为连续的区间,然后基于划分的区间构建小波滤波器进行滤波,最后得到1组调幅同频分量.该方法利用具有紧支撑特性的小波滤波器组来识别信号Fourier谱中特征信息所在的位置,并从时域和频域的角度对特征进行处理.

对给定的传感器信号S(t)进行傅里叶变换得到f(ω),如式(1)所示:

fω=-+Ste-jωtdt.

其中,ω的范围为[0,2π],根据香农准则,分解过程中仅讨论[0,π]内的傅里叶频谱特性.

EWT的核心在于自适应地分割信号的频谱.为了将频谱分为N个连续的分段Ωnn=1,2,,N),需要确定频谱的分割边界ωn,确定思路为通过搜索算法寻找信号傅里叶频谱的M个局部极大值点Ωn,并对其进行降序排列,此时会存在两种情况:

1) 当MN时,表示选出极大值的数目足够多,可以为频谱分割提供依据.此时,保留前N-1个极大值;

2) 当M<N时,重置参数N,令N=M.此时相邻极大值点的频带划分边界为

ωn=Ωn+Ωn+12.

此时,划分结果为Λn=[ωn-1,ωn],且Λn=[0,π]ω0=0ωN=π.实际划分结果如图5a~5c所示,其分别为10×10-6的甲苯、二甲苯及其混合气体的傅里叶频谱及其划分结果,红色虚线为划分区间.由图5可知,甲苯的频带划分较为均匀,说明其特征广泛存在于高低频,二甲苯的频带划分以高频居多.

对于每个频带,构建带通滤波器组,其过渡带宽(τn)如式(3)所示:

τn=γωn.

其中,γ取值范围在0至1之间,常用值为0.5 min((ωn+1-ωn)/(ωn+1+ωn)).故边界的上下限变化范围为[ωn+1-τnωn+1+τn],分别记为ξnξn*.

经验尺度函数φnω和经验小波函数ψn(ω)如式(4)~(5)所示:

φnω=1,      ωξn,0,      ω>ξn*,cosπ2βω-ξn2τn,其他
ψn(ω)=sinπ2βω-ξn2τn,ξnωξn*,1,ξn*ωξn+1,cosπ2βω-ξn+12τn,ξn+1ωξn+1*,0,其他.

其中,β(x)=x4(35-84x+70x2-20x3).

后续计算同小波变换类似,将信号分别与经验尺度函数和经验小波函数进行内积运算得到对应的变化系数,进而得到原始信号的分解模态.

根据上述EWT分解流程,最后对甲苯、二甲苯及其混合气体进行分解,结果如图5d~5f所示,包括6个信号,即IMF1~IMF6.图中IMF1和IMF2所分割的频段能量最高,包含气体的主要信息,且IMF1还保留了信号变化的大致趋势,高频分量IMF6则包含细节信息,有助于气体分类.故选择这3个分量进行后续计算.

2.2 卷积门控循环单元

卷积门控循环单元(ConvGRU)是卷积与门控循环单元(GRU)的结合,用于处理时序数据.它将卷积操作引入GRU的门控机制中,从而能够同时捕捉时序数据中的空间和时间依赖性.相比传统GRU,ConvGRU将GRU中的矩阵乘法替换为卷积操作,使其在处理时序数据的同时能够提取空间特征.

图6所示,从网络结构上来看,ConvGRU将GRU单元中的所有线性层替换为卷积层,其更新机制可分为以下3个主要步骤:

1) 重置门:该门是使用前一时间步的隐藏状态ht-1和当前时间步的输入数据xt导出和计算的,即图6绿色箭头所指的内容.GRU的流程就是先将先前的隐藏状态和当前输入与其各自的权重相乘并相加,然后传递给Sigmoid函数,将值转换为介于0和1之间,从而允许门在后续步骤中对关键信息和非关键信息进行过滤.故ConvGRU重置门向量rt式(6)所示:

rt=σConvWr,xt+ConvUr,ht-1.

其中:WrUr为卷积核(权重矩阵);σ为Sigmoid函数;Conv为卷积操作.

首先将前一时间步的隐藏状态通过卷积操作进行线性变换,然后将其与重置门向量按元素相乘,这一操作可以选择性地保留或遗忘先前的隐藏信息.与此同时,当前输入也会通过卷积操作进行线性变换.最后,将这两部分的结果相加,并通过tanh激活函数进行非线性映射,从而生成候选隐藏状态.故ConvGRU隐藏状态(ht̃)的计算见式(7)

ht̃=tanhConvW,xt+rtConvU,ht-1.

其中:为元素级的哈达玛积;WU为权重矩阵;tanh为双曲正切激活函数.

2) 更新门:更新门和重置门的向量都是使用相同的公式创建的,即图6中紫色箭头所指的内容.但是,与输入和隐藏状态相乘的权重对于每个门来说是唯一的,这意味着每个门的最终向量是不同的.故ConvGRU更新门zt的计算公式如下:

zt=σConvWz,xt+Conv(Uz,ht-1).

其中,WzUz为更新时的权重矩阵.

3) 隐藏状态更新:

ht=1-ztht̃+ztht-1.

2.3 注意力机制

注意力机制是机器学习中的一种数据处理方法,Attention从大量信息中有选择地筛选出少量重要信息并聚焦到这些重要信息上,忽略大量不重要的信息.聚焦的过程体现在权重系数的计算上,权重越大,越聚焦在对应的Value值上,即权重代表了信息的重要性,而Value是其对应的信息.

注意力机制计算流程如图7所示,计算公式如下:

AttentionQuery,Key,Value=i=1LSimilarityQuery,Keyi×Valuei.

其中:L为Key或者Value的长度;Similarity为计算相关性或者相似性的方法,包括点积、Cosine相似性以及MLP(多层感知机网络)等.

注意力机制的思想为给定数据中的某个元素Query,通过计算Query和各个Key的相似性或相关性,得到每个Key对应Value的权重系数,然后对Value进行加权求和,即得到最终的Attention权重.

3 实验结果与分析

3.1 模型搭建

实验所用数据集有272组,其中80%的数据集用于训练集和验证集,20%的数据用于测试集,将EWT分解的IMF1,IMF2和IMF6作为输入.使用Adam算法优化隐藏层参数,并且将学习率(learning rate,LR)设置为0.001,将批次大小Batch Size设置为16,最大训练轮次Epoch设置为500.整体模型使用Python 3.10环境下的PyTorch框架进行搭建,并在NVIDIA GeForce MX150上进行模型训练.模型具体参数见表1.

3.2 气体定性与定量识别

实验针对单一的NiO-Sn气敏传感器进行气体响应研究,主要分为两部分:混合气体的定性识别和定量识别.

1) 定性识别:本次气体的定性识别属于深度学习中的多分类任务.为实现准确的类别区分,本文为数据集添加了气体种类标签:甲苯为0,二甲苯为1,混合气体为2.为优化模型的分类效果,选择交叉熵损失作为损失函数,其可以视为Log-Softmax和负对数似然损失的结合,能够自动将标签转为one-hot编码形式,确保标签标准化处理:甲苯为[1,0,0],二甲苯为[0,1,0],混合气体为[0,0,1].交叉熵损失能有效度量模型预测分布与真实分布之间的差异,对于多分类问题具有良好的适应性.此外,针对数据集中单一气体和混合气体样本的不均衡分布问题,设定了类别权重为[0.58,0.31,0.11],防止模型偏向于数据量较多的类别,从而减少类别不平衡给模型训练带来的偏差.

定性识别的训练过程采用五折交叉验证法进行验证.交叉验证的引入有助于验证模型在不同数据子集上的泛化能力,从而提升模型的鲁棒性.训练过程中,损失曲线和准确率曲线的收敛情况如图8所示.从图8a可以看出,在训练轮次为250轮时损失曲线接近0;同时从图8b准确率曲线也可以看出,在训练250轮时,准确率在100%处小幅振荡.选择250轮有助于避免过拟合,同时确保模型能充分学习到数据的关键特征.最终保存了损失值最低的模型,并作为定性识别的最终模型.验证集和测试集的混淆矩阵如图9所示,分类准确率均达到了100%,表明模型在不同气体类别上的识别具有高可靠性.

2) 定量识别:浓度预测属于深度学习中的回归问题,采用平滑L1损失函数作为模型的损失函数.这一选择是基于平滑L1损失函数结合了L1损失(绝对误差)和L2损失(均方误差)的优点.当预测值与真实值的差值绝对值较小时,模型的性能向L2损失函数靠近,有助于加速收敛和减小预测误差;而当差值增大时,损失函数则向L1损失函数靠近,从而减少对异常值的敏感性.这种动态调整机制使得模型在处理含有噪声的实际数据时表现得更加稳健.

在训练过程中,经过500轮的迭代,模型在测试集上的平滑L1损失函数值达到了0.033,即体积分数误差为3.3×10-6,这表明模型具有较好的预测效果.

图10为浓度预测的可视化结果,清晰地表明模型在混合气体与单一气体浓度预测上的高精度.本文将预测值与真实值的误差绝对值小于0.5×10-6视为预测正确,模型的准确率为88.54%;当将误差标准放宽至小于1×10-6时,模型的准确率则上升至97.92%.这一结果表明了模型在实际应用中的可靠性和有效性.

本文模型将信号的时域特性和频域特征相结合,有效捕捉并表征了不同混合气体中的种类和浓度分布.具体而言,模型通过卷积操作提取局部特征,增强了模型对数据空间的表达能力.这种局部特征学习在气体浓度预测中至关重要,因为气体浓度变化往往具有一定的局部相关性.GRU的设计使得模型能够有效处理序列数据中的长期依赖关系,从而对气体浓度随时间变化的动态特性进行建模.同时,Attention机制的应用进一步提升了模型对全局特征的关注,强调了重要信息,能够帮助模型选择性地聚焦于输入序列中最相关的部分,从而提升预测的准确性.总之,本研究表明,ConvGRU+Attention框架可以很好地实现气体的定性和定量识别.

3.3 消融实验

消融实验的目的是验证卷积层和Attention机制在GRU模型中的有效性,特别是它们对气体的分类识别和浓度估计的准确性得到了提升.通过系统性地剔除这些关键组件,可以直观地评估它们在整个模型性能中的贡献.

本次实验采用经过EWT分解的子信号作为输入信号.在解释模型结构的同时,能更加直观地观察每个子信号所蕴含的气体信息.EWT分解的优点在于能够有效地将信号分解为不同频率成分,从而提取出气体的时域和频域特征,为模型提供丰富的输入信息.

实验内容主要是评估模型定性识别的准确率和Kappa系数.具体结果见图11图12表2.

Kappa系数是一种用于评估2个或多个评分者或评估者之间一致性水平的指标,常用于评价模型结果的可靠性.Kappa系数的值范围从-1到1,值越接近1表示一致性越高,反之则表示一致性较低.低频信号通常携带信号的主要信息和整体变化趋势,而高频信号则包含更细致的变化和噪声.

通过图5可以看出,低频分量IMF1和IMF2所在区间的频谱能量是最高的,这意味着这2个分量蕴含了较丰富的气体信息特征.IMF6作为原始信号的高频分量,其划分的区间最广,蕴含更多的细节特征,从而进一步丰富了模型的输入信息.这种频域分解方式能够显著减少信号中的漂移效应,聚焦于气体的特征频段,因此它们作为输入时,模型的预测准确率远高于其他4个IMF分量.这与图11的结果相符合,进一步验证了EWT自动划分频谱的可靠性,表明EWT分解能够有效地将信号的能量分布映射到各个频率成分上,为模型提供更具代表性的输入.

卷积层通过提取局部空间特征,增强了模型对高频成分(IMF6)中的气体特征的捕捉能力.实验结果表明,添加卷积层的ConvGRU模型在单一气体(甲苯和二甲苯)识别中表现更优,尤其在IMF6频段中准确率显著高于纯GRU模型.这一结果说明卷积层在特征提取中扮演了重要角色,通过聚焦局部特征提升了对高频信息的敏感度,有效支持了气体种类的区分.

注意力机制能够进一步聚焦于最相关的信号成分,在全局信息捕捉上对卷积层进行补充.从图12可以看出,ConvGRU和ConvGRUAttention两个模型的Kappa系数均显著高于GRU模型.这一结果表明,加入卷积层和Attention模块后,模型在定性识别方面的效果得到了明显提升.具体而言,卷积层能够有效提取输入信号中的局部特征,而Attention机制则帮助模型集中关注最相关的信息,从而提升分类的准确性.

卷积层和注意力机制的结合实现了局部特征提取与全局信息建模的平衡:卷积操作降低了特征提取的计算复杂度,提升了对噪声的鲁棒性,而注意力机制则有效解决了卷积操作对全局依赖性的局限,使模型具备了对输入数据的动态选择能力.因此,卷积层和注意力机制的融合显著提升了模型在复杂环境下的定性和定量识别能力.综上所述,消融实验表明EWT、卷积层和注意力机制的引入在气体识别中是必要且有效的.

3.4 不同网络模型识别结果的对比

本节将提出的EWT-ConvGRUAttention模型与常用的几种网络模型进行比较,如支持向量机34、卷积神经网络35、门控循环单元36和时间卷积网络(temporal convolutional network,TCN)37等.这些对比方法在气体识别和浓度检测中具有一定的应用广度,能够为不同模型特性的分析提供参考.具体的对比结果见表3表4,其分别为各模型对测试数据集的定性和定量识别的结果.

表3可以看出,本文的ConvGRUAttention模型实现了对混合气体100%的定性识别准确率,定量识别均方根误差仅为3.3×10-6,显著优于其他算法.对比结果分析如下:

1) 从定性识别结果可以看出,各方法对混合气体的准确率均高于单一组分气体.这是由于混合气体的数据集规模大于单一气体,从而提供了更多的特征.其中,SVM对单一气体的准确率较高且稳定,这表明其适合处理小数量级的数据,但对高维信息处理困难.

2) EWT频谱划分结果和消融实验结果均表明了甲苯的特征信息是全频段分布的,二甲苯广泛分布于高频段.从定性识别结果可以看出,CNN对二甲苯的准确率高于甲苯,这是由于其缺乏捕捉全局信息的能力.而GRU和TCN与CNN正好相反,GRU通过门控机制能够对时序的依赖关系进行建模,TCN则依赖于因果卷积与扩张卷积的层次结构来捕捉时序关系,从而提取全频特征,故甲苯准确率高于二甲苯.此外,GRU模型在与EWT结合后识别准确率有所提升,但其识别率仍低于带卷积和注意力机制的模型,表明在复杂混合气体的识别中,仅靠门控机制的时序建模效果有限.

3) 在表4的定量识别结果中,可以看出CNN的单一气体和混合气体的RMSE均大于GRU,这表明其难以捕捉混合气体间的动态变化,序列建模能力薄弱,限制了模型的预测性能.同时也可以看出,CNN对甲苯的MAE远小于GRU和TCN,这是由于甲苯数据蕴含的噪声分布较分散,而卷积操作能减少异常值的影响.其次TCN的RMSE均高于GRU,且甲苯的RMSE也高于CNN,这是由于TCN的层次结构无法适应高噪声情况,对异常值的鲁棒性较弱,易产生极端预测偏差.

综上所述,与传统方法相比,本文的EWT-ConvGRUAttention模型在气体识别中的优越性主要体现在其混合架构的设计上.卷积操作和门控机制增强了模型的特征提取和时间依赖性建模能力,而Attention机制进一步加强了对关键信号成分的关注,减弱了噪声干扰.此外,EWT为模型提供了多尺度的时频域特征输入,较好地提取了信号中的高频和低频信息,在保留关键特征的同时减弱了数据的漂移效应,从而显著提高了模型的泛化性能.整体上,该模型能够同时关注气体的局部和全局特征,帮助捕捉气体的动态变化.这种混合特征学习方法使得模型不仅能够适用于气体种类的精准识别,同时也能对浓度进行高精度检测.

4 结 语

本文提出了1种基于卷积门控循环单元(ConvGRU)与注意力机制结合的气体识别方法,用于提升传感器在混合气体环境下的定性与定量识别能力.通过引入经验小波变换分解,将传感器信号扩展至时频域,实现了去除非线性趋势和噪声抑制,凸显了数据的特征.ConvGRU模块结合卷积和门控机制,能够高效提取局部空间特征与时序信息,而注意力机制进一步提升了模型对关键特征的聚焦能力.实验结果表明,本文方法在甲苯、二甲苯及其混合气体的检测中,定性识别的准确率达到100%,定量识别的均方根误差(RMSE)控制在3.3×10-6,显著优于传统方法.

尽管所提方法在气体识别中展现出优越性能,但仍存在计算复杂度较高、数据依赖性强、传感器响应时间限制等不足.未来的研究将致力于优化模型结构以提高实时性,探索更多数据增强技术以提升泛化能力,并扩展至其他多组分气体的识别以验证模型的通用性.

总之,本文研究为复杂气体环境中的高精度检测提供了一种有效的解决方案.

参考文献

[1]

Elansky N FPonomarev N AVerevkin Y M. Air quality and pollutant emissions in the Moscow megacity in 2005—2014[J]. Atmospheric Environment2018175: 54-64.

[2]

Afrasiabi SDarghlou M FMohammadi Yet al. Effects of short and long-term exposure to benzene, toluene, ethylbenzene, and xylenes (BTEX) in indoor environment air on human health: a systematic review and meta-analysis[J]. Journal of Air Pollution and Health20249(4): 551-566.

[3]

Soltanpour ZMohammadian YFakhri Y. The concentration of benzene, toluene, ethylbenzene, and xylene in ambient air of the gas stations in Iran: a systematic review and probabilistic health risk assessment[J]. Toxicology and Industrial Health202137(3): 134-141.

[4]

Edokpolo BYu Q JConnell D. Health risk assessment of ambient air concentrations of benzene, toluene and xylene (BTX) in service station environments[J]. International Journal of Environmental Research and Public Health201411(6): 6354-6374.

[5]

Litra DChiriac MAbabii Net al. Acetone sensors based on Al-coated and Ni-doped copper oxide nanocrystalline thin films[J]. Sensors202424(20): 6550.

[6]

Huang L QWu XLi X Bet al. Influence of sensor array on MS/AE source location accuracy in rock mass[J]. Transactions of Nonferrous Metals Society of China202333(1): 254-274.

[7]

Ji H YMi C JYuan Z Yet al. Multicomponent gas detection method via dynamic temperature modulation measurements based on semiconductor gas sensor[J]. IEEE Transactions on Industrial Electronics202370(6): 6395-6404.

[8]

Liu FWu H YZhao Y Get al. Mapping high resolution national soil information grids of China[J]. Science Bulletin202267(3): 328-340.

[9]

Ji H YYuan Z YZhu H Met al. Dynamic temperature modulation measurement of VOC gases based on SnO2 gas sensor[J]. IEEE Sensors Journal202222(15): 14708-14716.

[10]

Gudiksen M SLauhon L JWang J Fet al. Growth of nanowire superlattice structures for nanoscale photonics and electronics[J]. Nature2002415(6872): 617-620.

[11]

Rao Y J. In-fibre Bragg grating sensors[J]. Measurement Science and Technology19978(4): 355-375.

[12]

Le V H D. Method and apparatus for operating a gas sensor: US 3906473[P]. 1975-09-16.

[13]

Wu ZZhang HJi Het al. Novel combined waveform temperature modulation method of NiO-In2O3 based gas sensor for measuring and identifying VOC gases[J]. Journal of Alloys and Compounds2022918: 165510.

[14]

Lee A PReedy B J. Temperature modulation in semiconductor gas sensing[J]. Sensors and Actuators B: Chemical199960(1): 35-42.

[15]

Cai L XMiao G YLi Get al. A temperature-modulated gas sensor based on CdO-decorated porous ZnO nanobelts for the recognizable detection of ethanol, propanol, and isopropanol[J]. IEEE Sensors Journal202121(22): 25590-25596.

[16]

Nakata STakahara N. Distinction of gaseous mixtures based on different cyclic temperature modulations[J]. Sensors and Actuators B: Chemical2022359: 131615.

[17]

Kadlec PGabrys BStrandt S. Data-driven soft sensors in the process industry[J]. Computers & Chemical Engineering200933(4): 795-814.

[18]

Villa ABenediktsson J AChanussot Jet al. Hyperspectral image classification with independent component discriminant analysis[J]. IEEE Transactions on Geoscience and Remote Sensing201149(12): 4865-4876.

[19]

Ji H YLiu YZhang R Zet al. Detection and recognition of toluene and butanone in mixture based on SnO2 sensor via dynamic transient and steady-state response analysis in jump heating voltage mode[J]. Sensors and Actuators B: Chemical2023376: 132969.

[20]

Khurshid APani A K. An integrated approach combining randomized kernel PCA, Gaussian mixture modeling and ICA for fault detection in non-linear processes[J]. Measurement Science and Technology202435(7): 076208.

[21]

Ji H YZhu H MZhang R Zet al. Semiconductor sensor virtual array: gas detection strategy in Internet of Things to suppress humidity interference[J]. IEEE Internet of Things Journal202411(3): 4934-4941.

[22]

Zhang S WYuan Z YZhang Wet al. Strategy to expedite gas sensor calibration based on cyclic temperature operation and data augmentation[J]. Sensors and Actuators B: Chemical2024416: 136060.

[23]

Daubechies I. The wavelet transform, time-frequency localization and signal analysis[J]. IEEE Transactions on Information Theory199036(5): 961-1005.

[24]

Huang N EShen ZLong S Ret al. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J]. Proceedings of the Royal Society of London,Series A: Mathematical, Physical and Engineering Sciences1998454(1971): 903-995.

[25]

Gilles J. Empirical wavelet transform[J]. IEEE Transactions on Signal Processing201361(16): 3999-4010.

[26]

Hui A LYu JLu W Q. Research on rotor fault diagnosis technology of three-phase asynchronous motor based on NA-MEMD mutual information and SVM[J]. Measurement and Control202558(1): 110-118.

[27]

Liu TLi JCai X Fet al. A time-frequency analysis algorithm for ultrasonic waves generating from a debonding defect by using empirical wavelet transform[J]. Applied Acoustics2018131: 16-27.

[28]

Al-Musaylh M SAl-Daffaie KPrasad R. Gas consumption demand forecasting with empirical wavelet transform based machine learning model: a case study[J]. International Journal of Energy Research202145(10): 15124-15138.

[29]

Cao X GGuo X YDuan Yet al. Health status recognition method for rotating machinery based on multi-scale hybrid features and improved convolutional neural networks[J]. Sensors202323(12): 5688.

[30]

de Bruin TVerbert KBabuška R. Railway track circuit fault diagnosis using recurrent neural networks[J]. IEEE Transactions on Neural Networks and Learning Systems201728(3): 523-533.

[31]

Liu L ZHu C XOu T Set al. Selective detection of mixtures via a single nonselective sensor: making the unworkable sensor workable by machine learning[J]. Advanced Intelligent Systems20235(1): 2200136.

[32]

Vlachos DAvaritsiotis J. Fuzzy neural networks for gas sensing[J]. Sensors and Actuators B: Chemical199633(1/2/3): 77-82.

[33]

Karagulian FBarbiere MKotsev Aet al. Review of the performance of low-cost sensors for air quality monitoring[J]. Atmosphere201910(9): 506.

[34]

Yang MLi JLiu J C. Forecast model for gas well productivity based on PSO and SVM[J]. Applied Mechanics and Materials2011, 71/72/73/74/75/76/77/78: 1915-1919.

[35]

Kang M GCho IPark Jet al. High accuracy real-time multi-gas identification by a batch-uniform gas sensor array and deep learning algorithm[J]. ACS Sensors20227(2): 430-440.

[36]

Jia P TLiu H DWang S Jet al. Research on a mine gas concentration forecasting model based on a GRU network[J]. IEEE Access20208: 38023-38031.

[37]

Ma XWu FYan Jet al. TF-TCN: a time-frequency combined gas concentration prediction model for E-nose data[J]. Sensors and Actuators A: Physical2024376: 115654.

基金资助

国家自然科学基金资助项目(62071112)

国家自然科学基金资助项目(62033002)

中央高校基本科研业务费专项资金资助项目(N2201008)

中央高校基本科研业务费专项资金资助项目(N2304024)

河北省自然科学基金资助项目(F2020501040)

AI Summary AI Mindmap
PDF (4305KB)

326

访问

0

被引

详细

导航
相关文章

AI思维导图

/