基于深度学习的频高图自动标定

朱正平 ,  邢蕴辉

中南民族大学学报(自然科学版) ›› 2025, Vol. 44 ›› Issue (04) : 497 -506.

PDF (3218KB)
中南民族大学学报(自然科学版) ›› 2025, Vol. 44 ›› Issue (04) : 497 -506. DOI: 10.20056/j.cnki.ZNMDZK.20250409
物理与电子信息科学

基于深度学习的频高图自动标定

作者信息 +

Ionogram automatic scaling based on Deep-learning

Author information +
文章历史 +
PDF (3294K)

摘要

频高图是电离层测高仪地面探测电离层的常规数据,数据量大,电离层各种参数是需要进行逐一标定才能获取,传统上需要手工标定,费时费力且易出错,实现计算机辅助下的手动标定势在必行.为此提出了一种基于深度学习的频高图自动标定方法,基于U型结构并采用具有横向连接的特征金字塔作为连接结构,参照频高图手动标定数据,生成网络模型样本数据,然后随机选取部分数据作为训练数据输入,通过不断更新参数,使得网络模型的预测值逐渐接近真实值.结果显示,与自动标定程序ARTIST相比,文中所提出的模型在精度和召回率方面分别提高了8%和17%,且自动标定结果与手动标定结果相近.这表明基于深度学习方法自动标定的频高图可应用于全球电离层天气实时预报.

Abstract

Ionogram is the conventional data of ionospheric sounding by ionosonde on the ground. The amount of data is large. Various parameters of the ionosphere need to be scaled one by one to obtain. Traditionally, manual scaling is required but it is time-consuming, laborious and error-prone. It is imperative to realize computer-assisted manual scaling potential. Herein a deep-learning method for ionogram automatic scaling (DIAS) is presented, and the method is based on the U-shaped structure and using the characteristic pyramid with horizontal connection as the connection, using the data of manual scaling to generate the model sample data, and then randomly select part of the data as the training data input, so that the predicted value of the model gradually approaches the true value by constantly updating the parameters. The results show that compared with Automatic Real-Time Ionogram Scaling with True-height (ARTIST), the accuracy and recall rate of DIAS are improved by 8% and 17% respectively, and the results of DIAS are similar to those of manual scaling. This results shows that ionograms provided by deep-learning method can be applied to real-time global ionospheric weather nowcasting.

Graphical abstract

关键词

频高图标定 / 深度学习 / 电离层测高仪 / 电离层

Key words

ionogram scaling / deep-learning / ionosonde / ionosphere

引用本文

引用格式 ▾
朱正平,邢蕴辉. 基于深度学习的频高图自动标定[J]. 中南民族大学学报(自然科学版), 2025, 44(04): 497-506 DOI:10.20056/j.cnki.ZNMDZK.20250409

登录浏览全文

4963

注册一个新账户 忘记密码

电离层是距离地面60 km到1000 km的地球高层大气空域,由于受太阳短波辐射,整个区域内的大气层都处于部分电离或完全电离状态,其电子密度分布如图1所示.
电离层具有相当浓度的自由电子,能使无线电波改变传播速度,发生折射、反射和散射,产生极化面的旋转并受到不同程度的吸收,极大地影响了短波无线电长距离传输1.
电离层测高仪是地面观测研究电离层的主要常规设备2. 使用其绘制频高图,反映频率与虚高之间的关系. 通过提取频高图描迹获得各项参数,从而研究分析电离层的变化. 传统分析方法是手动标定频高图描迹,获取临界频率与虚高等重要参数,但该方法主要依靠经验丰富的工作者手动标定,不仅费时、费力且无法避免人为主观因素造成的标定差异. 因此,频高图的自动标定一直受到广泛关注.
频高图自动标定程序常作为标定频高图,提取参数的辅助工具,它降低了手动标定的工作量,例如自动标定E,F1,F2层,提取临界频率,虚高等参数.
目前,频高图自动标定程序主要以传统算法3和基于深度学习的算法4-5为主. 传统算法的频高图自动标定程序中应用最为广泛的是频高图实高实时自动标定6(Automatic Real-Time Ionogram Scaling with True-height,ARTIST),除了可以标定出频高图描迹提取参数外,它还采用了反演算法7实时计算电离层电子密度分布绘制剖面图,但ARTIST的自动标定存在误差,特别是对低信噪比数据,常常需要手动干预来减少标定误差. 此外,还有专用于AIS-INGV测高仪的Autoscala8,该程序在标定F2层时较为准确,但在标定E层与F1层时准确性大大降低. 另一种传统算法自动标定程序是专用于加拿大先进数字测高仪(Canadian Advanced Digital Ionosonde,CADI)的UDIDA9,其在标定扰动周期和夜间频高图时不如Autoscala准确10.
传统算法的频高图自动标定程序准确性不足,通常需要手动干预才能获得可靠的标定结果. 因此为了提高自动标定程序的准确性,中国科学院基于深度学习中的图像识别技术开发了一种频高图自动标定程序11,该自动标定程序性能与ARTIST相当,在标定foF1和foF2时准确性达到了91.4%.
本文提出了一种基于深度学习的频高图自动标定程序(Deep-learning method for ionogram automatic scaling,DIAS),其在标定E,F1,F2层时的性能超过了广泛使用的自动标定程序ARTIST. 本文通过先进的神经网络架构改善频高图标定性能,并通过比较DIAS,ARTIST和手动标定的精度、召回率、F分数、最大临界频率的平均绝对偏差(D-MCF)以及最小有效高度的平均绝对偏差(D-MEH)五个方面来评估该程序的性能表现.

1 DIAS模型介绍

1.1 DIAS模型结构

DIAS模型基于U型结构12,由编码器网络、译码器网络及连接结构三部分组成,如图2所示. 编码器网络主要负责提取和学习频高图标定的模式,也被称为模型的主干. 译码器网络主要负责对编码器网络输入的序列进行解码,输出目标序列. 连接结构负责融合特征提高图像分割精度,减少参数提升收敛速度.

1.2 标定流程

图3所示,在训练阶段开始时,随机初始化编码器与译码器网络中的大量可调参数,将频高图原始数据和手动标定结果输入后得到预测值,随后损失函数计算出预测值和手动标定结果的损失,更新网络中的参数,以使模型完成训练后更加准确. 在测试阶段时,使用阈值抛弃低置信度输出后,从剩余点中找出最大概率点,将其转化为标签值,输出最终点集.

2 DIAS模型标定实验

2.1 频高图数据构成

DIAS中使用的训练数据集包含29568张频高图,由三亚DPS-4D电离层测高仪(109.578°E,18.282°N)从2017年1月至2017年12月记录(WDC中国地球物理学科中心),共有三组频高图,第一组为频高图原始数据,第二组为手动标定数据,第三组为ARTIST自动标定数据. 测试数据集包含2975张频高图,由三亚DPS-4D电离层测高仪从2018年1月至2018年2月记录. 本文训练数据集横轴为频率(Frequency,F),纵轴为虚高(Virtual Height,VH),F从1.0 MHz开始,间隔为0.05 MHz,VH从80 km开始,间隔为2.5 km. 输入的频高图原始数据由O波,X波的振幅组成,手动标定数据与ARTIST自动标定数据都由O波在E层、F1层、F2层的描迹数据组成,三个矩阵大小相同,在应用DIAS模型前需要对每个通道按最大值进行归一化. 由于测高仪在观测过程中配置可能发生变化,频高图数据也会发生变化,因此需要对每个输入频高图补零填充,将其大小扩展到512 × 512,以满足网络的要求,同时还将绝对位置信息编码到模型中. 最终输出由三个点集组成,其分别对应着E层,F1层和F2层的标定数据,且每个点由虚高和频率两个坐标组成.

2.2 主干选择

通过比较不同主干下DIAS模型及ARTIST的精度、召回率、F分数、最大临界频率(mean absolute deviation of maximum critical frequency, D-MCF)和最小有效高度(mean absolute deviation of minimum effective height, D-MEH)的平均绝对偏差来评估DIAS性能,选择最佳主干.

编码器网络是模型的主干,主要由卷积层与池化层构成,负责提取和学习特征. 其中,卷积层是提取特征的基本模块,它在模型中的数量即网络深度对模型的精度具有巨大的影响13. 一般来说,模型的网络深度越高,其性能越好. 但网络深度的增加也会导致模型难以收敛与准确性饱和. 为了解决这一问题,本文采用深度残差学习,使用堆叠层来拟合残差映射F(x)=H(x)-x代替直接拟合所需的底层映射H(x)14,然后通过前向反馈神经网络添加捷径将原始映射更改为F(x)+x.

图4所示,U-net架构15的主干只有9个卷积层,这使得它的性能受到了限制. 为了进一步提高模型的精度,本文首先采用VGG-1616作为模型主干,将网络深度提高到16个卷积层,随后采用ResNet-50作为模型主干,通过神经架构搜索(Neural Architecture Search, NAS)平衡网络深度17,最后采用基于NAS设计的Efficient-B5作为模型主干,通过评估DIAS性能来比较主干之间性能差异.

精度和召回率是衡量模型性能的重要参数. 精度从预测结果角度出发,描述预测的正例结果中真实正例的数目,即预测正例的准确性,其定义如式(1)所示:

precision=TPTP+FP .

图5所示,式1中TP表示真实正例,它是自动标定为正例结果手动标定也为正例结果的次数. 式中FP表示错误正例,它是自动标定为正例结果手动标定为负例结果的次数. 召回率从真实正例结果角度出发,描述测试集中真实正例的数目,即真实正例被模型召回的比例,其定义如式2所示:

Recall=TPTP+FN

式(2)中FN表示错误负例,它是自动标定为负例结果手动标定为正例结果的次数.

图5中TN表示真实负例,它是自动标定为负例结果手动标定为负例结果的次数.

F分数是统计学中用来衡量二分类模型精度的一种指标,它同时兼顾模型的准确率和召回率,其定义如式(3)所示:

F-score=2×Precision×RecallPrecision+Recall

F分数可以看作是准确率和召回率的一种加权平均,它的最大值是1,最小值是0,值越大表明模型越好.

由于MCF和MEH对电离层电子密度的反演具有重要影响,因此在比较DIAS模型和ARTIST性能时还需增加D-MCF和D-MEH两项参数.

本文在阈值、损失函数等配置完全相同的情况下进行训练与测试后对DIAS模型和ARTIST进行性能评估,其在E层、F1层、F2层上的复合标定性能如表1所示.

表1所示,主干为VGG-16和ResNet-50的DIAS模型相比于ARTIST模型在精度、召回率、F分数分别高出约7%、12%、10%,在D-MCF和D-MEH分别高出约1.1和4.2分. 主干为EfficientNet-B5的DIAS模型精度最高,但召回率最低,原因可能是EfficientNet-B5多用于自然图片数据集, 因此在频高图数据集上传输效果不佳. 结果显示,主干选择ResNet50最为合理.

2.3 连接结构比较

U型结构的连接结构主要负责融合特征提高精度,减少参数提升收敛速度,有助于深层网络训练. 其特征融合能力越强,模型的精度越高,收敛速度越快.

图4所示,U-net架构采用了跳跃连接,将池化结果与编码器中具有相同分辨率的子模块的输出进行连接,作为解码器中下一个子模块的输入. 编码器网络通过各个池化层把特征图分辨率降为极小,不利于精确的分割特征生成,通过连接结构将特征融合,更利于分割特征生成.

为提升模型精度,采用特征金字塔网络(Feature Pyramid Network,FPN)18作为连接结构,但传统的特征金字塔用于帮助算法实现不同级别的输入,通常不用于深度学习. 因此本文采用一种具有横向连接的自上而下的特征金字塔网络架构19,如图6所示.相比于U-net架构采用的跳跃连接,FPN可以在不同级别的特征图之间进行更多的信息交换,从而提高DIAS的标定精度20.

本文分别采用FPN替换各主干的跳跃连接,通过评估DIAS模型精度来比较两种连接结构的差异.

表2所示,使用FPN模块评估DIAS标定性能时,与跳跃连接模块相比,以VGG-16和ResNet-50为主干的DIAS模块的召回率与F分数分别增加约5%和3%,同时以ResNet-50为主干的DIAS模型在所有层中其召回率,精度都为最高,D-MCF及,D-MEH与之前的性能较为接近.

2.4 损失函数及阈值设置

损失函数同样对模型的精度具有影响. 在训练阶段时,将频高图原始数据和相应的手动标定数据送入DIAS模型后输出预测值,损失函数会计算出预测值和真实值之间的损失值. 得到损失值后,DIAS模型更新编码器网络和译码器网络内的大量可调参数,降低真实值与预测值之间的损失,使得生成的预测值接近真实值,以使模型更加准确21.

交叉熵损失(Cross Entropy Loss, CE)是最为常用的损失函数,主要用于衡量两个分布的相似程度,分布越相似,交叉熵越小,原始公式如式4所示.

CEp,y=-logp,y=1-log1-p,other

式(4)y{0,1}表示手动标定,p[0,1]表示DIAS模型对该点的预测. 为了计算方便,定义并重写交叉熵如式(5)所示:

CEp,y=CEpt=-logpt,pt=p,y=11-p,other .

但采用交叉熵损失函数的缺点是容易分类的点也会产生一个不小的数量级22. 在频高图自动标定过程中,背景点的数目远远超过层点的数目,如果在频高图中添加大量的背景点,则背景点的损失值将会超过层点的损失值,出现类不平衡问题23. 为了解决该问题,在交叉熵损失函数中添加了一个调制因子并提出一个全新的损失函数,将其命名为焦点损失(Focal Loss,FL)24,其公式如式(6)所示.

FL(pt)=-(1-pt)γlog(Pt),γ0.

如果一个样本分类良好,则pt接近于1,调制因子接近于0,且简单样本的损失是降权的.

本文还分别使用不同的损失函数和阈值来评估DIAS的标定性能,结果表明,使用二元焦点损失函数设置γ=2的DIAS模型能以更平衡的方式标定E、F1、F2层,当阈值设置为0.3时,其能平衡精度与召回率,且还能保持高点精度.

2.5 DIAS模型最佳配置

F分数为最重要的参数,并平衡D-MCF和D-MEH,得出DIAS模型的最佳配置是使用ResNet-50作为主干,使用FPN模块作为连接结构,选取二元焦点损失函数,并将阈值设置为0.3. 以手动标定结果作为参考,使用2018年1月三亚电离层测高仪记录的2975个频高图数据,比较DIAS模型和ARTIST程序的标定性能.

图7所示,相比于ARTIST,DIAS模型在精度、召回率、F分数方面分别提升了8%、17%、13%,表明DIAS模型在各个方面都已超过ARTIST程序,且因其95. 79%的精度和90. 46%的召回率,在标定时更为可靠.

图8(a)与图8(b)显示,相比于ARTIST,D-MCF和D-MEH分别提升了1.1分和3.9分,,DIAS模型的误差分布更集中于零附近,因为ARTIST可能会丢失层边界附近的噪声数据点,所以其更倾向于给出正EH偏差和负CF偏差. 通过对比可知,DIAS模型在逐层识别和逐点标定精度都更优于ARTIST程序.

3 DIAS模型标定结果

DIAS模型训练过程准确率和损失函数变化如图9所示,随着迭代次数的增加,模型准确率逐渐提高,模型收敛性能较好.

为了测试DIAS自动标定的性能,采用安装在三亚(北纬109.62°,东经18.34°)的DPS-4D测高仪获得的2018年6月—12月的35712张频高图(WDC中国地球物理学科中心). 将自动标定结果与手动标定结果进行比较,在这些频高图中,92.3%的DIAS自动标定foF2的误差在±0.2 MHz以内,自动标定的描迹与原始频高图的O波吻合良好. DIAS和ARTIST在2018年7月至2018年12月期间的自动标定准确率如图10所示. DIAS正确标定不同时间,不同类型的频高图示例如图11所示.

图10显示了DIAS和ARTIST在2018年7月至12月期间自动标定的准确率比较. 结果显示相比于ARTIST,DIAS在每个月的频高图自动标定准确率都较高,且标定得到的描迹曲线更为平滑.

图11(a)和图11(d)为午夜时段频高图及标定结果,此时E层和F2层同时存在,DIAS模型可以较好的标定出描迹,如图11(g)所示,E层与F2层的自动标定结果与手动标定结果几乎重合在一起,E层自动标定描迹存在一定误差,但误差小于0.2 MHz,DIAS模型在该时段标定F2层更为精确,误差较小. 图11(b)和图11(e)为夜间时段频高图及标定结果,此时只存在F2层,DIAS模型可以正确标定出F2层,如图11(h)所示,自动标定结果与手动标定结果完全重合. 图11(c)和图11(f)为凌晨时段频高图,此时存在E层、F1层和F2层,DIAS模型能较为精确地标定E层与F1层描迹,如图11(i)所示,在标定E层与F1层时自动标定结果与手动标定结果吻合良好,在标定F2层时存在误差但误差小于0.2 MHz. 图11显示DIAS模型自动标定准确性良好,误差较小.

在35712张频高图中,有1672张频高图几乎无法通过自动标定或是手动标定获得描迹,这些频高图可能存在严重的噪声、强烈的干扰或非常微弱的痕迹. DIAS模型在这些特殊情况下如零星E层、扩散F层等仍然能够进行标定,如图12所示,ARTIST自动标定在该情况下准确性不足,而DIAS自动标定仍具有一定的准确性.

图12显示了在零星E层的特殊情况下,DIAS模型仍能够正确标定频高图,与手动标定结果相近,不受影响,且在标定其他层时DIAS自动标定的精度超过ARTIST自动标定,并与手动标定结果相近. 如图12(c)、12(f)、12(i)和12(g)所示,ARIST在自动标定F1层时将F2层错误标定为F1层,进而导致F2层也标定错误,这将使得F1层与F2层的临界频率参数错误.

由于电离层回波不直接进入接收机,而是从地面反射后回到电离层,再从电离层反射后回波在第二次反射时进入接收机. 如图13所示,原始频高图中除了完整的F2层,还包含了一些第二反射层.

由于多路径反射,第二反射层的形状与真实回波相似,第二反射层的高度是真实回波的两倍. ARTIST自动标定常需要去除第二反射层才能精确提取F层实现自动标定. 此外,ARTIST自动标定在标定过程中描迹不够平滑,如图12(f)所示,F1层描迹末端曲线向下凸出,无法获得平滑描迹曲线. 但DIAS自动标定则不存在这些问题,在经过训练后,DIAS自动标定能够在具有多个反射层的频高图中准确标定出频高图各层描迹,同时在一些噪声、干扰等较为强烈的频高图中仍具有一定的准确性,其标定性能超过ARTIST自动标定.

为了增强DIAS模型的可用性,本文基于DIAS开发了名为IonoAutoScale的软件,用于处理单个频高图,分析历史数据,软件界面如图14所示.

该软件能够读取. GRM文件获得原始频高图,并能够对其中的单个频高图进行自动标定,输出foE,foF1等重要参数,通过性能比较功能可以直观的看到DIAS自动标定的准确性.

以上结果表明,DIAS标定E与F1层时准确性更高,当E、F1、F2三层同时存在时DIAS标定性能最佳,且频高图越清晰标定效果越好. 此外,当前类型的训练数据集限制了DIAS的性能,随着未来训练数据集的逐步完善,DIAS的性能可能会大大提高.

4 结语

本文提出的DIAS模型、其精度、召回率、F分数、D-MCF、D-MEH分别为95.67%、90.32%、92.85%、1.9743、2.9883,能够精确快速地自动标定频高图,并与手动标定结果相近. 使用Tesla V100处理测试数据集的35712张频高图,应用最佳模型测试时大约需要120 min,得到的自动标定结果较为接近手动标定结果. 但是,该DIAS模型是在低纬度频高图数据集上训练的,因此它在中纬度和高纬度频高图进行自动标定时可能表现不佳.本文展示了深度学习方法如何有效地处理频高图标定,并为全球电离层实时预报提供强大的工具.

参考文献

[1]

朱正平, 宁百齐. 电离层垂直探测中扰动观测模式研究[J]. 电波科学学报2007(5): 760-766.

[2]

朱正平, 展旭强. 电离层测高仪高速采集系统设计[J].中南民族大学学报(自然科学版)202039(2): 186-194.

[3]

丁宗华, 宁百齐, 万卫星. 电离层频高图参数的实时自动度量与分析[J]. 地球物理学报2007(4): 969-978.

[4]

鲁转侠, 华彩成, 蔚娜, . 基于深度卷积神经网络的频高图分类研究[J]. 地球物理学进展202237(5): 1834-1839.

[5]

朱正平, 吴仁喜. 基于BP神经网络的电离层频高图F层参数自动度量方法[J]. 中南民族大学学报(自然科学版)201534(2): 74-79.

[6]

REINISCH B WHUANG X Q. Automatic calculation of electron density profiles from digital ionograms, 3, Processing of bottomside ionograms[J]. Radio Sci198318(3): 477-492.

[7]

郑传青. 垂直探测频高图的反演[J]. 电波科学学报1992(4): 64-74.

[8]

SCOTTO CPEZZOPANE M. The INGV software for the automatic scaling of foF2 and MUF(3000)F2 from ionograms: A performance comparison with ARTIST 4.01 from Rome data[J]. Atmospheric and Solar-Terrestrial Physics200567(12): 1063-1073.

[9]

PILLAT V GGUIMARAES L N FFAGUNDES P Ret al. A computational tool for ionosonde CADI’s ionogram analysis[J]. Computers & Geosciences201352(3): 372-378.

[10]

PEZZOPANE MPILLAT V GFAGUNDES P R. Automatic scaling of critical frequency foF2 from ionograms recorded at São José dos Campos, Brazil: A comparison between Autoscala and UDIDA tools[J]. Acta Geophys201765(1): 173–187.

[11]

CHEN ZGONG ZZHANG Fet al. A new ionogram automatic scaling method[J]. Radio Sci201853(9): 1149-1164.

[12]

GHOSH PBERKEY F T. Autonomous identification and classification of ionospheric sporadic E in digital ionograms [J]. Earth and Space Science20152: 244-261.

[13]

周飞燕, 金林鹏, 董军. 卷积神经网络研究综述[J]. 计算机学报201740(6): 1229-1251.

[14]

HE KZHANG X YREN S Qet al. Deep residual learning for image recognition[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Las Vegas: IEEE, 2016: 770-778.

[15]

RONNEBERGER OFISCHER PBROX T. U-Net: Convolutional networks for biomedical image segmentation[J]. ArXiv2015, abs/1505.04597.

[16]

SIMONYAN KZISSERMAN A. Very deep convolutional networks for large-scale image recognition[J]. ArXiv. 2014, abs/1409.1556.

[17]

TAN MLE Q. EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks[J]. ArXiv2019, abs/1905.11946.

[18]

李宝根. 基于特征金字塔网络的图像关键点检测算法研究[J]. 计算机应用与软件202138(9): 205-213.

[19]

LIN TDOLLA´R PGIRSHICK Ret al. Feature pyramid networks for object detection[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Honolulu: IEEE, 2017: 936-944.

[20]

瑚琦, 卞亚林, 王兵. 基于改进特征金字塔的小目标增强检测算法[J]. 光学仪器202244(5): 14-19.

[21]

谢银成, 黎曦, 李天, . 基于改进ResNet和损失函数的表情识别[J]. 自动化与仪表202237(4): 64-69.

[22]

黄庆康, 宋恺涛, 陆建峰. 应用于不平衡多分类问题的损失平衡函数[J]. 智能系统学报201914(5): 953-958.

[23]

杨莲, 石宝峰. 基于Focal Loss修正交叉熵损失函数的信用风险评价模型及实证[J]. 中国管理科学202230(5): 65-75.

[24]

LIN TDOLLA´R PGIRSHICK Ret al. Focal loss for dense object detection[J]. IEEE Trans Pattern Anal Mach Intell202042(2): 318-327.

基金资助

国家自然科学基金资助项目(41474135)

AI Summary AI Mindmap
PDF (3218KB)

223

访问

0

被引

详细

导航
相关文章

AI思维导图

/