可编程衍射神经网络的单流信息符号识别方法

张朕尧 ,  金梁 ,  肖帅芳 ,  马克明 ,  李泊明

信息工程大学学报 ›› 2025, Vol. 26 ›› Issue (04) : 386 -392.

PDF (2797KB)
信息工程大学学报 ›› 2025, Vol. 26 ›› Issue (04) : 386 -392. DOI: 10.3969/j.issn.1671-0673.2025.04.002
信息与通信工程

可编程衍射神经网络的单流信息符号识别方法

作者信息 +

Single-Stream Information Symbol Recognition Method Based on Programmable Diffraction Deep Neural Network

Author information +
文章历史 +
PDF (2863K)

摘要

针对传统信息符号识别方法依赖于接收机后端的一系列信号处理和基于深度学习的信息符号识别方法中存在的训练数据实时获取难、计算资源成本高等问题,提出一种基于可编程衍射神经网络(PD2NN)的单流信息符号识别方法。首先,将信息符号的识别问题转换为对接收天线处电磁波的识别,提出基于PD2NN的单流信息符号识别模型;其次,设计一种基于自适应矩估计(ADAM)的PD2NN参数训练方法;最后,PD2NN网络通过判断与接收符号距离最小的信息符号类别,实现对单流信息符号的识别。仿真结果表明,所提方法可以实现与传统接收机方法相当甚至更好的误码率性能,并且能够在较低的训练成本条件下完成单流信息符号识别。

Abstract

Aiming at the problems of traditional information symbol recognition methods relying on a series of signal processing at the receiver backend and the difficulties in obtaining training data in real time and the high cost of computing resources in deep learning based the information symbol recognition methods, a single-stream information symbol recognition method based on a programmable diffraction deep neural network (PD2NN) is proposed. Firstly, the problem of information symbol recognition is transformed into the recognition of electromagnetic waves at the receiving antenna, and a single-stream information symbol recognition model based on PD2NN is proposed. Secondly, a PD2NN parameter training method based on adaptive moment estimation (ADAM) is designed. Finally, the PD2NN network is used to recognize the single stream information symbol by judging the type of information symbol with the smallest distance from the received symbol. Simulation results show that the bit error rate of the proposed method is comparable to or even better than that of the traditional receiver method, and the symbol recognition of single-stream information under the condition of lower training cost can be achieved.

Graphical abstract

关键词

可编程衍射神经网络 / 信息符号识别 / 电磁波识别 / 自适应矩估计

Key words

PD2NN / information symbol recognition / electromagnetic wave recognition / ADAM

引用本文

引用格式 ▾
张朕尧,金梁,肖帅芳,马克明,李泊明. 可编程衍射神经网络的单流信息符号识别方法[J]. 信息工程大学学报, 2025, 26(04): 386-392 DOI:10.3969/j.issn.1671-0673.2025.04.002

登录浏览全文

4963

注册一个新账户 忘记密码

在无线通信系统中,信息符号识别作为通信链路的关键环节,其准确性直接决定了通信系统的误码率和有效信息传输速率等关键性能指标[1]。特别是随着无线通信系统向高频段、高移动性等场景发展,信息传输速率显著提升和无线信道变化加剧,需要在极短时间内完成对大量数据的处理,对信息符号识别的效率提出了更高的要求。
传统的信息符号识别方法需要已知信道的精确统计特性以及噪声的分布等参数。然而,这些参数的获取依赖于接收机内一系列的信号处理过程[2]。但是各信号处理模块独立的设计和模块之间的匹配设计中存在性能损失,将严重影响信息符号识别的效果。因此,需要突破传统信号处理框架的局限,对传统的信息符号识别方法进行优化。
近年来,深度学习以其强大的数据特征提取和学习推理能力,在信息符号识别中展现出巨大的应用潜力[3-5]。例如,文献[6]提出基于深度学习的端到端通信系统,通过深度神经网络(Deep Neural Network, DNN)的联合训练,实现了通信系统中各模块联合最优,并在加性高斯白噪声(Additive White Gaussian Noise, AWGN)信道下实现了对二进制相移键控(Binary Phase Shift Keying, BPSK)符号的准确识别。文献[7]利用信道采样数据和自编码器在信道采样误差等非理想条件下实现了正交相移键控(Quadrature Phase Shift Keying, QPSK)符号的识别,并表现出了优于传统方法的性能。虽然基于深度学习的信息符号识别方法与传统接收机相比表现出了较好的性能,但在实际应用中仍面临着诸多问题[8-10]。例如,静态训练的模型难以自适应动态变化的无线环境,同时大量神经网络参数的训练对计算资源提出了更高需求。
由大量可配置无源电磁元件组成的信息超材料[11-12],能够在电磁波的传播过程中调控其振幅、相位和极化等特性。作为信息超材料的一种,数字编码超表面与深度神经网络中的网络层结构相似。基于此,现有研究利用多层透射数字编码超表面实现可编程衍射神经网络(Programmable Diffractive Deep Neural Network, PD2NN)架构[13]。文献[13]中将携带不同种类图像信息的电磁波经过PD2NN处理后,在输出层通过检测对应端口的电磁波能量分布识别出图像,表明PD2NN在电磁域执行电磁波计算的优势和实现模式识别的能力。同样从场波域的视角审视无线通信中的信号传播,携带不同信息符号的电磁波具有不同的电磁特征。由此,探索利用PD2NN执行深度学习的优势进行信息符号识别,有望突破现有信息符号识别方法面临的瓶颈。
基于上述思想,本文面向单流信号通信场景,开展PD2NN在数字调制信息符号识别领域的探索性研究,设计一种基于PD2NN的单流信息符号识别方法。首先分析了单流信息符号在电磁域的可分性,将对信息符号的识别问题转换为对接收天线处电磁波的识别问题。其次,利用PD2NN分类不同特征电磁波的能力,提出基于PD2NN的单流信息符号识别模型。再次,提出基于自适应矩估计(Adaptive Moment Estimation, ADAM)的PD2NN参数训练方法,通过训练使其具备识别信息符号的能力。最后,PD2NN网络通过判断与接收符号距离最小的信息符号类别,实现对单流信息符号的识别。仿真结果表明,本文所提方法具有较好的误码率性能。

1 系统模型

1.1 单流信息符号在电磁域的可分性

面向单流信息符号识别的场景,考虑一个SISO通信系统,在远场通信条件下,单天线发射机可以看作一个点电流源[14]。假设单天线发射机和接收机的三维空间位置分别为r'r,假设采用BPSK调制方式,则在发射端存在两种信息符号Si, i=1,2。每种信息符号Si经过调制在发射天线上形成对应的电流分布Ji(r',ω),i=1,2,其中ω代表电磁波频率。发射天线依据调制不同符号的电流分布,辐射不同特征的电磁波到自由空间中,则符号Si在接收天线r处形成的电场和磁场可分别表示为[15]

Ei(r,ω)=jωμG(r,r')Ji(r',ω)d3r'
Hi(r,ω)=×G(r,r')Ji(r',ω)d3r'

式中:j=-1表示复数单位;μ表示自由空间的磁导率;G(r,r')表示并矢格林函数,描述了电磁波从位于r'的辐射源点出发到接收天线r的传播过程。假设无线传播环境短时间内不发生变化,即G(r,r')不发生变化。由式(1)式(2)可以看出,到达接收天线处的电磁场仅取决于当前时刻的辐射电流源Ji(r',ω),则不同的BPSK符号Si在接收天线口面处形成不同的电磁场分布[Ei,Hi],如图1所示。此时,接收端对信息符号Si的识别等价于对接收天线处电磁波的识别。

进一步假设发送端发送的信号共包含Q种信息符号,则携带这Q种信息符号的电磁波在经过相同的无线传播环境后到达接收天线时,将会形成Q种对应的电磁波。这些电磁波的差异性源于信息符号在调制过程中对电磁波幅度、相位或者频率的改变,使得每种信息符号在电磁域具有可分性。

1.2 基于PD2NN的单流信息符号识别模型

PD2NN能够在电磁波的传播过程中操控其幅度和相位,从而控制其传播特性,将不同特征的电磁波输入映射为可识别的电磁波输出。基于此,针对单流信号通信场景下的信息符号识别,提出了一种基于PD2NN的单流信息符号识别模型,如图2所示。将一个由L层透射式信息超表面组成的PD2NN部署在接收天线前端,超表面相邻单元的间距为d,相邻超表面之间以及最后1层超表面与接收天线之间的距离为D。其中:第1层超表面作为输入层,对经过无线环境传播到达此处信息符号进行采样,并透过输入层超表面继续向下传播;其余(L-1)层超表面作为中间层,处理输入层采样传播过来的信息符号并继续向下传播;接收天线作为输出层,对经过中间层超表面处理后的信息符号进行识别。

={1,2,,L}𝒩={1,2,,N}表示PD2NN的超表面集合和每一层超表面的单元集合,其中N=Nx×Ny,第l层超表面的透射调控系数向量可表示为

Wl=AlejΘl=[a1lejθ1l,a2lejθ2l,,aNlejθNl]CN×1

式中:AlejΘl表示第l层超表面的幅度调控系数向量和相位调控系数向量;anlejθnl代表第l层中第n个单元的透射调控系数,θnl0,2π。令Tl代表层间传播矩阵,l=1,2,,L。根据Rayleigh-Sommerfeld衍射方程[16],第l层的第n个单元与第(l+1)层的第n'个单元之间的传输路径可表示为

tnn'l=zn'l+1-znlr212πr+1jλej2πrλ

式中:xnl,ynl,znl表示第l层的第n个单元的空间坐标;xn'l+1,yn'l+1,zn'l+1表示第(l+1)层的第n'个单元的空间坐标;r=xnl+1-xn'l2+ynl+1-yn'l2+znl+1-zn'l2表示两个单元之间的空间距离。

因此可得,由L层超表面组成的从输入层到接收天线之间的传输矩阵G可以表示为

G=TLWLTL-1WL-1T1W1

考虑异构散射环境下的远场传播场景,将发射机与第1层超表面之间的信道H建模为多径信道。假设发射机发射出的信号经过P条径到达PD2NN的第1层超表面,则有H~CN(0, δIP)CP×1。其中,δ是依赖于传播距离的路径损耗。第p条路径到达第1层超表面的角度为Ωp=φp,ψp1<p<Pφpψp分别表示第p条路径到达输入层超表面的方位角和俯仰角。那么信号经过第p条路径到达输入层超表面的阵列流形矩阵可以表示为[17]

aΩp=aφp,ψp=ayΩpyaxΩpxCN×1

式中:ayΩpyaxΩpx的定义如下:

ayΩpy=ejΩpyny-1,ny=1,2,,Ny
axΩpx=ejΩpxnx-1,nx=1,2,,Nx

式中:ΩpyΩpx的表达式分别如下:

Ωpy=kdsin(φp)cos(ψp)
Ωpx=kdsin(φp)sin(ψp)

式中,k=2π/λ,表示波数。则信号到达输入层超表面的阵列流形矩阵可以表示为

AΩ=aΩ1,aΩ2,,aΩPCN×P

发射端发送信息符号S,则被输入层超表面空间采样的信息符号可表示为:

Yin=AHS+Z

式中,Z~CN(0,σ2)C1×M表示服从复高斯分布的加性白噪声,σ2表示噪声功率。则到达接收天线的信息符号可表示为

Yout=GAHS+Z

1.3 问题提出

为了使输出层能够识别出信息符号Yout,需要发送训练符号对PD2NN中间层超表面单元的透射调控系数进行训练。假设输出层已知每个训练符号对应的标签信息符号Y^,通过训练,PD2NN能够将到达输入层的信息符号Yin转换为输出层已知的标签信息符号Y^,即存在如下映射关系:

Y^=Yout=fPD2NN(Yin)

此外,在训练过程中,为了减少训练符号的开销,利用超表面单元电磁状态快速切换特点,输入层在每个训练符号周期内进行多次空间采样,获得多组表示携带该信息符号的电磁波数据,中间层超表面对输入层采样的多组电磁波数据进行多次训练,即在每个训练符号周期内更新多次网络参数。为此,以输出层已知的标签信息符号和实际接收信息符号之间的差异为损失函数,并以最小化损失函数为目标训练PD2NN网络参数,则第m个符号的训练目标如优化问题1所示:

minWl,l=1,2,,Llloss=Y^m-Ymout,s.t. Wl=a1lejθ1l,a2lejθ2l,,aNlejθNlCN×1;       anl=1, n=1,2,,N;       θnl0,2π, l=1,2,,L

其中:Y^m表示输出层已知的第m个训练符号的标签信息符号;Ymout表示第m个训练符号的实际输出符号。基于以上思想,提出一种基于PD2NN的单流信息符号识别方法。

2 基于PD2NN的单流信息符号识别

基于PD2NN的单流信息符号识别方法包括两个步骤:导频训练阶段,基于ADAM算法对PD2NN参数进行训练,训练其识别信息符号的能力;业务数据阶段,PD2NN网络输出层通过判断与接收符号距离最小的信息符号类别,识别当前接收符号。

2.1 基于ADAM的PD2NN参数训练

在每一帧的导频训练阶段,接收端已知导频符号作为输出层的标签信息符号,即Y^m=Sm。考虑超表面单元透射调控系数连续取值的情况和加快网络参数的收敛速度,采用基于梯度下降策略的ADAM算法[18]训练PD2NN参数。具体而言,通过计算优化问题1中的损失函数相对于每一层超表面单元透射调控系数的偏导数,从而确定参数的更新方向和步长。具体步骤如下。

步骤1,计算当前迭代t时刻相移的偏导数:

gtl=llossΘl=llossYmLYmLWlWlΘl=llossYmLQdiag(jWl)
YmLWl=Q=Tldiag(Tl-1(Wl-1HSm))

式中,llossYmL可表示为

llossYmL=Y^m-YmLH

步骤2,然后根据历史梯度计算一阶动量和二阶动量:

mt=β1mt-1+1-β1gtl
vt=β2vt-1+1-β2gtl

式中:mtvt分别表示当前迭代时刻累积的一阶动量和二阶动量;mt-1vt-1分别表示前一迭代时刻累积的一阶动量和二阶动量;β1β2分别表示一阶矩衰减率和二阶矩衰减率;gtl表示当前在时刻t步骤1中求得的梯度。

步骤3,计算当前t时刻的下降梯度:

ηt=αmt /vt

式中,α表示初始学习率。

步骤4,根据梯度更新(t+1)时刻的波计算向量:

Θt+1l=Θtl-ηt
Wt+1l=Wtle-jΘt+1l

步骤5,使用指数衰减策略以导频符号周期T为间隔调整学习率,在训练初期使用较大的学习率以加快收敛,随后逐渐减小学习率以提高精度:

αt+T=ραt

式中,ρ表示学习率衰减因子。重复步骤1~步骤5数次后,优化问题1中的损失函数将逐渐趋于收敛。此外,为了减少陷入局部最优解的概率,在训练前首先生成多组PD2NN网络参数,然后选取lloss最小的一组初始化PD2NN的状态。

2.2 单流信息符号识别

在每一帧的业务数据阶段,将经过导频阶段训练获得的网络参数固定下来。此时,对每一个经历与导频阶段相同无线传播环境的业务数据符号而言,经过PD2NN处理后输出预测符号Yout。假设采用某种调制方式有Q种信息符号Yq1<q<Q,在这Q种信息符号中,与预测符号之间距离最小的符号就是当前信息符号所属的类别,如优化问题2所示:

minYqYout-Yq, 1<q<Q

输出层通过优化问题2对接收到的预测符号进行判决,从而识别出信息符号,并根据映射关系恢复出比特信息。

2.3 计算复杂度分析

PD2NN是DNN的一种物理实现,训练参数的规模是NL-1。假设一个具有相同层数和神经元数目的DNN[19],其训练参数规模为N2(L-1)+N,则在本文提出的参数训练方法下,两者的计算复杂度如表1所示。

表1中:I表示PD2NN训练的迭代次数,假设在导频阶段共发送M个训练符号,并且每个符号周期内网络状态更新迭代K次,则有I=MKI'表示DNN训练的迭代次数,更大规模的网络参数训练需要更多的迭代次数,即有I'>I。由表1可知,PD2NN训练消耗的计算资源更小,并且基于电磁波传播的模拟计算方式具有更快的计算速度。

3 仿真结果与分析

假设自由空间的路径传播损耗为2,两条径的距离差满足多径时延远小于符号周期,接收端已知原始导频符号作为训练阶段的标签信息符号。ADAM算法的初始学习率和学习率衰减因子设置为0.05和0.5,一阶动量和二阶动量设置为0.9和0.999,所有仿真都进行了1 000次蒙特卡洛。仿真参数如表2所示。

3.1 方法有效性验证

图3给出了当调制方式为QPSK、16QAM和64QAM时,所提方法的误码率随信噪比变化曲线。设置导频阶段发送4个训练符号,在每个导频符号周期内迭代20次网络参数,则在导频阶段需要对中间层超表面的电磁状态进行80次更新,每次迭代更新的参数数目是中间层超表面的单元数N=64。从图4中可以看出,所提方法对于每种数字调制方式的误码率都能在适中的信噪比条件下达到10-5以下。

3.2 算法初始学习率和衰减因子对性能的影响

图4图5给出了相同仿真条件设置下,不同初始学习率和衰减因子对QPSK信息符号识别的误码率曲线。从图4的曲线中可以观察到,在学习率衰减因子固定为0.5的条件下,误码率随着初始学习率的增加而下降。这是因为在适中的学习率衰减因子下,较高的学习率会使得训练过程中参数更新的步长较大,可能收敛到局部最优解,导致训练结果变差,从而影响最终的识别精度。从图5可以看到,在初始学习率设置为0.1的条件下,误码率随着学习率衰减因子的提高而下降,同样也说明了在合适的初始学习率下,较高的学习率衰减因子会导致训练结果跳出全局最优解,影响误码率结果。因此,在实际应用中,可以选取较低的初始学习率和适中的学习率衰减因子,从而获得较好的性能。

3.3 信息超表面层数和单元数对性能的影响

假设调制方式为QPSK,信噪比为12 dB,导频阶段发送4个训练符号,每个符号周期内迭代更新20次网络参数,训练阶段共进行80次网络参数迭代。

图6给出了所提方法的误码率随中间层超表面数目的变化曲线。起初,随着中间层超表面数目的增多,误码率逐渐下降。因为随着超表面数目的增多,PD2NN中调控电磁波的维度增多,提取电磁波信息特征的能力增强,使得到达输出层接收天线口面处的电磁波更接近于期望的电磁波,提升接收天线对电磁波的识别精度。之后,随着超表面数目的增加误码率又出现微弱上升。这是由于随着层数增加,输入层到输出层之间的传播距离也随之增加,加剧电磁波在PD2NN内部传播过程中的衰减。距离增加产生的衰减超过超表面数目增多带来的增益,使得在相同信噪比和导频符号数条件下的误码率有所损失,可通过增加导频符号数目和网络训练迭代次数来提升性能。

图7给出了所提方法的误码率随每一层超表面单元数的变化曲线。可以看出,随着每一层超表面单元数的增多,误码率性能呈现出下降的趋势,这是因为单元数的增多使得输入层超表面采样电磁波的信息增多和中间层超表面学习采用数据特征的能力增强,但是由于信噪比的约束,误码率不会随着单元数增多无限制的降低。

3.4 与传统信息符号识别方法的性能对比

与在天线后端通过信道补偿方法进行信息符号识别时的误码率进行了对比。假设调制方式为QPSK,导频阶段发送4个训练符号。图8给出了本文方法在中间层层数为1层、每个符号周期内网络状态更新10次,以及中间层层数为4层、每个符号周期内网络状态更新20次这两种情况下,与LS、LMMSE方法的误码率随信噪比变化曲线。

图8中可以观察到,在中间层只有1层和每个导频符号周期内网络状态更新10次时,本文方法与在接收机后端使用LS方法进行符号识别时相比在误码率性能方面具有十分微小的差异,但与LMMSE方法相比性能差异较为明显,由于PD2NN的电磁波调控能力取决于中间层层数、每一层超表面的单元个数以及迭代次数等因素,当增加中间层层数到4层和每个导频符号周期内的更新次数增加到20次时,可以观察到所提方法的误码率得到了明显提升甚至超过了传统方法误码率。

4 结束语

针对传统信息符号识别方法依赖于接收机后端的各级信号处理,难以避免存在性能损失,以及基于深度学习的信息符号识别方法存在训练数据实时获取难、算力成本高等问题,提出了一种基于PD2NN的单流信息符号识别方法。在每一段相干时间的通信帧内,不同的信息符号在接收天线处形成不同的电磁波,使得对信息符号的识别等价于对接收天线处电磁波的识别。然后,提出了基于PD2NN的单流信息符号识别模型和具体识别方法,使得经过PD2NN处理之后到达接收天线的信息符号是可识别的信息符号。仿真结果表明了所提方法的有效性,能够在接收天线处直接识别信息符号,同时具有更低的训练成本,与传统接收机的方法相比具有相当甚至更好的误码率效果。

参考文献

[1]

PROAKIS J GSALEHI M. Digital communications [M]. New York, USA: McGraw-Hill, 2008:160-226.

[2]

LI H C. Application analysis of digital signal processing technology in 5G communication[C]∥Proceedings of the 2023 Asia-Europe Conference on Electronics, Data Processing and Informatics. Piscataway, USA: IEEE, 2023:476-481.

[3]

WANG JLI RWANG Jet al. Artificial intelligence and wireless communications[J]. Frontiers of Information Technology & Electronic Engineering202021(10):1413-1425.

[4]

MAHMOUD HELBADAWY H MISMAIL Tet al. A comprehensive review of generative AI applications in 6G[C]∥Proceedings of the 2024 6th Novel Intelligent and Leading Emerging Sciences Conference. Piscataway, USA: IEEE, 2024:593-596.

[5]

SAIMLER MİCKIN SBERNINI Get al. The role of AI enablers in overcoming impairments in 6G networks[C]∥Proceedings of the 2024 Joint European Conference on Networks and Communications & 6G Summit. Piscataway, USA: IEEE, 2024:913-918.

[6]

O’SHEA THOYDIS J. An introduction to deep learning for the physical layer[J]. IEEE Transactions on Cognitive Communications and Networking20173(4):563-575.

[7]

DÖRNER SCAMMERER SHOYDIS Jet al. Deep learning based communication over the air[J]. IEEE Journal of Selected Topics in Signal Processing201812(1):132-143.

[8]

TONG WLI G Y. Nine challenges in artificial intelligence and wireless communications for 6G[J]. IEEE Wireless Communications202229(4):140-145.

[9]

WU NJIANG R KWANG X Yet al. AI-enhanced integrated sensing and communications: advancements, challenges, and prospects[J]. IEEE Communications Magazine202462(9):144-150.

[10]

ELSAYED MEROL-KANTARCI M. AI-enabled future wireless networks: challenges, opportunities, and open issues[J]. IEEE Vehicular Technology Magazine201914(3):70-77.

[11]

MA QCUI T J. Information metamaterials: bridging the physical world and digital world[J]. PhotoniX2020,1:No.1.

[12]

LI L LCUI T J. Information metamaterials: from effective media to real-time information processing systems[J]. Nanophotonics20198(5):703-724.

[13]

LIU CMA QLUO Z Jet al. A programmable diffractive deep neural network based on a digital-coding metasurface array[J]. Nature Electronics20225(2):113-122.

[14]

ISHIMARU A. Electromagnetic wave propagation, radiation, and scattering: from fundamentals to applications[M]. Hoboken, USA: Wiley-IEEE Press, 2017:137-169.

[15]

沙威,应磊,肖高标.电磁学中的格林函数[J].物理202453(1):43-49.

[16]

LIN XRIVENSON YYARDIMCI N Tet al. All-optical machine learning using diffractive deep neural networks[J]. Science2018361(6406):1004-1008.

[17]

AN J CYUEN CGUAN Y Let al. Stacked intelligent metasurface performs a 2D DFT in the wave domain for DOA estimation[C]∥Proceedings of the 2024 IEEE International Conference on Communications. Piscataway, USA: IEEE, 2024:3445-3451.

[18]

ZHANG Z J. Improved Adam optimizer for deep neural networks[C]∥Proceedings of the 2018 IEEE/ACM 26th International Symposium on Quality of Service. Piscataway, USA: IEEE, 2018. DOI: 10.1109/IWQoS.2018.8624183 .

[19]

LIU W BWANG Z DLIU X Het al. A survey of deep neural network architectures and their applications[J]. Neurocomputing2017234:11-26.

基金资助

国家自然科学基金(U22A2001)

AI Summary AI Mindmap
PDF (2797KB)

41

访问

0

被引

详细

导航
相关文章

AI思维导图

/