基于多模态融合的欠定混合矩阵估计

张海龙 ,  李立春 ,  潘宏怡 ,  李伟年 ,  田思尧

信息工程大学学报 ›› 2025, Vol. 26 ›› Issue (04) : 393 -400.

PDF (2586KB)
信息工程大学学报 ›› 2025, Vol. 26 ›› Issue (04) : 393 -400. DOI: 10.3969/j.issn.1671-0673.2025.04.003
信息与通信工程

基于多模态融合的欠定混合矩阵估计

作者信息 +

Underdetermined Mixing Matrix Estimation Based on Multimodal Fusion

Author information +
文章历史 +
PDF (2648K)

摘要

针对欠定混合矩阵估计中传统聚类算法存在簇数目不明确、簇中心随机选择等问题,提出一种基于多模态融合识别的混合矩阵估计方法。通过多模态融合识别优化聚类过程,克服传统聚类算法的不足。在两通道四信号的实验设置下,采用该方法进行混合矩阵估计。实验结果表明,估计矩阵的归一化均方误差达到-66.034 5 dB,相比传统聚类算法,该方法能有效提高混合矩阵的估计精度,为混合矩阵估计提供了可靠方法。

Abstract

To address the issues of ambiguous cluster numbers and random cluster center initialization in traditional clustering algorithms for underdetermined mixing matrix estimation, a novel estimation method based on multimodal fusion recognition is proposed. By optimizing the clustering process through multimodal feature fusion in this method, the limitations of conventional clustering algorithms are overcome. Experimental validation under a two-channel four-signal configuration demonstrates that the proposed method achieves a normalized mean square error of -66.034 5 dB for the estimated matrix. Compared with traditional clustering methods, this technique significantly improves mixing matrix estimation accuracy, providing a robust solution for practical applications.

Graphical abstract

关键词

多模态融合 / 混合矩阵 / 矩阵估计 / 定位阈值

Key words

multimodal fusion / mixing matrix / matrix estimation / localization threshold

引用本文

引用格式 ▾
张海龙,李立春,潘宏怡,李伟年,田思尧. 基于多模态融合的欠定混合矩阵估计[J]. 信息工程大学学报, 2025, 26(04): 393-400 DOI:10.3969/j.issn.1671-0673.2025.04.003

登录浏览全文

4963

注册一个新账户 忘记密码

0 引言

盲源分离(Blind Source Separation, BSS)是指在未知源信号及其混合参数的条件下,仅根据观测混合信号实现混合矩阵估计和源信号恢复的技术[1]。目前BSS已广泛应用于语音识别、图像处理、生物医学信号分析等领域。实际应用中,受限天线成本,接收通道数常小于源信号数(即欠定条件),因此针对欠定盲源分离(Underdetermined Blind Source Separation, UBSS)问题的研究尤为必要。多数UBSS算法基于“两步法”[2]思路,即首先估计出欠定混合矩阵,然后利用混叠信号的稀疏性实现源信号的恢复。由此可见,欠定混合矩阵估计是盲源分离的关键环节,其精度直接影响源信号重构质量。

欠定混合矩阵估计方法主要包括基于非负矩阵分解(Non-Negative Matrix Factorization, NMF)[3]、张量分解、稀疏分量分析(Sparse Component Analysis, SCA)及聚类算法等[4]。NMF的基本思想是将1个高秩非负矩阵分解为2个低秩非负矩阵的乘积。文献[5-6]通过构造新的代价函数,将矩阵估计转化为寻求低秩矩阵最优解的问题,此方法虽有助于数据降维、特征提取,但仅能够处理非负数据,且对噪声敏感,容易陷入局部最优。为解决局部最优问题,文献[7]将局部优势源在协方差域中聚类,转换成凸优化求解问题,但仍没摆脱矩阵要求非负的条件。与SCA相比,张量分解[8]具有相对简单和计算效率高的优点,无需满足源的统计独立性和稀疏性要求。文献[9]通过分解将数据降维表示,提高了矩阵估计的准确性,但存在与模型参数敏感性过强,仅适用于非负信号的局限。SCA与聚类算法[10]对源信号或其变换域的稀疏性要求极高,满足稀疏性要求时,该方法在保持数据主要特征的同时,减少数据的维度,从而能够提高数据处理速度。文献[11]利用稀疏编码对混合矩阵进行估计,但是矩阵的估计精度对稀疏性鲁棒性不足。层次聚类[12]构建数据实例之间的层次关系,通过层次关系不断合并同类,最终实现聚类结果,但是聚类过程对奇异值非常敏感且需要指定簇数目,且聚类效果受参数选择的影响较大,参数选择难题亟待解决。

针对传统聚类算法簇数目不明确、簇中心随机选择的问题,提出基于多模态融合识别的混合矩阵估计方法(Mixing Matrix Estimation Method based on Multimodal Fusion Recognition, MEMR)。该方法通过多模态融合网络标记出混叠区域,提取时频系数(Time-Frequency Coefficient, TFC)后,设置阈值定向提取TFC均值样本,确定矩阵列向量比值(Matrix Column Vector Element Ratio, MCVER),最终完成矩阵估计。

1 混合信号模型及评价标准

1.1 混合模型

线性瞬时混合模型如图1所示。

图1中:m为接收通道数;n为源信号数。当m<n时,该模型为欠定混合模型[13]。将模型表示为

x(t)=x1(t)x2(t)xm(t)=a11a12a1na21am1a22am2a2namns1(t)s2(t)sn(t)+v(t)=As(t)+v(t),    t=1, 2,, T                          

式中:xt=x1(t), x2(t),, xm(t)T为接收到的混合信号的集合;Am×n混合矩阵;s(t)=s1(t),s2(t),, sn(t)T为独立源信号的集合;vt是加性高斯噪声。本文混合信号采用欠定混合模型,接收通道数小于源信号数(m<n),仅接收信号xt为已知,混合矩阵A与源信号s(t)均未知。设定接收场景为双通道(m=2),对基于双通道时频混叠信号的矩阵估计展开研究。

在处理混合信号时,常见的做法是将其从时间域转换到时频域,这样做可以增强信号的稀疏性。当v(t)=0时,式(1)表示为

F(t, f)=F1(t, f)F2(t, f)=                                                                       a11a12a1na21a22a2nS1(t, f)S2(t, f)Sn(t, f)=AS(t, f)

式中:F(t, f)x(t)的时频系数;S(t, f)s(t)的时频系数。

1.2 数据集

为验证算法的鲁棒性,将信号的各项调制参数设置为常用范围内随机生成:码元速率为10~200 KHz,信噪比为0~20 dB,频率为13~193 MHz,雷达信号扫频带宽为10 MHz。测试集在每个参数随机的条件下,针对4种三信号混叠模型、6种四信号混叠模型,每类信号各生成100个(见表1)。测试集信噪比为0~20 dB,步长为4 dB,混叠度分别为0.25、0.50、0.75和1.00。四信号混叠模型中同时包含类间、类内信号的混叠情况。混合矩阵内元素采用随机设置。所有信号的时频图像素大小统一设置为768×768,波频图像素大小设置为2 048×64。

1.3 评价标准

本文对混合矩阵估计精度的评价标准采用归一化均方误差(Normalized Mean-Square Error, NMSE)[14],计算公式为

σNMSE=10 lgi=1mj=1n(a^ij-aij)2i=1mj=1naij2

式中:m×n为混合矩阵大小;aij为混合矩阵中i, j处的项;a^ij为估计矩阵中i, j处的项。σNMSE的值越小,表示估计矩阵与原始混合矩阵误差越小,矩阵估计的精度越高。

2 基于多模态融合网络的信号处理

MEMR方法分为网络提取和矩阵估计两个步骤,如图2所示。

混合信号经过基于多模态特征融合的时频混叠信号识别方法(Time-Frequency Aliasing Signal Recognition Method based on Multimodal Fusion, TRMM)处理,该方法采用时频图与波频图双模态进行特征提取,然后由波频图模态的输出对时频图模态进行加权融合,以多模态特征分值作为分类依据,实现时频混叠信号的分离识别,同时能够在输出结果上标注出混叠区域。TRMM流程图如图3所示。

混合信号经过TRMM方法处理,已经得到各分量信号的类别标签及时频图上混叠区域像素点的坐标,如图4所示,最右侧图是TRMM方法识别的结果,其中混叠区域标记为“MIX”,用紫色表示。在此基础上,本文展开混合矩阵估计的深入研究。

2.1 时频点分类

在信号经历时频变换后,那些在特定时刻的时频域中只包含一个源信号的时频点被称作单源点,这意味着在这个时频点F(ti,fi)的位置上,只有一个源信号S1是活跃的。相对地,如果这个时频点在某一时刻的时频域中存在多个源信号,则这些点被称为多源点。

对于单源点,则有:

F(ti, fi)=F1(ti, fi)F2(ti, fi)=a11a21S1(ti, fi)

对上式分别取实部和虚部,有:

Re[F1(ti, fi)]Re[F2(ti, fi)]=a11Re[S1(ti, fi)]a12Re[S1(ti, fi)]=a11a21
Im[F1(ti, fi)]Im[F2(ti, fi)]=a11Im[S1(ti, fi)]a12Im[S1(ti, fi)]=a11a21

两个通道的实部和虚部的比值均为a11/a21。对于多源点,如上述处理后,则有:

Re[S1(tk, fk)]Im[S1(tk, fk)]=Re[S2(tk, fk)]Im[S2(tk, fk)]

式中:(tkfk)为多源点的坐标;S1S2未知,两通道相互独立,因此当两个通道的实部与虚部的比值相等时,可以推定该时频点为单源点。

2.2 时频点特性

混叠信号经过时频分析后,各分量信号组成的单源点时频系数在散点图上呈现线性特征,如图5所示。“两步法”的第一步即利用该线性特征进行聚类分析,以获取验证结果MCVER,完成矩阵估计过程。

图5中可以看出明显的线性特征,其线性特征斜率等于a1i/a2i。由于源信号之间的传输通道相互独立,各通道实部与虚部的比值不相等,即:

a1ia2ia1ja2j, ij

由此得到混合矩阵的估计。

2.3 矩阵估计

一般来说,聚类效果决定线性特征斜率的精度(即MCVER的精度),进而影响混合矩阵的估计精度。MEMR方法在TRMM方法的基础上绕过传统聚类步骤,直接通过优化手段来估计混合矩阵,降低了对传统聚类精度的依赖性。

2.3.1 定位阈值

在实际信号频谱分析中,混叠信号内存在多个混叠区域,如图6所示。

图中从上到下依次为BPSK信号、8PSK信号、DQPSK信号分别与LFM信号的混叠情况,表现在同时间不同频率上或同频率不同时间的混叠。在逐像素划分混叠区域时,为提高划分准确度,需设置定位阈值ω,使得某像素点P被划分到混叠区域M中,当且仅当M内距离点P最近点的横坐标与点P横坐标之差的绝对值小于ω。如图7所示,准确率在ω=8910时,达到最大100%,本文选取ω=9

2.3.2 混叠区域

TRMM方法输出混合信号的识别结果及时频系数矩阵S,可以在时频图中确定混叠区域,并标注为“MIX”,如图8所示,紫色区域代表混叠区域。

由此可以得到混叠区域Mi

Mi=(m,n)mbmms,nbnns

式中:i表示混叠区域在时频图内的排序;mbnb为行、列以左下为原点开始混叠的坐标;msns为行、列以左下为原点混叠结束的坐标,此时混叠区域内存在大量的多源点及少量单源点。

因时频分析加窗影响,信号存在频谱泄露现象,导致时频图中混叠区域呈现不规则形状,为确保多源点全部被标记,设置扩展因子ββ>1),使得混叠扩展区域Me_i

Me_i=(me,ne)mb×βmems×β,nb×βnens×β     

统计去除混叠扩展区域Me_i后,多源点在时频图总像素中所占比例,如图9所示。当β5时,多源点全部被标记在混叠扩展区域Me_i内,因此,本文选取β=5

TRMM方法输出的时频系数矩阵S大小为768×20 480,可以通过Me_i得到混叠扩展区域的时频系数矩阵Ci

Ci=Sms, nsms=me,ns=ne768×20 480

式中,·表示向上取整。

单源点的时频系数矩阵 D,则可表示为

D=S-iCi

2.3.3 估计矩阵

获得两个通道内单源点的时频系数矩阵 D 之后,即可完成矩阵估计。

首先,定义两通道内单源点时频系数的实部或虚部的比值为时频系数比值Dk

Dk=ReXkReYk =ImXkImYk 

式中,XkYk表示两个通道内的单源点,即XkX1t, fYkX2t, f

由2.2节式(8)可知,不同类别信号的时频系数在散点图上呈现出不同的线性特征,即Dk不一致。由2.1节式(5)~式(6)可知,同类别信号的Dk一致。信号的统计特性在整个时频域内是一致的,为了更好地利用这一特性,同时减少单个时频点上的噪声或异常值对估计结果的影响,需取同类别信号Dk的平均值D¯k,从而提高混合矩阵估计的精度。

矩阵估计步骤总结如下。

1)计算时频比Dk。获取两通道的单源点后,分别提取同类别单源点的时频系数矩阵 D,按对应位置求比值,得到相应的时频比Dk

2)二次均值处理。XkYk呈现对称性,具有正负相抵的特性,不能直接求D¯k。统计XkYk的正负数目,选其多的一方求均值,另一方舍去。得到D¯k后,以2×D¯k为阈值,去除离群值,再作均值处理得到MCVER。此时,MCVER即为a1ta2t的估计值a^1ta^2t

3)确定矩阵项。得到MCVER后,根据a^1t=xkxk2+yk2a^2t=ykxk2+yk2,计算混合矩阵,确定矩阵项。

2.3.4 算法复杂度分析

本文矩阵估计算法的复杂度主要由单源点提取组成。假设单源像素点有m个,接收通道有n个,由于单源点提取为线性运算,可以计算得到单源点提取过程的算法复杂度为Om×n×M×N。其中,nNM均为常数,因此本文算法复杂度为On表2列举了k-means算法、层次聚类算法、DBSCAN算法、FCM模糊聚类算法共4种主流的聚类算法与MEMR算法复杂度进行比较,MEMR算法无需聚类,在算法性能上具有明显优势。

3 仿真实验

所有仿真实验在以下环境中进行:Matlab 2023a软件、Windows10操作系统、64 GB内存、AMD Ryzen 9 5950X 16-Core Processor 3.40 GHz处理器。本文信号数据与TRMM方法采用的数据一致,信号时长5.12 ms,采样率fs=512 MHz

由1.3节分析可知,本节采用NMSE来评估混合矩阵的估计性能,NMSE越小,表示矩阵估计精度越高。

3.1 三信号混叠模型矩阵估计

3.1.1 实验分析

无噪声条件下,对双通道接收三信号混叠模型(LFM+2FSK+4FSK)进行混合矩阵估计,三信号混叠矩阵为

A=0.785 00.555 00.907 00.619 50.831 90.421 1

混合信号作时频分析,以通道一接收到的信号为例,其时频图如图10所示。

去除多源点并提取单源点后,时频系数矩阵可视化变为图11所示。信号出现明显断点,这是因为去除混叠扩展区域后,所有多源点全部被丢弃。此时,时频系数矩阵内的元素全部为单源点。

以同样方式获取通道二内各类信号单源点,计算Dk。计算结果如图12所示,仍有部分异常值或噪声,这是由噪声或多径效应等原因引起,需对Dk作均值处理。

得到D¯k后,以2×D¯k为阈值,去除离群值,结果如图13所示。

此时,Dk分布稳定,统计特性明显,可再次作均值处理,得到MCVER:

M=0.761 91.502 20.461 5

然后,得到估计矩阵:

A^=0.795 40.554 10.908 00.606 00.832 40.419 0

最后,进行性能评价,对测试集内100个LFM+2FSK+4FSK模型进行测试,取平均结果作为最终结果,得σNMSE=-69.402 4

对1.2节表1中其他三信号混叠模型进行测试,测试结果如表3所示。可以看出,本文提出的MEMR方法,对不同的三信号混叠模型进行矩阵估计时,均可以取得高精度估计结果。

3.1.2 不同算法性能对比

为进一步验证MEMR方法的矩阵估计性能,表4对比了与其他算法估计矩阵的NMSE比较结果。可以看出,与其他算法相比,MEMR方法能够高精度地完成矩阵估计,有效性得到验证。

3.2 四信号混叠模型矩阵估计

3.2.1 实验分析

无噪声条件下,双通道接收四信号混叠模型(BPSK+4FSK+2FSK+EQFM)进行混合矩阵估计,四信号混叠矩阵为

A=0.785 00.555 00.907 00.355 70.619 50.831 90.421 10.934 6

实验步骤与3.1.1节一致,本节不再赘述,直接给出最终结果,估计矩阵为

A^=0.784 60.548 20.906 80.425 60.620 00.836 40.421 60.904 9

根据式(3),对测试集内100个BPSK+4FSK+2FSK+EQFM模型进行测试,取平均结果作为最终结果,σNMSE=-67.998 1

对1.2节表1中其他四信号混叠模型进行测试,测试结果如表5所示。可以看出,MEMR方法对四信号混叠模型的矩阵估计,仍然能够保持较高精度。

3.2.2 不同算法性能对比

为进一步验证MEMR方法的矩阵估计性能,表6对比了与其他算法估计矩阵的NMSE比较结果。文献[16]使用基于改进蜂群优化聚类的方法估计混合矩阵,文献[17]使用基于密度空间聚类的方法完成矩阵估计,文献[18]在DBSCAN算法的基础上提出布谷鸟自适应搜索群优化算法进行矩阵估计。而MEMR方法绕过传统的聚类模式,仍可以高精度完成矩阵估计。

3.3 不同SNR条件下算法性能分析

在现实应用环境中,算法不可避免地会受到噪声的影响,为验证MEMR方法在实际应用中的性能,需为混叠信号添加高斯噪声。对于四信号混叠模型,在5~25 dB的加性高斯白噪声条件下,进行100次蒙特卡洛实验,并与文献[5]和文献[18]算法进行对比,如图14所示。SNR=5 dB时,MEMR方法的矩阵估计精度明显高于对比算法。随着SNR的增大,算法矩阵估计的精度随之提升。在高SNR的环境中,时频点扰动幅度普遍较小,使得聚类算法能够更加准确地估计出簇中心,从而可以高精度地估计出混合矩阵。但是在同一SNR条件下,MEMR方法混合矩阵估计的精度始终优于对比算法。

4 结束语

传统时频混叠信号混合矩阵估计方法,混合矩阵估计精度高度依赖聚类性能,面临簇数目不明确、簇中心随机选择、参数难设置等问题。本文提出的MEMR方法,在TRMM方法的基础上绕过传统聚类步骤,直接通过优化手段来估计混合矩阵,降低了对聚类精度的依赖性。从两类混叠模型的仿真实验可以看出,所提算法有效地改善了混合矩阵估计精度。

参考文献

[1]

BOUSSE MDEBALS ODE LATHAUWER L. A tensor-based method for large-scale blind source separation using segmentation[J]. IEEE Transactions on Signal Processing201765(2):346-358.

[2]

BOFILL PZIBULEVSKY M. Underdetermined blind source separation using sparse representations[J]. Signal Processing200181(11):2353-2362.

[3]

LEE D DSEUNG H S. Learning the parts of objects by non-negative matrix factorization[J]. Nature1999401(6755):788-791.

[4]

刘成浩,张晓林,孙溶辰,.基于改进粒子群的密度聚类算法混合矩阵估计[J].系统工程与电子技术202446(7):2211-2219.

[5]

章雯,张君,王璐,.稀疏正交联合约束多通道非负矩阵分解声信号分离算法[J].声学学报202348(1):249-263.

[6]

解元,邹涛,孙为军,.面向卷积混叠环境下的盲源分离新方法[J].自动化学报202349(5):1062-1072.

[7]

KUMAR V ARAO C V RLEEMA N. Audio source separation by estimating the mixing matrix in underdetermined condition using successive projection and volume minimization[J]. International Journal of Information Technology202315(4):1831-1844.

[8]

马宝泽,李国军,向翠玲,.基于张量分析的欠定混合矩阵估计算法[J].通信学报202243(11):35-43.

[9]

GUAN WDONG L LZHOU J Met al. Tensor-based approach for underdetermined operational modal identification[J]. Mechanical Systems and Signal Processing2021,160:No.107891.

[10]

彭硕,陶亮,查文文,.基于稀疏分量分析的生猪音频欠定盲源分离研究[J].畜牧兽医学报202354(7):2794-2809.

[11]

HASSAN NRAMLI D A. Underdetermined blind source separation of bioacoustic signals[J]. Pertanika Journal of Science and Technology202331(5):2257-2272.

[12]

XU D KTIAN Y J. A comprehensive survey of clustering algorithms[J]. Annals of Data Science20152(2):165-193.

[13]

潘宁. 复杂电磁环境下时频混叠信号的识别与分离[D].郑州:郑州大学,2021:1-70.

[14]

杨筱菡,王勇智.概率论与数理统计[M].北京:人民邮电出版社,2017:190-211.

[15]

LIU Z PLI L CZHENG Z R. Mixing matrix estimation method for dual-channel time-frequency overlapped signals based on interval probability[J]. ETRI Journal201941(5):658-669.

[16]

张伟灿.欠定盲源分离的混合矩阵估计方法研究[D].长沙:湖南大学,2018:1-67.

[17]

张宇,杨淇善,贾懋珅.利用DBSCAN和概率密度估计的欠定盲源分离混合矩阵估计[J].信号处理202339(4):708-718.

[18]

王霖郁,夏敏,项建弘.基于改进DBSCAN算法估计欠定混合矩阵的应用研究[J].数据采集与处理202136(5):969-977.

AI Summary AI Mindmap
PDF (2586KB)

58

访问

0

被引

详细

导航
相关文章

AI思维导图

/