基于改进Trace Lasso范数和PALM算法的子空间聚类方法

药嘉怡 ,  张文娟 ,  黄姝娟 ,  袁薛程

内蒙古师范大学学报(自然科学版) ›› 2025, Vol. 54 ›› Issue (01) : 92 -100.

PDF (2416KB)
内蒙古师范大学学报(自然科学版) ›› 2025, Vol. 54 ›› Issue (01) : 92 -100. DOI: 10.3969/j.issn.1001-8735.2025.01.011

基于改进Trace Lasso范数和PALM算法的子空间聚类方法

作者信息 +

Subspace Clustering Based on Improved Trace Lasso Norm and PALM Algorithm

Author information +
文章历史 +
PDF (2473K)

摘要

子空间聚类是一类广泛应用的聚类方法,其中最关键的技术是表示矩阵的获取,为使表示矩阵更好地满足块对角结构,提出一种基于改进迹Lasso范数和PALM算法的子空间聚类方法。首先,将原始数据减去噪声所得干净数据作为数据自表示的字典,能够促使表示矩阵更接近块对角结构;其次,提出一种改进的迹Lasso范数,利用非凸FCP范数约束矩阵的奇异值向量,能更好促使矩阵满足低秩性;最后,由于提出模型的非凸非光滑性及约束条件的非线性,利用近端交替线性极小化算法求解模型,具有收敛性保证。在CFP人脸数据集和动物面部图像数据集上进行聚类的数值实验表明,提出的子空间聚类方法相比于普遍应用的K⁃means聚类、谱聚类及稀疏子空间聚类有更好的聚类性能。

Abstract

Subspace clustering is a widely used clustering method, in which the most critical technology is representation matrix acquisition. To make the representation matrix better fit the block-diagonal structure, this study proposes a subspace clustering method based on an improved trace Lasso norm and the proximal alternating linearized minimization (PALM) algorithm. Firstly, the clean data obtained by subtracting the noise from the original data is used as the dictionary of data self-representation, which makes the representation matrix closer to the block-diagonal structure. Secondly, an improved trace Lasso norm is proposed. It utilizes a non-convex FCP norm to constrain the singular value vector of the matrix, so that the matrix can be better promoted to satisfy the low rank. Finally, due to the non-convexity and non-smoothness of the proposed model and the nonlinearity of the constraint conditions, the PALM algorithm is used to solve the model, which ensures convergence. Numerical experiments of clustering on the CFP face dataset and an animal face image dataset show that the proposed subspace clustering method outperforms the commonly used K-means clustering, spectral clustering, and sparse subspace clustering (SSC).

Graphical abstract

关键词

子空间聚类 / 迹Lasso范数 / 非凸FCP范数 / 近端交替线性最小化

Key words

subspace clustering / trace Lasso norm / non-convex FCP norm / proximal alternating linearized minimization

引用本文

引用格式 ▾
药嘉怡,张文娟,黄姝娟,袁薛程. 基于改进Trace Lasso范数和PALM算法的子空间聚类方法[J]. 内蒙古师范大学学报(自然科学版), 2025, 54(01): 92-100 DOI:10.3969/j.issn.1001-8735.2025.01.011

登录浏览全文

4963

注册一个新账户 忘记密码

聚类分析在机器学习1、计算机视觉2、图像处理34等领域有广泛的应用,其作为一种无监督学习方法,能够在没有预先给定标签的情况下,根据数据点之间的相似性将其归入不同的类别,目前常用的聚类算法有K-means(K均值)聚类5、谱聚类6、层次聚类7、子空间聚类8等。如今数据的高维性使得聚类问题面临着极大挑战,子空间聚类方法针对高维数据提出。现有的聚类方法大致可分为四种:基于统计学的方法、矩阵分解方法、基于代数学方法及基于稀疏化方法,如稀疏子空间聚类9(sparse subspace clustering,SSC)和低秩表示10(low rank representation,LRR),本文主要研究子空间聚类问题。子空间聚类方法分为两个步骤11:获取邻接矩阵和谱聚类,获取邻接矩阵可以转化成求解一个最小化问题;基于邻接矩阵,利用谱聚类算法得到最终的聚类结果。假设数据点xiSi(i1,2,,c)可以表示成其他所有数据的线性组合,对应矩阵形式为
X=XZs.t.Zjj=0(j=1,2,,n)
上式中X为数据字典,Z为表示系数矩阵,结构为
Z=Z1000Z2000Zc
其中ZiRni×ni表示第i个子空间相应的表示系数。
SSC12与LRR13是得到广泛研究与应用的两类子空间聚类方法,SSC通过𝓁1范数约束系数正则项。LRR方法1415通常由核范数代替秩函数约束系数正则项。文献[16]提出潜在低秩表示方法,在低秩约束的前提下利用潜在数据构造字典,通过求解核范数最小化问题近似恢复潜在数据的影响。Zhang等17提出相关结构低秩子空间聚类方法,在模型中加入结构范数,将表示系数矩阵学习与谱聚类结合为一步。2016年Wu等18利用Trace Lasso范数XDiag(zj)*约束系数矩阵Z促使XDiag(zj)低秩,给出以下模型:
minzjj=1nxj-Xzj1+λj=1nXDiag(zj)*,s.t. xj=Xzj,j=1,2,,n
迹Lasso范数用核范数约束正则项。有文献表明1921,极小化非凸稀疏范数,譬如𝓁p(0<p<1)范数,非凸FCP范数(folded concave penalty,FCP)等,比极小化𝓁1范数能更好地使向量满足稀疏性。文献[22]在数据无噪声且子空间独立的情况下,正则项满足强制块对角(enforced block diagonal,EBD)条件,最优表示矩阵满足块对角结构。𝓁1范数约束系数矩阵缺乏考虑数据的全局结构。核范数极小化的目的是通过使矩阵的奇异值向量的𝓁1范数达到极小从而使奇异值向量稀疏,促使表示矩阵满足低秩性。然而,𝓁1范数不能很好地使向量稀疏,因此也不能很好地使矩阵满足低秩性;且实际问题中的数据不可避免地含有噪声,将原始噪声数据作为字典,不能有效促使表示矩阵满足块对角结构。
本文提出一种基于改进Trace Lasso范数和PALM算法的子空间聚类方法,提出的模型约束条件满足非线性,文献[23]中给出了一种求解一类非线性矩阵等式约束的非凸非光滑最优化问题的近端交替线性极小化算法(proximal alternating linearized minimization,PALM),适用本文模型。

1 提出的模型及求解算法

1.1 提出的模型

文献[22]指出在理想条件下,即数据是无噪声的,且子空间独立,正则项满足EBD条件,所求的最优表示矩阵满足块对角结构,这一特性确定了对数据的聚类(每个块对应每一类)。设xj=Xzjzj =z1j1,,zn1j1,,z1jc,,znkjc,假设xjSixli表示子空间Si中第l个数据,其中zlji为表达式zj中数据点xli前的表示系数,则有

XDiag(zj)=x11,,xn11,,x1c,,xnkcz1j1zn1j1z1jcznkjc=[0,,0;;z1jix1i,,znijixnii;0,,0]

进一步,由于第i个子空间的维数(基底的个数)远远小于其所含的数据点个数,即rank(Si)ni,故表示系数zljil=1ni中非基底数据点前的系数也均为0,因此XDiag(zj)具有很高的低秩性。本文利用FCP范数极小化使矩阵XDiag(zj)的奇异值向量满足稀疏性,从而达到使XDiag(zj)低秩的目的,秩函数用FCP范数约束的正则项为:XDiag(Zj)Pλ,a,其中,矩阵的FCP范数定义为

IPλ,a=k=1cPλ,aσk(I)

σk(I)是矩阵IRc×n(cn)的第k个奇异值,用Pλ,aMCP(·)Pλ,aSCAD(·)作为函数Pλ,a(·),MCP的形式为

Pλ,aMCP(t)=aλ22,taλ,λt-t22a, t<aλ,a>1,

SCAD的形式为

Pλ,aSCAD(t)=λt ,tλ,aλt-0.5t2+λ2a-1, λ<t<aλ,λ2a+12, t<aλ,a>2

式(5)和(6)中的λa是参数,t是函数变量。需要指出的是,虽然上述对XDiag(zj)的低秩性分析是在对数据矩阵排序的前提下给出的,而在实际问题中,数据矩阵未排序,但排序操作可以通过矩阵乘积实现,设排序矩阵为P,由于rankPXDiag(zj)=rankXDiag(zj),即对矩阵排序操作不影响矩阵的秩,因此XDiag(zj)的低秩性仍成立。

另一方面,文献[12]表明,只有用干净数据作为自表示字典时,才能保证表示矩阵Z更好地满足块对角结构。而实际中,数据矩阵X不可避免含有噪声,用含有噪声的数据矩阵X作为字典,不利于Z块对角结构的形成。设E为数据矩阵中所含的噪声,本文提出利用干净数据X-E作为自表示字典,给出约束条件X-E=(X-E)Z。针对不同的噪声情况,对E所使用的范数也不同,如表1。可以看出,对噪声用稀疏范数,可以同时去除奇异样本或野点及随机噪声。因此,由于非凸稀疏范数能更好地使向量满足稀疏性,对噪声也使用非凸FCP范数EPλ,a正则化。

综上,提出的子空间聚类模型为

minZj,Ej=1nXDiag(Zj)Pλ,a+λEPλ,as.t. X=(X-E)Z+E

为说明模型中表示矩阵Z的块对角结构,首先,给出以下定理。

定理 考虑k个独立子空间Sjj=1k中的数据集,令X=[X1,X2,,Xk]E为噪声且E=[E1,E2,,Ek],数据集Xj-EjSj。对于满足X=(X-E)Z+E的可行解Z*,将Z*分解为两部分,即Z*=ZB+ZC,其中

ZB=Z1B000Z2B000ZkB,ZC=0***0***0,

ZjB对应于子空间Sj,则X=(X-E)ZB+E成立或者Xj=(X-E)ZjB+Ej=1,2,,k,且(X-E)ZC=0

证明 对于可行解Z*,满足X=(X-E)Z*+E,子空间Sj中的数据X-E=[X1,X2,,Xk]=(X-E)Z1*Zk*,那么就有Xj-Ej=(X-E)Zj*Sj。因为Z*=ZB+ZC,则Xj-Ej=(X-E)(ZjB+ZjC)。只有与Xj-Ej在同一子空间中数据前的表示系数不为0,即(X-E)ZjBSj,则(X-E)ZjC中与Xj-Ej不在同一子空间中数据前的表示系数不为0,因此(X-E)ZjC ij Sj是直和符号,这里表示 ij 的所有子空间)。另一方面ZC满足:(X-E)ZjC=(Xj-Ej)-(X-E)ZjBSj,则(X-E)ZjCSj ij Sj,这里假设子空间是独立的,那么Sj ij Sj={0}。考虑上面的过程,有(X-E)ZjC={0},当j1,2,,k时,满足(X-E)ZC=0,因此(X-E)ZB=(X-E)-(X-E)ZC=X-E成立,即X=(X-E)ZB+E

定理给出了在独立子空间假设下表示矩阵Z*的性质,结果表明只有来自同一子空间Sj中的数据点Xj有实际贡献,即X=(X-E)ZB+E。表示矩阵的分解Z*=ZB+ZCZC0时块对角结构是未知的,同一子空间中数据点的贡献并没有被表示矩阵Z*明确地反映出来。这种情况下,问题(7)约束条件中的Z*不一定服从块对角性质。为了解决这个问题,文献[18]指出,对XDiag(Zj)利用低秩约束,从而有效促使ZC=0,使Z*满足块对角结构。本文利用非凸FCP范数对奇异值向量进行稀疏正则化约束,比利用Trace Lasso范数更利于促使XDiag(Zj)低秩。

求解上述模型(7)的困难在于目标函数的非凸非光滑性以及约束条件的非线性,本文提出的模型符合[23]中给出的一般模型的形式,且提出模型的目标函数满足文献[23]中收敛性定理的条件,从而具有收敛性保证的属性。

1.2 求解算法

XDiag(Zj)=Tj,两边同时乘以(XTX)-1XT,有(XTX)-1XTXDiag(Zj)=(XTX)-1XTTj,从而Diag(Zj)=(XTX)-1XTTj,进一步有Zj=(XTX)-1XTTje,则问题(7)的形式等价为

minTj,Ej=1nTjPλ,a+λEPλ,as.t. Xj=(X-E)(XTX)-1XTTje+Ej,j=1,2,,n 

其中Xj是第j个数据,即输入的第j个图像数据,e是元素全为1的向量[1,1,,1]TEj是第j个噪声图像数据。首先,用增广拉格朗日算法将问题转化为无约束问题

minTj,EL(Tj,E)=j=1nTjPλ,a+λEPλ,a+trAT(X-E)(XTX)-1XTTje+Ej-Xj+
μ2j=1n(X-E)(XTX)-1XTTje+Ej-Xj,

其中ARm×1是拉格朗日乘数,μ是大于0的参数。优化问题(8)和拉格朗日函数(9)是等价问题。令

H(Tj,E)=j=1ntrAT(X-E)(XTX)-1XTTje+Ej-Xj+μ2j=1nX-EXTX-1XTTje+Ej-Xj22 

利用PALM算法求解(9),k=0,1,2,n

(1)固定E=EkHTj,Ek可线性化为

HTj,EkHTjk,Ek+trTjHTjk,EkTTj-Tjk+ck2Tj-TjkF2=         ck2Tj-Tjk-TjHTjk,EkckF2,

其中TjH(Tjk,Ek)=-μPT(Xk-Ek)T[Xjk-(Xk-Ek)PTjke-Ejk+Akμ]eT

求解以下极小化问题

Tjk+1=argminTjTjPλ,a+ck2Tj-Tjk-TjH(Tjk,Ek)ckF2=prox1ck.Pλ,aTjk-TjH(Tjk,Ek)ck,j=1,2,,n

(2)固定Tj=Tjk+1H(Tjk+1,E)可线性化为

H(Tjk+1,E) H(Tjk,Ek)+trEH(Tjk,Ek)T(E-Ek)+dk2E-EkF2=        dk2E-Ek-EH(Tjk,Ek)dkF2

其中EH(Tjk+1,Ek)=μI-μPT(Tjk+1)T(Xk-Ek)TXjk-(Xk-Ek)PTjk+1e-Ejk+AkμeT

求解以下极小化问题

Ek+1=argminEλEPλ,a+dk2E-Ek-EH(Tjk+1,Ek)dkF2=prox1dkλEPλ,aEk-EH(Tjk+1,Ek)dk,j=1,2,,n

利用文献[21]给出的算法可求解(11)和(12),其中P=(XTX)-1XT。综上,求解模型(8)的算法步骤如下:

(1)输入:观测数据XRm×n,参数λ,μ,γ1>1,γ2>1,初始化Tj0Rm×n(j=1,2,,n),E0Rm×n,A0Rm×1

(2)设置步长ck=γ1L1(Ek)=γ1μ(PT(X-E)T(X-E)PF,通过公式(11)计算变量Tj;设置步长dk=γ2L2Tjk+1=γ2PTTjeeTF,通过公式(12)计算变量Ej

(3)更新拉格朗日乘子:Ak+1=Ak+μ(X-Ek+1)(XTX)-1XTTjk+1e+Ejk+1-Xj

(4)输出:Zj*=(XTX)-1XTTj*e (j=1,2,,n)

2 数值实验

利用所求的表示系数矩阵构造相似度矩阵W=Z*+(Z*)T2,最后利用谱聚类算法得到最终的聚类结果。

2.1 评价指标

将提出的子空间聚类算法和K-means、谱聚类等聚类方法进行对比分析,使用轮廓系数作为评价指标,轮廓系数是衡量类内稠密、类间稀疏程度的指标。轮廓系数的公式为

S(i)=b(i)-a(i)max{a(i),b(i)} ,

其中b(i)是类间距离,a(i)是类内距离。轮廓系数的取值范围为[-1,1],轮廓系数越大,聚类效果越好。

2.2 数据集

本文选取可公开访问的两种数据集:CFP人脸数据集和动物面部数据集,机器学习的学习性能和泛化能力在很大程度上取决于数据集的特征。本文对CFP人脸数据集选取10类数据,每类数据包含同一个人的10张正脸和4张侧脸,如图1所示;动物面部数据集选取4类不同表情动物共250张图像进行学习,如图2所示。

2.3 算法收敛性

图3为提出模型的目标函数随迭代次数的变化曲线图,其中横轴表示迭代次数,纵轴表示目标函数值,由图3可知,目标函数值随迭代次数的增加而减少并逐渐趋于稳定。图3(a)是在CFP人脸数据集的实验结果,当迭代次数达到48时,函数值逐渐趋于一个稳定的值。图3(b)是在动物图像数据集的实验结果,当迭代次数达到43时,函数值逐渐趋于一个稳定的值。

2.4 聚类结果

对聚类结果进行可视化处理,为了更直观地展示聚类效果,利用t分布⁃随机近邻嵌入(t-SNE,t-distributed stochastic neighbor embedding)降维方法将输入的高维数据投影到二维平面上,根据其预测标签用不同的颜色标记相应数据点的聚类结果,对聚类结果可视化。然而聚类好坏难以单一地用肉眼直接观察,因此需要对聚类效果进行量化,本文对聚类结果使用轮廓系数进行量化度量,确定最佳的聚类簇数并对聚类效果进行评估,如表2所示。由轮廓系数得到的CFP人脸数据集最佳聚类簇数为10,轮廓系数为0.673;动物面部数据集最佳聚类簇数为4,轮廓系数为0.739。

2.4.1 可视化结果

图4图5中的K-means和谱聚类是直接对两组数据集使用t-SNE降维后的数据做聚类,SSC和本文模型是根据降维的数据矩阵求出稀疏表示矩阵和低秩表示矩阵后,用所求的表示矩阵做邻接矩阵进一步使用谱聚类算法进行聚类。

2.4.2 聚类结果定量评估

K-means聚类、谱聚类、SSC以及本文提出的聚类模型进行聚类精度比较结果见表3。根据表中的数值结果可得到以下结论:本文所提出的模型在两个数据集上的实验结果均具有较好的聚类性能;针对CFP人脸数据集轮廓系数为0.673,均高于其他三类聚类算法;针对动物图像数据集,得到的轮廓系数为0.739,均高于其他三种聚类算法。

3 结论

本文提出了基于改进Trace Lasso范数和PALM算法的子空间聚类模型,主要创新点和贡献有:(1)针对约束系数矩阵低秩,本文将Trace Lasso范数和非凸FCP范数结合,对XDiag(zj)的奇异值向量利用非凸稀疏范数约束,能更好地使XDiag(Zj)低秩,进而促使系数矩阵Z低秩;(2)针对噪声数据,对表示字典引入噪声项,能有效促使表示矩阵满足块对角结构。本模型考虑到输入数据包含噪声的随机性和稀疏性及表示矩阵的低秩性,用干净数据作为字典表示并对正则项的低秩约束项作了改进,选用ALM算法和PALM算法求解,PALM针对非凸非光滑组合优化问题,适用于提出的模型并有收敛性保证。在数值实验部分给出了算法收敛性分析并作了聚类效果比较,结果表明,所提出的子空间聚类模型有更好的聚类准确率。然而模型的参数是通过手动调试的,在后续的研究中,将更关注于从数据中自适应地学习最优参数的研究。

参考文献

[1]

CHEN Z DLI D ZWAN H Xet al. Unsupervised machine learning methods for polymer nanocomposites data via molecular dynamics simulation[J].Molecular Simulation202046 (18): 1509-1521.

[2]

BHATT M SPATALIA T. Computer vision systems for content-based image classification[J].Statistics, Optimization & Information Computing, 20197 (4): 840-853.

[3]

PENG Z HLIU HJIA Y Het al.Adaptive attribute and structure subspace clustering network[J].IEEE Transactions on Image Processing202231:3430-3439.

[4]

YANG A YWRIGHT JMA Yet al.Unsupervised segmentation of natural images via lossy data compression[J].Computer Vision and Image Understanding2008110(2):212-225.

[5]

周蓉蓉,陈栋,刘思远.基于K均值聚类算法的生鲜运输路径优化模型[J].农业大数据学报20224(1): 89-97.

[6]

王丙参,魏艳华,李旭.基于独立与距离相似度的谱聚类比较及数据模拟[J].统计与决策202238(15): 22-28.

[7]

邢涛,雍毅,侯江,.基于主成分分析与层次聚类分析的水质综合评价[J].四川环境202241(4): 131-139.

[8]

LI B HLU H CZHANG Yet al. Subspace clustering under complex noise[J]. IEEE Transactions on Circuits and Systems for Video Technology201929(4): 930-940.

[9]

ELHAMIFAR EVIDAL R. Sparse subspace clustering: algorithm, theory, and applications[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence201335(11): 2765-2781.

[10]

LIU GLIN ZYAN Set al.Robust recovery of subspace structures by low-rank representation[J].Pattern Analysis and Machine Intelligence201035(1):171-184.

[11]

王卫卫,李小平,冯象初,.稀疏子空间聚类综述[J].自动化学报201541(8):1373-1384.

[12]

ZOU X YXUE J QLI X Tet al. High-fidelity sEMG signals recorded by an on-skin electrode based on AgNWs for hand gesture classification using machine learning[J]. ACS Applied Materials & Interfaces202315(15): 19374-19383.

[13]

LU G FYU Q RWANG Yet al.Hyper-Laplacian regularized multi-view subspace clustering with low-rank tensor constraint[J].Neural Networks2020125(6):214-223.

[14]

于茜茜.稀疏低秩子空间聚类算法研究[D].大连:大连海事大学,2020.

[15]

李欢,唐科威.基于低秩张量表示的多视图子空间聚类[J].理论数学202313(10):2877-2887.

[16]

ZHANG H YLIN Z CZHANG Cet al.Robust latent low rank representation for subspace clustering[J].Neurocomputing2014145(18):369-373.

[17]

ZHANG XSUN FLIU Get al.Fast low-rank subspace segmentation[J].IEEE Transactions on Knowledge and Data Engineering2014(5):1293-1297.

[18]

WU LWANG YPAN S.Exploiting attribute correlations: A novel Trace Lasso-based weakly supervised dictionary learning method[J].IEEE Transactions on Cybernetics201747(12):4497-4508.

[19]

XU Z BCHANG X YXU F Met al.L1/2 regularization: A thresholding representation theory and a fast solver[J].IEEE Transactions on Neural Networks and Learning Systems201223(7):1013-1027.

[20]

CHARTRAND R. Exact reconstruction of sparse signals via nonconvex minimization[J].IEEE Signal Processing Letters200714(10):707-710.

[21]

ZHANG W JFENG X CXIAO Fet al. A folded concave penalty regularized subspace clustering method to integrate affinity and clustering[J]. Mathematical Problems in Engineering2021(3): 6641180.

[22]

LU C YFENG J SLIN Z Cet al. Subspace clustering by block diagonal representation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence201941(2): 487-501.

[23]

ZHANG W JFENG X CXIAO Fet al.A class of bilinear matrix constraint optimization problem and its applications[J].Knowledge-Based Systems2021231(8):107429.

基金资助

国家自然科学基金资助项目“面向视觉注意选择的复杂场景层次化语义理解建模研究”(62171361)

AI Summary AI Mindmap
PDF (2416KB)

153

访问

0

被引

详细

导航
相关文章

AI思维导图

/