融合变分自编码器的不完整多视图模糊聚类

陈占芳; 李澳; 姜晓明; 李岩芳

doi:10.20056/j.cnki.ZNMDZK.20250512

中南民族大学学报（自然科学版） ›› 2025, Vol. 44 ›› Issue (05) : 664 -674. DOI: 10.20056/j.cnki.ZNMDZK.20250512

物理与电子信息科学

融合变分自编码器的不完整多视图模糊聚类

作者信息 +

Incomplete multi-view fuzzy clustering based on the variational autoencoder

Author information +

文章历史 +

PDF (1849K)

摘要

多视图聚类的目的是将高度相似的数据对象划分到同一簇，为实现高维数据、多视图数据的高效聚类，提出了融合变分自编码器的不完整多视图模糊聚类VAE-IMFC，该模型将变分自编码器的生成能力和自表达模块的辨别能力有效结合.该模型一方面利用变分自编码器明确补偿样本缺失的视图特征，另一方面利用L1和L2正则化生成更具鉴别性的子空间表示完成聚类任务.同时，由于生成数据的模糊性和不确定性，该模型使用模糊聚类代替传统的硬聚类完成样本分群分类，避免了传统聚类分析中“非此即彼”的分类方式.通过大量实验证明所提出VAE-IMFC方法在高维数据、多视图数据聚类时的有效性，与现有方法相比，实现较大改进.

Abstract

The purpose of multi-view clustering is to divide highly similar multi-view data into the same group.In order to achieve efficient clustering of high-dimensional data and multi-view data， an incomplete multi-view fuzzy clustering VAE-IMFC based on a variational autoencoder is proposed， which effectively combines the generation ability of variational autoencoder with the discrimination ability of the self-expression module. On the one hand， the variational autoencoder is used to explicitly compensate for the missing view features of samples， on the other hand， L1 and L2 regularization are used to generate a more discriminative subspace representation to complete the clustering task. At the same time， due to the fuzziness and uncertainty of the generated data， fuzzy clustering is used to replace the traditional hard clustering to complete the sample classification， avoiding the "either-or" classification method in the traditional clustering analysis. A large number of experiments have proved the effectiveness of the proposed VAE-IMFC， which has achieved a great improvement compared with the existing technology.

Graphical abstract

关键词

不完整多视图聚类 / 变分自编码器 / 正则化 / 模糊聚类

Key words

incomplete multi-view clustering / variational autoencoder / regularization / fuzzy clustering

引用本文

引用格式 ▾

[Author(id=1273234256189997072, tenantId=1045748351789510663, journalId=1189533126771896327, articleId=1189605947804668198, orderNo=0, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=jeffy2010@126.com, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1273234256257105942, tenantId=1045748351789510663, journalId=1189533126771896327, articleId=1189605947804668198, authorId=1273234256189997072, language=EN, stringName=Zhangfang CHEN, firstName=Zhangfang, middleName=null, lastName=CHEN, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=College of Computer Science and Technology，Changchun University of Science and Technology，Changchun 130022，China, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1273234256307437596, tenantId=1045748351789510663, journalId=1189533126771896327, articleId=1189605947804668198, authorId=1273234256189997072, language=CN, stringName=陈占芳, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=长春理工大学计算机科学技术学院，长春 130022, bio={"content":"

陈占芳（1980-），男，博士，教授，研究方向为机器学习、数据库与数据挖掘，E-mail：jeffy2010@126.com

"}, bioImg=null, bioContent=

陈占芳（1980-），男，博士，教授，研究方向为机器学习、数据库与数据挖掘，E-mail：jeffy2010@126.com

, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1273234256122888199, tenantId=1045748351789510663, journalId=1189533126771896327, articleId=1189605947804668198, xref=null, ext=[AuthorCompanyExt(id=1273234256135471112, tenantId=1045748351789510663, journalId=1189533126771896327, articleId=1189605947804668198, companyId=1273234256122888199, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=College of Computer Science and Technology，Changchun University of Science and Technology，Changchun 130022，China), AuthorCompanyExt(id=1273234256148054026, tenantId=1045748351789510663, journalId=1189533126771896327, articleId=1189605947804668198, companyId=1273234256122888199, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=长春理工大学计算机科学技术学院，长春 130022)])]), Author(id=1273234256370352160, tenantId=1045748351789510663, journalId=1189533126771896327, articleId=1189605947804668198, orderNo=1, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1273234256441655334, tenantId=1045748351789510663, journalId=1189533126771896327, articleId=1189605947804668198, authorId=1273234256370352160, language=EN, stringName=Ao LI, firstName=Ao, middleName=null, lastName=LI, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=College of Computer Science and Technology，Changchun University of Science and Technology，Changchun 130022，China, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1273234256491986988, tenantId=1045748351789510663, journalId=1189533126771896327, articleId=1189605947804668198, authorId=1273234256370352160, language=CN, stringName=李澳, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=长春理工大学计算机科学技术学院，长春 130022, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1273234256122888199, tenantId=1045748351789510663, journalId=1189533126771896327, articleId=1189605947804668198, xref=null, ext=[AuthorCompanyExt(id=1273234256135471112, tenantId=1045748351789510663, journalId=1189533126771896327, articleId=1189605947804668198, companyId=1273234256122888199, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=College of Computer Science and Technology，Changchun University of Science and Technology，Changchun 130022，China), AuthorCompanyExt(id=1273234256148054026, tenantId=1045748351789510663, journalId=1189533126771896327, articleId=1189605947804668198, companyId=1273234256122888199, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=长春理工大学计算机科学技术学院，长春 130022)])]), Author(id=1273234256546512942, tenantId=1045748351789510663, journalId=1189533126771896327, articleId=1189605947804668198, orderNo=2, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1273234256613621816, tenantId=1045748351789510663, journalId=1189533126771896327, articleId=1189605947804668198, authorId=1273234256546512942, language=EN, stringName=Xiaoming JIANG, firstName=Xiaoming, middleName=null, lastName=JIANG, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=College of Computer Science and Technology，Changchun University of Science and Technology，Changchun 130022，China, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1273234256672342077, tenantId=1045748351789510663, journalId=1189533126771896327, articleId=1189605947804668198, authorId=1273234256546512942, language=CN, stringName=姜晓明, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=长春理工大学计算机科学技术学院，长春 130022, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1273234256122888199, tenantId=1045748351789510663, journalId=1189533126771896327, articleId=1189605947804668198, xref=null, ext=[AuthorCompanyExt(id=1273234256135471112, tenantId=1045748351789510663, journalId=1189533126771896327, articleId=1189605947804668198, companyId=1273234256122888199, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=College of Computer Science and Technology，Changchun University of Science and Technology，Changchun 130022，China), AuthorCompanyExt(id=1273234256148054026, tenantId=1045748351789510663, journalId=1189533126771896327, articleId=1189605947804668198, companyId=1273234256122888199, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=长春理工大学计算机科学技术学院，长春 130022)])]), Author(id=1273234256726868034, tenantId=1045748351789510663, journalId=1189533126771896327, articleId=1189605947804668198, orderNo=3, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1273234256789782604, tenantId=1045748351789510663, journalId=1189533126771896327, articleId=1189605947804668198, authorId=1273234256726868034, language=EN, stringName=Yanfang LI, firstName=Yanfang, middleName=null, lastName=LI, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=College of Computer Science and Technology，Changchun University of Science and Technology，Changchun 130022，China, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1273234256844308563, tenantId=1045748351789510663, journalId=1189533126771896327, articleId=1189605947804668198, authorId=1273234256726868034, language=CN, stringName=李岩芳, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=长春理工大学计算机科学技术学院，长春 130022, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1273234256122888199, tenantId=1045748351789510663, journalId=1189533126771896327, articleId=1189605947804668198, xref=null, ext=[AuthorCompanyExt(id=1273234256135471112, tenantId=1045748351789510663, journalId=1189533126771896327, articleId=1189605947804668198, companyId=1273234256122888199, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=College of Computer Science and Technology，Changchun University of Science and Technology，Changchun 130022，China), AuthorCompanyExt(id=1273234256148054026, tenantId=1045748351789510663, journalId=1189533126771896327, articleId=1189605947804668198, companyId=1273234256122888199, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=长春理工大学计算机科学技术学院，长春 130022)])])] 陈占芳,李澳,姜晓明,李岩芳. 融合变分自编码器的不完整多视图模糊聚类[J]. 中南民族大学学报（自然科学版）, 2025, 44(05): 664-674 DOI:10.20056/j.cnki.ZNMDZK.20250512

登录浏览全文

4963

注册一个新账户忘记密码

随着数据采集技术和特征提取方法的快速发展，多视图学习逐步成为数据挖掘的重要工具，在诸多领域得到广泛应用，如计算机视觉、生物信息学、自然语言处理等^［1-2］.不同视图既包含互补信息和一致信息，也包含许多冗余信息和不一致信息，综合多视图特征不仅可以形成对数据的全面描述，而且有利于它们的学习任务，如分类^［3］、聚类^［4］和度量学习^［5］.

传统的聚类只针对一个视图进行处理，没有充分利用数据在不同视图上的互补特征，或采用多个视图拼接到一起的方法，但可能会导致数据维度增长，模型计算复杂，性能急剧下降^［6-7］.在这样的背景下，多视图聚类^［8］（Multi-View Clustering， MVC）应运而生，其充分考虑每个视图提供的独特视角和信息，从不同角度理解和揭示数据背后的聚类模式.MVC侧重于挖掘不同视图的底层相关性，通过多个视图的互补信息与一致信息来实现有效的特征学习与聚类效果.现有的许多研究是在假设每个样本的所有视图都完整的理想前提下寻求解决方案，但在实际应用中完整的多视图数据通常难以获得.在某些情况下，样本可能缺失部分视图特征，从而产生不完整的多视图数据，严重影响不同视图之间的自然对齐特性，妨碍互补信息与一致信息的提取^［9-10］.因此，传统的多视图聚类算法无法有效处理这种不完整多视图数据，这便引发了对不完整多视图聚类（Incomplete Multi-view Clustering， IMC）算法的研究^［11-13］.

实际应用中，很多原因均会导致多视图数据的不完整性，如设备故障、隐私保护和数据传输限制等，深入研究如何对不完整多视图数据进行聚类，对于解决很多现实问题具有十分重要的意义^［14］.IMC的提出是为了解决数据缺失情况下传统聚类的局限性，传统的方法主要有两种，一是去除所有不完整的样本，然后对剩余的具有完整视图的样本进行聚类.另一类是简单的使用零或均值填充缺失的数据，然后使用传统的多视图聚类方法对数据进行处理.然而，删除缺失值会改变样本数量，从而导致有价值信息的严重丢失，当缺失率较大时，零值或均值填充也不能很好地反映原始数据的结构特征.

主流的不完整多视图聚类方法大多是基于非负矩阵分解、核学习以及图学习提出的，这些方法仍然存在一些局限性：（1）未能明确恢复丢失的视图特征，忽略了缺失视图的隐藏信息；（2）将多视图数据分解为所有视图共享的一致表示，需要大量的逆运算来进行矩阵分解，导致较高的时间复杂度；（3）提取到的子空间表示忽略了样本之间的差异，导致无法区分的数据没有正确地分组到相应的聚类中，从而影响聚类结果的准确性；（4）模型泛化能力差，无法处理任意类型的不完整多视图数据集.

随着对生成模型的深入研究，开发出了一些基于深度学习的、用于缺失视图恢复的IMC算法，这些方法通常需要为每个视图训练专用的生成器和鉴别器，当数据的视图特征较多时，模型复杂庞大，容易出现过拟合现象^［15-16］.且生成模型具有较大的不确定性，生成的视图特征可能大相径庭，因此按照生成的数据将样本严格划分到某个特定的簇中是不符合实际的.基于以上分析，本文提出了融合变分自编码器的不完整多视图模糊聚类，利用变分自编码器的生成能力补全缺失的视图特征，并采用模糊聚类代替传统的硬聚类，更有效的处理多模态问题.VAE-IMFC主要包括三个部分，即数据生成模块、排他自表达模块、模糊聚类模块，首先通过生成模块补全样本丢失的视图特征，进而通过排他性自表达模块生成样本的子空间表示，最后在模糊聚类模块完成聚类任务.

这篇论文的主要贡献如下：

（1）提出了一种新的IMC算法，该方法利用VAE的变分推断思想生成样本缺失的视图特征，使得模型不仅具有信息提取能力，更具有视图生成能力；

（2）在模型中提出排他性的自我表达模块来捕获簇间和簇内关系，通过引入

𝓁 1,2

正则化，使得子空间表示对不同的簇更具排他性，进一步提高聚类的准确性；

（3）使用模糊聚类代替传统的硬聚类，提供了更灵活的隶属度表示，有效解决了生成数据的模糊性和不确定性.

在四个数据集上与主流的七个相关聚类方法进行对比实验，可以发现VAE-IMFC在解决不完整多视图聚类问题上是更加有效的.

本文第1节简要描述了不完整多视图聚类的相关工作，第2节详细介绍了融合变分自编码器的不完整多视图模糊聚类模型，包括框架、每个模块的分析和训练过程.第3节给出实验设置及结果分析，第4节对本文的相关工作进行总结与展望.

1 相关工作

现有的不完整多视图聚类方法按照不同的学习机制可以划分成四类：

（1）基于矩阵分解（Matrix Factorization，MF）的IMC：将多视图数据分解为所有视图共享的一致表示，需要大量的逆运算来进行矩阵分解，导致较高的时间复杂度；

LI等人^［17］首次基于非负矩阵分解（NMF）提出了针对缺失数据的部分多视图聚类PVC方法，应用NMF分别获得成对样本和单视图样本的潜在公共表示，但是忽略了数据的几何结构.IMG^［18］是PVC的变体，通过引入流形约束挖掘数据不同类型的结构信息，具有更高的计算复杂度，但只适用于两视图数据.WEN等人^［19］通过集成图正则化和MF，提出基于图正则矩阵分解的不完整多视图聚类IMC-GRMF，利用间接方法从所有视图的潜在表征中获得共识表征，可以处理两个以上视图的数据，但是对特征维数要求较高，缺乏灵活性.

基于上述方法无法处理任意缺失视图的数据，SHAO等人^［20］提出了多视图不完整聚类MIC算法，在MF项上施加缺失信息预先构建的权重矩阵，消除缺失视图的负面影响.但过度关注缺失数据的影响，忽略了不同视图的贡献.SHAO等人^［21］提出在线多视图聚类OMVC，从所有视图衍生的潜在表示中获得共识表示，在学习共识表示方面提供了更大的自由度，但引入了额外的可调超参数，增加了最优参数选择的复杂性.CHEN等人^［22］通过将原始多视图数据分解为一个共识表示和多个基矩阵，提出一次不完全多视图聚类OPIMC，避免平凡解，但不利于提高判别性.HU等^［23］利用半NMF和正则化建模，将PVC算法拓展为双对齐缺失多视图聚类DAIMC算法，通过施加近似正交约束从数据中挖掘更多的信息，减少了缺失样本的影响.

近年来，WEN等^［24］提出具有柔性局部结构扩散的广义不完全多视图聚类GIMC-FLSD算法，引入语义一致性约束，刺激这些特定于视图的表示朝着统一的判别表示发展.为了有效提取隐藏信息，LIU等^［25］提出利用非负矩阵分解和低秩张量实现不完整多视图聚类的IMC-NLT方法，首次将降维方法生成的低维表示与低秩张量模型相结合.

（2）基于核学习（Kernel Learning）的IMC：试图从不完全的核数据中获得一致表示，只能应用于基于内核的多视图聚类；传统的多核聚类MKC要求输入核是完整的^［26］，所以不能处理IMC任务.为解决这一问题，许多研究者开始研究多重不完全核聚类（MIKC）^［27］.现有技术主要分为两类，一是基于拉普拉斯正则化和核典型相关分析（KCCA）的MIKC，二是基于多核k-means的MIKC^［28］.

TRIVEDI等人^［29］通过求解拉普拉斯正则化问题恢复了不完全核的缺失元素，提出带有一个完全核的多个不完全核聚类方法MIKC-OCK.通过对完全核进行KCCA，恢复不完全核，得到两个视图的潜在表示，然后进行k-means聚类.SHAO等人^［30］提出了集体核学习CoKL，通过在不同视图上优化拉普拉斯正则化问题来交互式地恢复不完整核矩阵，但只适用于具有两个视图的不完整数据.

上述方法只能处理一类不完全情况不适合实际应用，LIU等^［31］通过自适应的估算不完全核矩阵，提出具有不完全核的多核k-means MKKM-IK.该方法自适应地引入不完备核矩阵并进行组合，将估算和聚类集成到统一的框架中，鼓励这些不完全核矩阵相互完成.同时提出了具有互核完备的不完全核的多核k-means MKKM-IK-MKC，设计了三步迭代算法来求解由此产生的优化问题，进一步提高了聚类性能.LIU等^［32］提出了一种高效、有效的不完全多视图聚类EE-IMVC方法，对每个分离的不完整相似矩阵进行聚类，大大降低了计算复杂度和内存成本.高效的正则化不完整多视图聚类EE-R-IMVC^［33］通过简单有效的三步优化算法迭代求解目标函数改进EE-IMVC，避免了局部最优.

（3）基于图学习（Graph Learning）的IMC：试图从不完整的多视图数据中获得一致图，需要合理选择相似度度量方式和阈值；王等人^［34］提出一种面向摄动的不完全多视图聚类方法PIC，提供一种图学习方法来获得一些最近邻图.然而，PIC假设至少有一个视图是完整的，且对预构造图的质量也很敏感.WEN等人^［35］提出基于自适应图学习的不完整多视图光谱聚类IMSC-AGL方法，从多个视图中学习共识表示矩阵进行聚类，将自适应图构建和基于谱的一致性表示学习集成到联合优化框架中.但该方法不能挖掘数据的非线性结构信息，且忽略了缺失数据对视图的贡献.LI等^［36］人提出HCP-IMSC算法，有效恢复缺失多视图数据的子空间结构.该方法将多个亲和矩阵作为一个三阶低秩张量，通过张量分解正则化保持高阶视图相关性和样本相关性，以自加权的方式融合特定于视图的关联矩阵，得到统一的关联矩阵.在此基础上进一步构造一个超图，以保持不完整视图数据的高阶几何结构.然后，在超图诱导的超拉普拉斯正则化下，对缺少视图的样本进行重构.

（4）基于深度学习（Deep Learning）的IMC：对已知数据进行深度自编码，以获得潜在的高级表示，然后采用连接或求和等操作实现各视图的特征融合.受生成对抗网络^［37］的启发，开发出了一些用于缺失视图恢复的IMC算法，WANG等^［38］基于两视图间的映射关系提出了一种基于一致生成对抗网络的部分多视图聚类（PVC-GAN），该模型利用自动编码器和生成对抗网络补全缺失的视图，但只能处理两视图的数据.XU等人^［39］使用与PVC-GAN类似的框架提出了对抗性不完全多视图聚类（AIMC），将模型扩展为可以处理多个视图的数据.然而，AIMC要求一些样本必须具有完整的视图.

2 融合变分自编码器的不完整多视图模糊聚类

2.1 目的

本文的工作有两个主要目的，首先由于样本的不同视图之间有很大的差异，探索样本缺失的视图特征对多视图聚类非常重要.受变分自编码器（VAE）中变分推断思想的启发，本文通过概率模型对潜子空间进行描述，对数据中可能的变量分布进行清晰的建模，从而推断出缺失的数据，补全视图特征.

其次，提取更具鉴别性的子空间表示有利于将无法区分的样本分配到正确的集群中.通过引入基于

𝓁 1,2

正则化的排他性自我表达层，充分考虑不同集群之间样本的差异性，使学习到的子空间表示更具判别性.此外，由于VAE的生成过程是随机的，无法保证生成的数据确定属于某一个类别，因此采用模糊聚类的方法完成聚类任务，以此应对生成数据的不确定性.

2.2 符号

将不完整多视图数据矩阵划分为成对数据和缺失视图数据，

X (1) = {X p (1), X u (1)} ∈ R (p + u) × d 1

、

X (2) = {X p (2), X u (2)} ∈ R (p + u) × d 2

，如图1所示.其中p和u分别表示成对数据和缺失视图数据的数量，

d 1

和

d 2

是两个视图的相应特征维度.成对数据是

X p (1) ∈ R p × d 1

和

X p (2) ∈ R p × d 2

，不成对数据是

X u (1) ∈ R u × d 1

和

X u (2) ∈ R u × d 2

.E1和E2是两个视图的编码网络，D1和D2是对应的解码网络.

H p (1), H u (1) ∈ R (p + u) × k

和

H p (2), H u (2) ∈ R (p + u) × k

是潜在子空间表示，其中k是子空间表示的特征维数.

H ∈ R (p + 2 u) × k

是子空间特征融合的乘积，S是自表达的系数矩阵.

H ˜ u (1)

及

H ˜ u (2)

是潜在空间中通过随机采样生成的缺失视图潜在表示，

X ˜ u (1)

及

X ˜ u (2)

即为生成的缺失视图数据，

X^(1)

及

X^(2)

是两个视图的重构数据.本文的目标是将不完整的跨视图数据与相似数据准确地聚类在一起，并分离不同数据.

2.3 模型网络架构

本文提出的VAE-IMFC的模型网络架构如图2所示，主要由三个子模块组成：视图生成模块、排他自表达模块和模糊聚类模块，下面对每个模块进行详细介绍.

（1）视图生成模块：本文通过引入变分自编码器解决缺失视图特征的样本聚类问题，VAE的潜在空间通常是连续的，这使得它可以通过插值生成新数据.利用视图生成模块，

H p + u (1)

和

H p + u (2)

，另一方面通过随机采样得到缺失的视图特征

H ˜ u (1)

及

H ˜ u (2)

.编码器E1、E2由多个堆叠的全链接层构成，负责将原始空间的输入数据

X (1)

和

X (2)

映射到潜在空间的分布参数上，输出潜在分布的均值和方差.在训练的过程中，编码器的角色不是简单地对输入数据进行特征提取，而是为这些特征创建了一个可能的连续概率分布模型.通过学习概率分布的参数，模型能够在训练过程中学习到输入数据的主要特征，并生成与输入数据相似的新样本.

潜在层是生成模块的核心组成部分，它表示输入数据在潜在空间的分布，通过对潜在层的随机采样可以生成新的样本.在训练过程中，潜在空间的分布会逐渐接近给定的先验分布，借助已经掌握的概率分布进行反向分析，从而生成全新的样本，而不是简单地复制输入数据.

解码器D1、D2将从潜在层采样得到的潜在向量映射回原始输入空间，生成新的样本，结构与编码器相似，由多个全链接层构成.解码器的目标是通过反向重构过程尽量还原原始输入数据，并最大程度的接近生成样本的真实分布.

（2）排他性自表达模块：潜在空间中，模型执行特征融合来消除冗余信息，获得更强的特征表示，即将变换后的特征

H (1)

、

H (2)

（包括提取的低维特征和生成的缺失特征）融合为公共表示

H ∈ R (p + 2 u) × k

.为了获得更一致的子空间表示并保持不完全跨模态数据的结构，在该模块对特征H执行自表达运算，并获取与数据点相对应的关联矩阵.

同时为保证生成的关联矩阵更具判别性，在排他性自表达模块中将

𝓁 1,2

正则化约束在子空间表示上，使公共表示具有一定灵活性，允许不同的集群拥有自己的特征，使其更容易区分簇间和簇内关系.

（3）模糊聚类模块：由于VAE生成过程的随机性，导致其倾向于生成模糊或不确定的数据，且无法保证每个样本都是高质量的，所以生成模块所生成的低维特征可能没有严格的隶属关系.本文引入可能性C均值聚类方法完成聚类任务，利用模糊聚类的非线性和灵活性，将样本的隶属度扩展为0到1之间的任意值，该值表示数据点属于多个组的可能性或程度.一个样本可以以不同的隶属度属于不同的集群，聚类结果更加多样化.

2.4 目标函数

本文所提出的三个模块均对提高聚类性能发挥着重要作用，下面详细分析每个模块所对应的损失函数.

（1）视图生成模块：在模型训练的过程中所使用到的数据集包含了成对数据和缺失视图数据，生成模块不仅需要具备良好的数据生成能力，还要具备特征提取能力.因此，该模块的目标函数包含两个部分，即已有数据的重建误差，确保解码后的数据与原始数据尽可能接近.以及正则化项，确保生成模型可以采样到与输入数据不同的新样本，且仍具有输入数据的主要特征.生成模块的损失函数如下：

L g e n (θ, φ; X (v)) = E q φ (H | X (v)) [l o g p θ (X (v) | H)] - D K L (q φ (H | X (v)) | | p θ (H))

，（1）

其中

θ, φ

为模型中需要优化的参数，

X (v)

为v视图的数据，

H

为v视图的潜在变量，

q φ (H | X (v))

为潜在空间的概率分布，

p θ (H)

为先验分布（标准正态分布）.

上式中的第一项是重构误差，解码器的输出是原数据点的对数似然，再求期望，该似然越大，说明解码器产生原始数据的可能性越大，即重建误差越小.

正则项需要刻画推断模型与先验分布之间的差异，使用KL散度来度量，即公式中的第二项.KL散度可以用来衡量潜空间概率分布与标准正态分布的相似度，KL散度越小，两个分布越接近.

变分自动编码器的训练目标是最小化重构误差和潜在层与先验分布之间的KL散度，即最大化公式（1），通过优化这两个目标可以使得潜在层能够学习到输入数据的主要特征，并且生成具有多样性的新样本.

（2）排他性自表达模块：该模块针对配对数据，将两个视图的子空间表示逐元素相加，得到公共表示

H p

，进而将所有学习到的潜在表征融合为

H = H P ⊕ H u (1) ⊕ H u 2 ∈ R (p + 2 u) × k

，其中

⊕

表示特征拼接.针对融合特征H进行公式（2）的自表达运算，以学习更好的子空间表示

S ∈ R (p + 2 u) × (p + 2 u)

H = H S, d i a g (S) = 0

，（2）

其中约束项

d i a g (S) = 0

目的是为了防止出现平凡解

S = I

，则自表达学习损失可以表示为：

L e s = m i n | | H S - H | | F 2 + | | S | | F 2

，（3）

其中

| | ⋅ | | F 2

是F-范数的平方.

𝓁 1,2

正则化：自表达层提取的表示可能具有一些无法区分的数据，导致一些相似的数据被错误地聚类到不同的组中.为了使学习的表示更具判别性，VAE-IMFC在潜在表示S上引入了

𝓁 1,2

正则化，则损失函数定义为：

L 1,2 = m i n | | S | | 1,2 = m i n ∑ i = 1 p + 2 u (∑ j = 1 p + 2 u | s i j |) 2

.（4）

（3）模糊聚类模块：模糊聚类源于模糊逻辑，在对数据进行分组时，生成了属于每个集群的隶属度，为决策提供了更准确、更接近自然的解决方案，其目标函数定义如下：

L m = ∑ i = 1 N ∑ j = 1 C u i j m | | h i - c j | | 2 + ∑ i = 1 C η i ∑ j = 1 N (1 - u i j) m

，（5）

其中

h i

为第i个样本的多视图融合表示，

c j

为集群分配的第j个中心，

u i j

是个体

h i

属于集群j的隶属度，0 <

∑ j = 1 N u i j < = N

，

η i = ∑ j = 1 N u i j m * | | h i - c j | | 2 ∑ j = 1 N u i j m

，

m > 1

表示模糊指数，

| | ⋅ | |

表示数据点到聚类中心的距离.

通过集成三个模块的损失函数，得到模型总体目标函数，其中

λ

是调整目标函数中每个项的影响的参数.

L a l l = m i n (- L g e n) + λ 1 (L e s + L 1,2) + λ 2 L m

.（6）

2.5 模型训练

在算法VAE-IMFC中，为了更好地提高聚类性能，分两步对网络进行训练.

第一步：通过等式（1）预训练编码网络E1、E2和解码网络D1、D2以及潜子空间分布.首先通过编码网络E1、E2输入原始数据并提取潜在的子空间特征，同时随机采样得到缺失视图的潜在表示.然后，通过解码网络D1、D2重建子空间特征，将重建数据和原始数据的误差最小化，并最小化子空间分布与先验分布之间的KL散度.在预训练步骤中，随机初始化网络参数

θ (1), φ (1), θ (2), φ (2)

，并通过生成损失来优化这些参数，这一步骤的目标是为整体训练获得更好的初始化网络参数.

第二步：通过等式（6）完全训练网络.从第一步预训练中获得的网络参数作为初始值发送到第二步，进行整体训练.在整个训练过程中，用相对较小的值初始化参数

λ 1 、 λ 2

，并在｛0.001、0.01、0.1、10、100｝的范围内对其进行调整.此外，在这个过程中，不断更新自表达系数矩阵、聚类中心及数据隶属度，直至收敛.

3 实验与分析

在本节中，将所提出的VAE-IMFC算法与7个相关聚类方法在4个多视图数据集上进行对比实验，验证VAE-IMFC算法的聚类效果.

3.1 数据集

下面对实验中所使用的4个数据集进行详细介绍.

BDGP^［40］：该数据集为研究基因表达而设计，包含来自5个类别的2500张关于果蝇胚胎的图像，本文使用79维的文本特征向量和1750维的视觉特征向量进行实验.

Handwritten（HW）^［41］：该数据集包含2000个从0到9的手写数字图像，共有10个类别，每类包含200个样本，具有6种特征.本文选择了76个傅立叶系数（FOU）和216个轮廓相关性作为两个视图进行实验.

MNIST^［42］：从0到9的数字图像数据集，由60000个训练样本和10000个测试样本组成，每个图像的大小为28 × 28像素.随机选择4000个样本进行实验，将784维的原始图像和相应的边缘图像作为两种视图特征.

100leaves^［43］：该数据集共有1600个样本，包含100个类别的植物图片，每个样本使用三个视图特征进行描述，实验选取64维的形状描述和64维的纹理直方图特征进行聚类.

为构造具有不同缺失率的不完整多视图数据，本文针对所选取的4个数据集的每个视图随机删除一些样本，并保证每个样本至少保留一个视图特征，通过此方式构造缺失率为0.1、0.2、0.3、0.4、0.5的实验数据.

3.2 对比算法

为了说明本文方法的性能，将VAE-IMFC与以下7种主流的不完整多视图聚类算法进行比较：

（1）BSV^［18］：首先用均值填充缺失的视图，然后对每个视图进行光谱聚类，并报告最佳的单视图聚类结果.

（2）AMGL^［44］：首先使用均值填充丢失的数据，然后通过该算法自动学习每个图的最优权重.

（3）IMG^［18］：通过引入具有良好概率解释的图拉普拉斯项来耦合不完全多模态样本.

（4）EE-R-IMVC^［33］：该方法首先补全了核矩阵中缺失的数据，进而学习一致聚类矩阵进行聚类.

（5）GIMC-FLSD^［24］：利用不完全数据的局部信息，同时引入语义一致性约束，将特定于视图的表示刺激为统一的判别表示，学习用于聚类的公共表示.

（6）HCP-IMSC^［36］：将张量分解正则化施加到视图特定的亲和矩阵上捕捉样本的高阶相关性，并重构缺少视图的样本，恢复不完整多视图数据的子空间结构，最后在统一亲和矩阵上进行谱聚类.

（7）IMC-NLT^［25］：首先使用低秩张量来保留具有统一维度的视图特征，然后使用一致性度量在多个视图中捕获一致的表示，最后将多重学习整合到一个统一的模型中有效地提取隐藏信息.

3.3 实验设置及评价指标

实验所采用的硬件环境是NVIDIA RTX 3080GPU，40 GB内存，软件环境采用Pytorch 1.11.0，python3.8，cuda11.3.实验中使用Adam优化器训练模型，学习率设置为0.0001.此外，实验中测试了其他方法的性能，所有对比算法均采用其论文中推荐的参数设置.实验使用了三种典型的聚类验证指标进行性能评估，即聚类精度（ACC）、归一化互信息（NMI）和调整后兰德指数（ARI）.

3.4 对比实验结果

表1至表4分别展示了四个数据集在不同缺失率下，各对比算法的ACC和NMI值，每个数据集上的最优及次优结果分别用粗体和下划线标出.图3采用柱状图的形式展示了三个数据集上不同算法随着缺失率的增加ARI的变化趋势，通过对比不同模型的聚类指标可以得到以下结论.

（1）从表1到表4可以观察到，本文所提出的算法在不同缺失率下均能取得较好的聚类效果，这表明利用视图生成模型推断丢失的数据，确保了各视图的完整性和一致性，同时利用排他性自表达模块可以构造更具鉴别性的子空间表示，从而获得更好的聚类效果.当缺失率为0.5时，模型的ACC和NMI提升最多，在BDGP数据集上，VAE-IMFC的ACC值相比次优算法提升了9.62%，NMI值提升了8.46%.在数据集HW上，ACC和NMI分别提升了0.7%，2.61%.在sampled MNIST数据集上，ACC、NMI分别提升了5.12%，5.62%.在数据集100leaves上，ACC、NMI分别提升了4.12%，4.19%.由此可知，缺失率越高，VAE-IMFC算法的聚类指标相比其他方法具有更大的提升，本文提出的算法对缺失率较高的数据集具有更好的聚类效果.此外，缺失率较低时，大多数情况下模型仍然能取得最好的聚类效果，进一步验证了模型的泛化能力；

（2）表1-4所示，与其他多视图算法相比，单视图聚类BSV的聚类效果通常比多视图聚类算法效果差.由此可知，仅考虑单一视图无法全面捕捉数据的复杂性和多样性.多视图聚类通过整合多个视图的信息，能够更准确地反映数据的内在结构和分布，提高聚类效果.

（3）图3显示，随着缺失率的增加，8种不同聚类算法的ARI值均持续下降.由此可知，视图的缺失会影响样本的聚类效果，缺失率越高，聚类效果越差.尤其BSV的下降趋势最为明显，这表明直接使用均值填充缺失的视图特征，并不能提升聚类表现.而VAE-IMFC使用变分自编码器来生成缺失的视图特征，可以获得更好的聚类结果.且随着缺失率的上升，VAE-IMFC算法的下降趋势更为缓慢，没有因为数据缺失率变高而出现明显的性能下降.这表明，该算法对缺失率的变化具有极强的适应性，能够对缺失数据进行有效聚类.

3.5 消融实验

本小节针对VAE-IMFC算法中的网络模块进行消融研究，在缺失率为0.1， 0.2， 0.3， 0.4， 0.5 的BDGP数据集上分别验证视图生成模块、排他性自表达模块和模糊聚类模块在算法模型中的有效性，实验设置如下：

（1）验证视图生成模块：使用自编码器代替视图生成模块，对输入的多视图数据进行降维，提取视图中的有效信息，防止出现维度灾难，无法进行聚类计算；

（2）验证排他性自表达模块：使用串联融合，代替排他性自表达模块，将提取到的低维特征进行拼接，得到多视图样本的公共表示；

（3）验证模糊聚类模块：使用传统的k-means聚类代替可能性C均值聚类，完成聚类任务.

不同实验设置在数据集BDGP上的ACC结果见表5，从表中观察到，本文所提出的VAE-IMFC模型聚类精度最高，因此视图生成模块、排他性自表达模块和模糊聚类模块所构成的算法模型具有较好的聚类效果，模型中的每个模块对最终的聚类性能都有促进作用.其中视图生成模块的作用最显著，当缺少该模块时，聚类效果显著下降，且缺失率越高，聚类性能下降越明显，由此可知本文所介绍的生成模块对缺失视图的处理具有显著效果，尤其是针对缺失率较高的数据，其改进效果更加明显.此外，排他性自表达模块和模糊聚类模块对模型的影响相对较小，随着缺失率的不断增加，使用k-means聚类的模型性能下降更为明显，由此可知生成的数据具有不确定性，无法使用传统的方法进行有效聚类.

5 结论

本文针对缺失视图特征的样本聚类问题，提出融合变分自编码器的不完整多视图模糊聚类算法，该方法结合了变分自动编码器中概率编码的思想，通过对潜在表示的建模，实现了灵活的视图生成过程，使模型不仅具有特征提取能力，还具有视图生成能力.同时引入

𝓁 1,2

正则化的自表达层为聚类任务提供了更具鉴别性的子空间表示，并通过使用可能性C均值聚类方法得到更灵活且符合实际情况的聚类结果，进一步提高聚类性能.通过大量实验进一步验证了本文所提方法在多个数据集上的有效性，未来可进一步验证该方法在大规模数据集上的聚类效果.

参考文献

原文顺序 | 出版日期 | 本文引用

[1]	LIANG N， YANG Z， XIE S. Incomplete multi-view clustering with sample-level auto-weighted graph fusion［J］. IEEE Transactions on Knowledge and Data Engineering， 2022， 35（6）： 6504-6511.

[2]	范瑞东，侯臣平. 鲁棒自加权的多视图子空间聚类［J］. 计算机科学与探索， 2021， 15（6）： 1062-1073.

[3]	BIAN J， ZHANG S， WANG S， et al. Skin lesion classification by multi-view filtered transfer learning［J］. IEEE Access， 2021， 9： 66052-66061.

[4]	ZHAO L， WANG X， LIU Z， et al. Deep probability multi-view feature learning for data clustering［J］. Expert Systems with Applications， 2023， 217： 119458.

[5]	CHAO G， SUN S， BI J. A survey on multi-view clustering［J］. IEEE Transactions on Artificial Intelligence， 2021， 2（2）： 146-168.

[6]	WANG S， LIU X， ZHU X， et al. Fast parameter-free multi-view subspace clustering with consensus anchor guidance［J］. IEEE Transactions on Image Processing， 2021， 31： 556-568.

[7]	LIN Y， GOU Y， LIU X， et al. Dual contrastive prediction for incomplete multi-view representation learning［J］. IEEE Transactions on Pattern Analysis and Machine Intelligence， 2023， 45（4）： 4447-4461.

[8]	LIU S， WANG S， ZHANG P， et al. Efficient one-pass multi-view subspace clustering with consensus anchors［J］. Proceedings of the AAAI Conference on Artificial Intelligence， 2022， 36（7）： 7576-7584.

[9]	刘晓琳，白亮，赵兴旺，等. 基于多阶近邻融合的不完整多视图聚类算法［J］. 软件学报， 2022， 33（4）： 1354-1372.

[10]	张熠玲，杨燕，周威，等. CMvSC：知识迁移下的深度一致性多视图谱聚类网络［J］. 软件学报， 2022， 33（4）： 1373-1389.

[11]	KANG Z， SHI G， HUANG S， et al. Multi-graph fusion for multi-view spectral clustering［J］. Knowledge-Based Systems， 2020， 189： 105102.

[12]	TAO H， HOU C， YI D， et al. Joint embedding learning and low-rank approximation： A framework for incomplete multiview learning［J］. IEEE Transactions on Cybernetics， 2021， 51（3）： 1690-1703.

[13]	WANG Q， LIAN H， SUN G， et al. iCmSC： Incomplete cross-modal subspace clustering［J］. IEEE Transactions on Image Processing， 2020， 30： 305-317.

[14]	WEN J， WU Z， ZHANG Z， et al. Structural deep incomplete multi-view clustering network［C］//Proceedings of the 30th ACM International Conference on Information & Knowledge Management. Virtual：ACM， 2021： 3538-3542.

[15]	TREVISAN DE SOUZA V L， MARQUES B A D， BATAGELO H C， et al. A review on Generative Adversarial Networks for image generation［J］. Computers & Graphics， 2023， 114： 13-25.

[16]	KARRAS T， LAINE S， AILA T. A style-based generator architecture for generative adversarial networks［C］//2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition （CVPR）. Long Beach：IEEE， 2019： 4396-4405.

[17]	LI S Y， JIANG Y， ZHOU Z H. Partial multi-view clustering［J］. Proceedings of the AAAI Conference on Artificial Intelligence， 2014， 28（1）： 1968-1974.

[18]	ZHAO H， LIU H， FU Y， et al. Incomplete multi-modal visual data grouping［C］//Proceedings of the Twenty-Fifth International Joint Conference on Artificial Intelligence. New York：ACM， 2016： 2392-2398.

[19]	WEN J， ZHANG Z， XU Y， et al. Incomplete multi-view clustering via graph regularized matrix factorization［C］//Computer Vision-ECCV 2018 Workshops. Munich：ACM， 2019： 593-608.

[20]	SHAO W， HE L， YU P S. Multiple incomplete views clustering via weighted nonnegative matrix factorization with regularization［C］// Machine Learning and Knowledge Discovery in Databases. Cham： Springer International Publishing， 2015： 318-334.

[21]	SHAO W， HE L， LU C T， et al. Online multi-view clustering with incomplete views［C］//2016 IEEE International Conference on Big Data. Washington：IEEE， 2016： 1012-1017.

[22]	HU M， CHEN S. One-pass incomplete multi-view clustering［J］. Proceedings of the AAAI Conference on Artificial Intelligence， 2019， 33（1）： 3838-3845.

[23]	HU M， CHEN S， HU M， et al. Doubly aligned incomplete multi-view clustering［C］//Proceedings of the 27th International Joint Conference on Artificial Intelligence. Stockholm：ACM， 2018： 2262-2268.

[24]	WEN J， ZHANG Z， ZHANG Z， et al. Generalized incomplete multiview clustering with flexible locality structure diffusion［J］. IEEE Transactions on Cybernetics， 2021， 51（1）： 101-114.

[25]	LIU Z， CHEN Z， LI Y， et al. IMC-NLT： Incomplete multi-view clustering by NMF and low-rank tensor［J］. Expert Systems with Applications， 2023， 221： 119742.

[26]	LIU X. Incomplete multiple kernel alignment maximization for clustering［J］. IEEE Transactions on Pattern Analysis and Machine Intelligence， 2024， 46（3）： 1412-1424.

[27]	MONNEY A， ZHAN Y， JIANG Z， et al. A multi-kernel method of measuring adaptive similarity for spectral clustering［J］. Expert Systems with Applications， 2020， 159： 113570.

[28]	杜亮，任鑫，张海莹，等. 基于局部回归融合的多核聚类方法［J］. 计算机科学， 2021， 48（8）： 47-52.

[29]	TRIVEDI A， RAI P， DAUME III H， et al. Multiview clustering with incomplete views［C］// NIPS workshop. Citeseer：NIPS， 2010： 1-8.

[30]	SHAO W， SHI X， YU P S. Clustering on multiple incomplete datasets via collective kernel learning［C］//2013 IEEE 13th International Conference on Data Mining.Dallas： IEEE， 2013： 1181-1186.

[31]	LIU X， ZHU X， LI M， et al. Multiple kernel $k$k-means with incomplete kernels［J］. IEEE Transactions on Pattern Analysis and Machine Intelligence， 2020， 42（5）： 1191-1204.

[32]	LIU X， LI M， TANG C， et al. Efficient and effective regularized incomplete multi-view clustering［J］. IEEE Transactions on Pattern Analysis and Machine Intelligence， 2020， 43（8）： 2634-2646.

[33]	TANG C， LIU X， ZHU X， et al. CGD： Multi-view clustering via cross-view graph diffusion［J］. Proceedings of the AAAI Conference on Artificial Intelligence， 2020， 34（4）： 5924-5931.

[34]	WANG H， ZONG L， LIU B， et al. Spectral perturbation meets incomplete multi-view data［C］//Proceedings of the 28th International Joint Conference on Artificial Intelligence. Macao：ACM， 2019： 3677-3683.

[35]	WEN J， XU Y， LIU H. Incomplete multiview spectral clustering with adaptive graph learning［J］. IEEE Transactions on Cybernetics， 2020， 50（4）： 1418-1429.

[36]	LI Z， TANG C， ZHENG X， et al. High-order correlation preserved incomplete multi-view subspace clustering［J］. IEEE Transactions on Image Processing， 2022， 31： 2067-2080.

[37]	ZHANG H， SINDAGI V， PATEL V M. Image de-raining using a conditional generative adversarial network［J］. IEEE Transactions on Circuits and Systems for Video Technology， 2020， 30（11）： 3943-3956.

[38]	WANG Q， DING Z， TAO Z， et al. Partial multi-view clustering via consistent GAN［C］//2018 IEEE International Conference on Data Mining （ICDM）. Singapore：IEEE， 2018： 1290-1295.

[39]	XU C， GUAN Z， ZHAO W， et al. Adversarial incomplete multi-view clustering［C］//Proceedings of the 28th International Joint Conference on Artificial Intelligence. Macao： ACM， 2019： 3933-3939.

[40]	WANG X， SUN X， ZHANG X. Multi-view clustering network based on contrastive learning and CycleGAN［C］//2024 International Joint Conference on Neural Networks （IJCNN）. Yokohama： IEEE， 2024： 1-7.

[41]	GONGIDI S， JAWAHAR C V. Iiit-Indic-hw-words： A dataset for Indic handwritten text recognition［C］// Document Analysis and Recognition-ICDAR 2021. Cham： Springer International Publishing， 2021： 444-459.

[42]	WILLIAMS J. Building a digit classifier with MNIST［J］. Mathematics Teacher： Learning and Teaching PK-12， 2024， 117（2）： 129-137.

[43]	YANG X F， WANG D L， PAN J H， et al. Creating Universum for class imbalance via locality and its application in multiview subspace learning［J］. Information Sciences， 2023， 647： 119478.

[44]	NIE F， CAI G， LI J， et al. Auto-weighted multi-view learning for image clustering and semi-supervised classification［J］. IEEE Transactions on Image Processing， 2018， 27（3）： 1501-1511.