基于高阶图融合的多视图聚类算法

基于高阶图融合的多视图聚类算法

随着互联网和通信技术的飞速发展,产生了海量的数据, 这些数据往往有着不同的来源或者多样化的表现形式。这一类数据统称为多视图数据。随着多视图数据的维度越来越高。数据量也越来越大,。获取数据的标签往往比较费时费力。作为无监督学习的一个典型分支,多视图聚类显得尤为关键。

本文的研究重点聚焦于面向复杂多视图数据的表示学习及聚类方法。通过引入二阶邻近关系,学习最逼近于多视图数据的图结构,并挖掘不同视图之间的复杂关联来提升多视图聚类算法的性能。这一方法的潜在应用包括遥感领域的波段选择,生物信息领域癌症亚型识别等,为挖掘多视图数据局部结构和全局结构提供了高效的工具。

研究团队

尤运宁、唐厂、邹鑫、刘袁缘、蒋良孝:中国地质大学(武汉)计算机学院

刘新旺:国防科技大学计算机学院

张长青:天津大学智能与计算学部

本文工作

本文提出了一种新颖的基于高阶图融合的多视图聚类算法 (HCDMC)。与利用经典的权重学习方法不同,我们的算法利用一阶和二阶邻近图通过隐式权重学习策略为每个视图构造相应高阶图。通过这种方式,有效地编码了高阶信息,并减少了揭示数据内真实结构时噪声或不准确的相似度干扰。同时, 利用希尔伯特独立性准则约束得到的每个高阶图, 使得到的一致性高阶图具有多样性。最后, 对一致性高阶图施加 Laplacian 秩约束,以确保存在恰好 k 个连通分量,,即k 个类簇,直接得到聚类标签矩阵,无需后处理操作。

基于高阶图融合的多视图聚类算法

本文的创新点如下:

1) 我们提出了一种新颖的多视图聚类算法,将隐式的权重学习策略构造高阶图,高阶图互补性学习,聚类过程统一到一个的框架中。

2) 利用一阶和二阶邻近图通过隐式权重,学习策略为每个视图构造相应高阶图。通过这种方式,,有效地编码了高阶信息,并减少了揭示数据内真实结构时噪声或或不准确的相似度干扰。

3) 利用希尔伯特独立性准则,加强了高阶图之间的互补信息,更充分地探索了多视图聚类信息。

实验结果

选择11个多视图聚类对比方法,在六个真实数据集上进行评估该算法,对于所有方法,我们重复 20 次实验以消除 k-means 引起的随机性影响。我们提出的算法明显优于所有对比方法。在所有数据集上的表现都最好,除了NMI 指标下的 BRCA 数据集和 Purity 指标下的 Yale 数据集。在所有基于图的方法,即 CoReg、AASC、WMSC、CGD、GMC 和 HCDMC,我们的算法和 GMC 表现出了很好的稳定性 (几乎没有方差的波动)。对于 CoReg、AASC 和 WMSC, 它们将多视图的一致性表示学习和 k-means 分离开来。由于 k-means 对初始化的簇类中心很敏感,这导致它们 的标准差波动较大。

基于高阶图融合的多视图聚类算法

以数据集 MSRC-v1 为例,我们对HCDMC和基于图的多视图聚类对比方法(CoReg、GMC、CGD、MCGC)最终的一致性图矩阵进行可视化。可以发现 MCGC 和 CGD 不能清晰地展示出块对角结构 (MCGC 算法通过分解拉普 拉斯得到谱嵌入表示,会破坏图结构的完整性,随后又通过使用谱嵌入表示做内积的方式学习一致性图,这个过程会损失很多聚类信息,导致图的聚类结构不明显,没有直接学习从原始数据中学习出的 相似图的块对角结构那么明显)。CoReg 能够呈现出块对角线结构,但数量不正确。注意到 GMC 获 得的块对角线结构与我们的方法类似,但包含更多的噪声。我们的算法呈现出清晰的块对角结构,并且块对角的数量等于簇类数量,干扰的噪声也明显小于其他的方法。

基于高阶图融合的多视图聚类算法

文章还对高阶邻近关系的影响进行探讨,我们定义了三种形式中,分别代表了聚类只考虑图中一阶邻近关系, 一阶和二阶邻近关系,一阶、二阶和三阶邻近关系。从表6 中可以看出,图中高阶邻近信息发挥了重要作用。例如,除了 LGG 数据集外,考虑一阶和二阶邻近关系图的聚类性能优于只考虑一阶邻近关系。相比之下, 考虑三种邻接关系的图存在冗余信息,导致聚类性能没有明显提升。此外,三阶邻近关系的数学理论还不是不充分的,总体来说在实践中只考虑两种邻接关系的图结构似乎是最优选择。

基于高阶图融合的多视图聚类算法

文章下载

尤运宁, 唐厂, 刘新旺,邹鑫, 刘袁缘, 蒋良孝,张长青. 基于高阶图融合的多视图聚类算法. 中国科学: 信息科学,2024,doi:10.1360/SSI-2023-0217

基于高阶图融合的多视图聚类算法

版权声明:本文内容转自互联网,本文观点仅代表作者本人。本站仅提供信息存储空间服务,所有权归原作者所有。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至1393616908@qq.com 举报,一经查实,本站将立刻删除。

(0)

相关推荐

发表回复

登录后才能评论