摘要:谱聚类是近来出现的一种性能极具竞争力的聚类方法,它的成功很大程度依赖于相似性度量的选择.本文通过分析这一性质并结合数据聚类特性,提出一种数据依赖的相似性度量——密度敏感的相似性度量.该相似性度量可以有效描述数据的实际聚类分布.将其引入谱聚类得到密度敏感的谱聚类算法.与原有的谱聚类算法相比,新算法不仅能够处理多尺度聚类问题,而且对参数选择相对不敏感.算法有效性分析以及实验验证了所提算法的有效性和可行性.
关键词:聚类 谱聚类 距离测度 相似性度量 相似性矩阵
单位:西安电子科技大学智能信息处理研究所; 陕西西安710071
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社