摘要:CFSFDP是基于密度的新型聚类算法,可聚类非球形数据集,具有聚类速度快、实现简单等优点。然而该算法在指定全局密度阈值dc时未考虑数据空间分布特性,导致聚类质量下降,且无法对多密度峰值的数据集准确聚类。针对以上缺点,提出基于网格分区的CFSFDP(简称GbCFSFDP)聚类算法。该算法利用网格分区方法将数据集进行分区,并对各分区进行局部聚类,避免使用全局dc,然后进行子类合并,实现对数据密度与类间距分布不均匀及多密度峰值的数据集准确聚类。两个典型数据集的仿真实验表明,GbCFSFDP算法比CFSFDP算法具有更加精确的聚类效果。
关键词:聚类 密度阈值 网格分区 类合并
单位:苏州大学计算机科学与技术学院; 江苏苏州215006; 常熟理工学院计算机科学与工程学院; 江苏常熟215500; 重庆大学计算机学院; 重庆400030
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社