线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

基于网格的快速搜寻密度峰值的聚类算法优化研究

孙昊; 张明新; 戴娇; 尚赵伟 计算机工程与科学 2017年第05期

摘要:CFSFDP是基于密度的新型聚类算法,可聚类非球形数据集,具有聚类速度快、实现简单等优点。然而该算法在指定全局密度阈值dc时未考虑数据空间分布特性,导致聚类质量下降,且无法对多密度峰值的数据集准确聚类。针对以上缺点,提出基于网格分区的CFSFDP(简称GbCFSFDP)聚类算法。该算法利用网格分区方法将数据集进行分区,并对各分区进行局部聚类,避免使用全局dc,然后进行子类合并,实现对数据密度与类间距分布不均匀及多密度峰值的数据集准确聚类。两个典型数据集的仿真实验表明,GbCFSFDP算法比CFSFDP算法具有更加精确的聚类效果。

关键词:聚类密度阈值网格分区类合并

单位:苏州大学计算机科学与技术学院; 江苏苏州215006; 常熟理工学院计算机科学与工程学院; 江苏常熟215500; 重庆大学计算机学院; 重庆400030

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程与科学

北大期刊

¥624.00

关注 46人评论|5人关注