摘要:传统k-means算法需要人为指定聚类数k,对初始中心点的选取比较敏感,只能发现球状簇.针对k-means算法的不足,提出了基于可变网格优化的k-means聚类算法,该算法通过可变网格划分解决了随机选取初始中心点不具有代表性的问题,同时排除了噪声的干扰.此外,针对最大密度不唯一的情况进行了研究,选取各距离最大的类簇为最优类簇.最后,基于可变网格优化的k-means算法结合BWP指标对最佳聚类数进行了优化,解决了最佳聚类数事先无法确定的问题.理论和实验结果表明,基于可变网格优化的k—means算法具有更好的有效性和可行性.
关键词:可变网格 初始中心点 bwp指标
单位:哈尔滨理工大学计算机科学与技术学院; 哈尔滨150080
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社