摘要:在数据挖掘领域,模糊C均值聚类法(FCM)在处理小量低维的数据挖掘时是有效的,但是面向数据库的数据挖掘经常要处理大量、高维的数据.在这种情况下,FCM算法在时间性能上难以令人满意.本文基于采样技术对FCM算法进行改进,以提高算法的时间性能,并利用遗传算法对聚类结果进行优化以保证聚类的质量,给出了一种新的基于遗传优化的采样模糊C均值聚类算法SF(Sampling FCM with Genetic Optimization).仿真实验证明SFGO算法在大规模数据库的聚类挖掘中,在时间性能和聚类质量上都能获得较满意的结果.
关键词:数据挖掘 采样 模糊c均值聚类 遗传算法
单位:中国地质大学管理学院; 湖北武汉430074; 华中科技大学管理学院; 湖北武汉430074
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社