摘要:针对影响k-means聚类效果的聚类数目和初始中心点两大因素,提出了基于双重遗传的k-means算法。它用外层遗传算法控制聚类数目,用内层遗传算法控制聚类的初始中心点,并采用类间距离和类内距离以及二者之间的比值来评价聚类结果的好坏,在算法终止后,可同时求得较优的聚类数目和某聚类数目下的较优初始中心点。此外,根据内外层遗传算法的特殊性,采用不同的编码策略适应算法需求,为保留优质个体,采用精英个体保留策略。通过UCI数据集测试实例证明此算法有很好的实用性,对数据挖掘技术有一定参考价值。
关键词:双重遗传 聚类分析 分层编码 精英保留
单位:大连海事大学交通运输管理学院; 辽宁大连116026
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社