摘要:本文针对κ-modes算法在类的表示方面存在的不足,提出用摘要信息来表示一个类,并给出了一种适用于混合属性的距离定义,得到增强的κ-means算法——κ-summary算法。理论分析和实验结果表明,κ-sumnlary算法较κ—modes算法和κ-prototypes算法具有更好的精度。
关键词:数据挖掘 聚类算法 算法
单位:衡阳师范学院计算机系; 湖南衡阳421008; 华中科技大学计算机科学与技术学院; 湖北武汉430074
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社