摘要:聚类分析是统计、模式识别和数据挖掘等领域中一个非常重要的研究课题,具有广泛的应用前景,受物理学中场论思想的启发,提出一种基于数据场的层次聚类方法,该方法将物质粒子间的相互作用及其场描述方法引入抽象的数域空间,通过模拟对象在虚拟数据场中的相互作用和运动实现数据对象的自组织层次聚集,实验显示,该方法不依赖于用户输入参数的仔细选择,能够发现任意大小和密度的非球形聚类,对噪声数据不敏感,且具有近似线性的收敛速度。
关键词:聚类分析 层次聚类 数据场
单位:清华大学计算机系; 北京100084; 电子系统工程研究所; 北京100039
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社