摘要:针对现有的局部离群点检测算法对数据对象不加分区,致使计算复杂度高的问题,提出了一种基于偏离的局部离群点检测算法。该算法首先对数据集进行分区,将可能存在的局部离群点与其紧邻的簇划分到一个数据块中,然后在每个数据块内,根据离散系数刻画各个数据对象的偏离度,从而求得每个数据对象在其所属的数据块内的局部偏离因子,发现可能存在的局部离群点。理论分析和实验结果表明,该算法具有良好的识别局部离群点的能力,检测的准确率和时间效率均优于经典的LOF算法。
关键词:聚类 局部离群点检测 局部偏离因子 离散系数
单位:北京交通大学 北京100044 集美大学航海学院 厦门361021
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社