线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

基于大数据的异常检测方法研究

杨先圣; 姜磊; 彭雄; 周倩; 刘菊君 计算机工程与科学 2018年第07期

摘要:离群数据检测,主要目的是从海量数据中发现异常数据。其有以下两点好处:第一,作为数据预处理工作,减少噪声点对模型的影响;第二,针对特定场景检测出异常,并对异常现象本身进行挖掘,也非常有价值。目前,国内外主流的方法像LOF、KNN、ORCA等,无法兼顾全局离群点、局部离群点和离群簇同时存在的复杂场景的检测。针对这一情况,提出了一种新的离群数据检测模型。为了能够最大限度对全局、局部离群数据以及离群簇的全面检测,基于iForest、LOF、DBSCAN分别对于全局离群点、局部离群点、离群簇的高度敏感度,选定该三种特定基分类器,并且改变其目标函数,修正框架的错误率计算方式,进行融合,形成了新的离群数据检测模型ILD-BOOST。实验结果表明,该模型充分兼顾了全局和局部离群数据及离群簇的检测,且效果优于目前主流的离群数据检测方法。

关键词:离群数据检测模型融合商业大数据提升框架

单位:湖南科技大学知识处理与网格化制造湖南省普通高校重点实验室; 湖南湘潭411201; 步步高商业连锁股份有限公司; 湖南湘潭411000

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程与科学

北大期刊

¥624.00

关注 46人评论|5人关注