摘要:企业数据中心作为辅助决策的重要工具,保证其数据的及时性、准确性和科学性是最基本的要求和最核心的原则。对于数据异常的情况,若仅依靠人为的经验在海量数据中进行判断是很困难的,也是不科学且低效的。针对企业购销存数据的准确性问题,研究了基于机器学习的数据异常检测算法。由于购销存数据是由一组相对固定的数据项组成,可以看作是一个结构化数据序列,因此选择了解决结构化序列预测问题最为有效的条件随机场模型CRFs。通过对大量历史数据进行学习,分析出数据的自身规律以及关联关系,使计算机具备自动检测异常的能力。实验结果表明了该算法的有效性。
关键词:数据中心 机器学习 数据异常检测 条件随机场模型
单位:国防科学技术大学计算机学院 湖南长沙410073 湖南省烟草专卖局(公司)经济信息中心 湖南长沙410004
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社