线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

数据抽取中噪音过滤应用研究

郭东峰 新一代信息技术 2014年第06期

摘要:在数据抽取中,网页中噪音数据的处理是关键的第一步。针对噪音数据类型以及它们在网页中的位置,采取利用启发式规则和基于文本内容方法两种策略分步对噪音数据区域过滤,使用kNN文本分类算法进一步对列表页中的非用户关注栏目过滤。

关键词:噪音过滤knn分类算法

单位:新乡学院计算机与信息工程学院; 河南新乡453000

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

新一代信息技术

部级期刊

关注 0人评论|0人关注