线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

Web文本分类中的反作弊研究

付敬鼎; 张建勇'; 贾晓强 新一代信息技术 2013年第18期

摘要:根据用户定义的某一主题,在爬虫算法中加入反作弊思想后,用爬虫算法遍历网络,收集与主题相关的页面进行智能分析,同时将文本过滤转化为文本分类,为了增强通用性,在算法中加入了松弛变量,最后在NB分类个器上验证算法的性能。试验表明,分类精度达到将近90%。

关键词:主题爬虫文本分类反作弊松弛变量

单位:渭南师范学院数学与信息科学学院

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

新一代信息技术

部级期刊

关注 0人评论|0人关注