首页 > 期刊 > 新一代信息技术 > Web文本分类中的反作弊研究 【正文】
摘要:根据用户定义的某一主题,在爬虫算法中加入反作弊思想后,用爬虫算法遍历网络,收集与主题相关的页面进行智能分析,同时将文本过滤转化为文本分类,为了增强通用性,在算法中加入了松弛变量,最后在NB分类个器上验证算法的性能。试验表明,分类精度达到将近90%。
关键词:主题爬虫 文本分类 反作弊 松弛变量
单位:渭南师范学院数学与信息科学学院
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
相关期刊
部级期刊