基于余弦距离的局部敏感哈希的KNN算法在中文文本上的快速分类_参考资料-爱发表

线上期刊服务咨询，发表咨询：400-808-1701 订阅咨询：400-808-1721

购物车(0) 个人中心关于我们在线客服

首页 > 期刊 > 计算机工程与科学 > 基于余弦距离的局部敏感哈希的KNN算法在中文文本上的快速分类【正文】

基于余弦距离的局部敏感哈希的KNN算法在中文文本上的快速分类

戴上平冯鹏刘盛英杰舒红计算机工程与科学 2015年第10期

摘要：文本分类是文本挖掘中最重要的研究内容之一.为了克服目前以距离衡量的近似分类算法在海量数据下耗费大量时间的缺陷,提出了结合基于余弦距离的局部敏感哈希的方式将KNN算法在TF-IDF下对中文文本进行快速分类.同时结合文本数据的特性给出了不同的哈希函数级联方式分别进行实验.在实验过程采用了布尔向量的方式规避重复访问,使分类的结果在可以允许的范围内,分类速度比原始KNN提高了许多.

关键词：文本分类局部敏感哈希 knn 布尔向量

单位：华中师范大学计算机学院湖北武汉430079 测绘遥感信息工程国家重点实验室湖北武汉430079

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

在线咨询期刊咨询

相关期刊

科技与经济计算机与信息技术机械科学与技术水利科技与经济计量与测试技术审计与经济研究制造技术与机床交通与计算机电气技术与经济计算机教育

相关范文

基于大概念的语文教学基于模型的优化设计

计算机工程与科学

北大期刊

￥624.00

关注 46人评论|5人关注

服务介绍