线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

基于LSH的高维大数据k近邻搜索算法

王忠伟; 陈叶芳; 钱江波; 陈华辉 电子学报 2016年第04期

摘要:局部敏感哈希(LSH)及其变体是解决高维数据k近邻(k NN)搜索的有效算法.但是,随着数据规模的日趋庞大,传统的集中式LSH算法结构已经不能够满足大数据时代的需求.本文分析传统LSH方案的不足之处,拓展AND-OR结构,提出通过索引而不比较原始数据直接实现高维大数据k近邻搜索算法C2SLSH.理论分析和实验证明,C2SLSH在分布式平台下具有稳定的可扩展性,在保证同等精确率的情况下,处理速度大约是现有方法的3倍.

关键词:高维数据k近邻局部敏感哈希mapreduce冲突计数排序

单位:宁波大学信息科学与工程学院; 浙江宁波315211

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

电子学报

北大期刊

¥1272.00

关注 25人评论|0人关注