摘要:标准Bloom Filters在操作前需要知道数据集合中不同元素数目才能确定最佳的Hash函数数目,但是数据集的分布情况并不容易事先获得.本文提出一种多阶段Hash函数数目动态优化的Bloom Filters(Multi-stage Dynamicoptimization Bloom Filters,MDBF),它将元素插入过程分为多个阶段,在每个阶段根据比特向量的使用情况分析插入元素的分布,动态调整最优的Hash函数数目.实验表明MDBF能够适应元素多样性和偏斜分布的复杂情况,选择最优的Hash函数数目,获得更低的误检率.
关键词:bloom filters hash函数 偏斜分布 误检率
单位:南京邮电大学计算机学院; 江苏南京210003; 南京邮电大学计算机技术研究所; 江苏南京210003
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社