摘要:时序数据在各个领域的使用越来越广泛,例如在金融领域回撤操作中对时序数据的聚合操作也就是时序数据库的重要的应用场景.传统关系型数据库不足以支撑海量时序数据,而现有的NoSQL数据库对时序数据的聚合操作显得低效耗时.概要森林是一种种结合概要表和线段树思想的支持时序数据聚合操作的高效索引机制.本文结合分布式NoSQL数据库HBase的机制,实现一种基于HBase的散列概要森林的索引方案,优化聚合操作速度,并提出一种基于HBase的线段树散列存储方案,解决I-IBase分布式存储时序数据产生热点问题.最后通过与通用开源时序数据库Opentsdb以及一般索引机制查询对比实验。验证了该索引机制的可用性和高效性.
关键词:hbase 时序数据 聚合 散列 概要森林
单位:浙江大学计算机科学与技术学院; 杭州310027; 浙江工业大学计算机科学与技术学院; 杭州310023
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社