线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

配用电大数据多源集成及存储优化方法

王林童; 赵腾; 张焰; 苏运; 田世明 高电压技术 2018年第04期

摘要:面对体量大、类型多、增长快的配用电大数据,如何利用大数据技术提升配用电相关业务的广度、深度和精度成为电力行业新的机遇和挑战。为解决配用电大数据多源集成和高效存储两方面核心问题,根据配用电大数据的组成及特征,通过生成标准化元数据并构建相应数据字典的方法,实现了多源配用电数据规范化集成;在数据集成的基础上,基于Hadoop平台进行大数据存储优化方法研究,提出考虑配用电数据关联性的哈希分桶存储算法,实现了相关联数据的集中存储,从而提升后期数据查询及处理的效率并在数据存储优化的基础上,实现基于Map Reduce的多源配用电大数据并行关联查询。通过在Hadoop集群平台上进行测试表明,经过哈希分桶存储优化后的多源数据并行关联查询相比传统Hadoop方法查询时间显著缩短。

关键词:配用电大数据数据集成hadoop哈希分桶存储并行关联查询

单位:上海交通大学电气工程系; 上海200240; 国网上海市电力公司电力科学研究院; 上海200437; 中国电力科学研究院有限公司; 北京100192

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

高电压技术

北大期刊

¥1180.00

关注 33人评论|2人关注