线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

基于MapReduce计算模型的气象资料处理调优试验

杨润芝 沈文海 肖卫青 胡开喜 杨昕 王颖 田伟 应用气象学报 2014年第05期

摘要:云计算技术使用分布式的计算技术实现了并行计算的计算能力和计算效率,解决了单机服务器计算能力低的问题。基于长序列历史资料所计算得出的气候标准值对于气象领域实时业务、准实时业务及科学研究中均具有重要的意义。由于长序列历史资料数据量大、运算逻辑较复杂,在传统单节点计算平台上进行整编计算耗时非常长。该文基于Hadoop分布式计算框架搭建了集群模式的云计算平台,以长序列历史资料作为源数据,基于MapReduce计算模型实现了部分整编算法,提高计算时效。同时,由于数据源本身具有文件个数多、单个文件小等特点,对数据源存储形式及数据文件大小进行改造,分别利用SequenceFile方式及文本文件合并方式对同一种场景进行计算时效对比测试,分别测试了10个文件合并、100个文件合并两种情况,使时效性得到了更大程度的提升。

关键词:mapreduce云计算hadoop历史资料整编

单位:国家气象信息中心 北京100081 南京信息工程大学 南京210044

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

应用气象学报

北大期刊

¥400.00

关注 25人评论|0人关注