摘要:针对时空轨迹大数据的蜂群模式挖掘需求,提出了一种高效的基于MapReduce的分布式蜂群模式挖掘算法。首先,提出了基于最大移动目标集的对象集闭合蜂群模式概念,并利用最小时间支集优化了串行挖掘算法;其次,提出了蜂群模式的并行化挖掘模型,利用蜂群模式时间域无关性,并行化了聚类与子时间域上的蜂群模式挖掘过程;第三,设计了一个基于MapReduce链式架构的分布式并行挖掘算法,通过四个阶段快速地实现了蜂群模式的并行挖掘;最后,在Hadoop平台上,使用真实交通轨迹大数据集对分布式算法的有效性和高效性进行了验证与分析。
关键词:时空轨迹挖掘 大数据 蜂群模式 分布式 mapreduce
单位:烟台大学计算机与控制工程学院 山东烟台264005 吉林大学符号计算与知识工程教育部重点实验室 吉林长春130012
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社