摘要:随着云计算、大数据以及移动互联网的发展,移动终端用户数据呈现出数据量大、噪声大、动态性及不确定性增强的趋势,影响了移动用户数据聚类准确率与效率。针对上述问题,提出了一种改进的层次聚类算法CURE。该算法将原有算法中抽样处理数据的方式用Map Reduce函数实现并行化处理,同时结合区间数的概念,将移动用户数据用一个区间表示,计算其区间距离来适应移动用户数据的不确定性特点,从而提高聚类效率与准确率。最后利用MIT Reality项目数据集进行仿真,仿真结果表明了该方法的有效性及可行性,为移动用户数据的进一步利用及用户的个性化推荐提供支持。
关键词:cure 不确定性数据 移动用户数据 map reduce
单位:哈尔滨理工大学管理学院 黑龙江哈尔滨150040 哈尔滨理工大学高新技术产业发展研究中心 黑龙江哈尔滨150040
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社