线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

基于频繁词集聚类的微博新话题快速发现

徐雅斌 李卓 吕非非 武装 系统工程理论与实践 2014年第S1期

摘要:新话题发现是进行舆情分析的基础和前提,新话题发现的一个关键环节是进行关键词的聚类分析.目前,大量的新话题来源于微博,但是将传统的聚类算法用于微博新话题发现时,会产生特征向量的高维性和稀疏性问题,使得聚类结果非常不准确,而且收敛时间难以控制,进而影响舆情分析的可靠性和实时性.鉴此,本文提出了频繁词集聚类FWSC(frequent words sets clustering)方法.实验结果表明,我们提出的方法能够快速有效地发现新话题.

关键词:频繁词集聚类算法微博新话题hadoopmapreduce

单位:北京信息科技大学计算机学院 北京信息科技大学网络文化与数字传播北京市重点实验室

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

系统工程理论与实践

CSSCI南大期刊

¥1300.00

关注 24人评论|1人关注