线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

基于词向量语义聚类的微博热点挖掘方法

刘培磊; 唐晋韬; 王挺; 谢松县; 岳大鹏; 刘海池 计算机工程与科学 2018年第02期

摘要:随着社交媒体的迅速发展,信息过载问题越发严重,因此如何从海量、短小而充满噪声的社交媒体数据中发现和挖掘出热点话题或者热点事件成为一个重要的问题。结合社交媒体数据实时性、地理性、包含较多元数据等特点,提出了用户行为分析与文本内容分析相结合的热点挖掘方法。在内容分析过程中,提出了从更细的词语粒度进行聚类,以代替传统的在消息粒度进行聚类的经典方法。为了提高话题关键词提取的效果,引入了基于词向量技术,并通过语义聚类的方法进行热点挖掘。在真实数据集上的实验结果表明,该方法提取的关键词语义关联性强、话题划分效果好,在主要指标上优于传统的热点挖掘方法。

关键词:热点挖掘社交媒体词向量语义聚类

单位:国防科技大学计算机学院; 湖南长沙410073

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程与科学

北大期刊

¥624.00

关注 46人评论|5人关注