摘要:提出针对网络数据流中活跃信息进行话题相关数据采集与分析方法.首先给出面向论坛话题的定义;然后对网络数据流进行分析、对用户访问行为进行分类;并给出基于数据流的用户行为识别方法及话题相关数据抽取、存储算法;最后给出实验分析,结果表明,所提出的基于数据流的论坛话题数据采集方法能够很好地反映用户行为,并对基于数据流的网络舆情热点话题发现、突发事件检测与实时跟踪等应用提供有利的数据资源.
关键词:网络舆情 热点话题 突发事件 网络数据流
单位:哈尔滨工业大学计算机科学与技术学院; 黑龙江哈尔滨150001; 北京大学信息科学与技术学院; 北京100871; 中国科学院计算技术研究所; 北京100190
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社