摘要:随着互联网的普及,非结构化文本数据的规模不断扩大且越来越多地用于大众传播。因此,从海量数据抽取热点信息已成为一个重要的研究课题。针对新闻的热点挖掘进行方法改进及分析,结合新闻及事件模型,使用TextRank算法提取关键词,运用相似度计算方法,提出了一种基于评论的热点新闻事件识别方法。研究结果表明该方法具有一定的可行性。
关键词:新闻 评论 事件识别 信息抽取
单位:浙江科技学院信息与电子工程学院; 杭州310023; 杭州电子科技大学计算机学院; 杭州310018
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社