摘要:本文提出了一种基于改进HotRank算法的站点排序及种子URL选择方法,建立了在线主题发现系统信息采集自适应增量更新模型;结合LDA模型和仿射传播聚类算法(AP),提出了一种网络主题发现和热点新闻推荐方法,并在海天园知识服务平台热点新闻推荐系统中得到了应用.
关键词:知识服务 主题发现 增量 自适应 lda模型
单位:哈尔滨工业大学计算机科学与技术学院; 黑龙江哈尔滨150001; 哈尔滨工业大学深圳研究生院; 深圳市网络环境智能计算重点实验室; 广东深圳518055
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社