线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

信息检索中的聚类分析技术

刘远超; 王晓龙; 刘秉权; 钟彬彬 电子与信息学报 2006年第04期

摘要:信息检索/搜索引擎技术的快速发展使得信息的查全率有较大提高,而查准率以及人们获取信息的效率改善却不明显。文本聚类和多文档关键词的自动生成技术将有助于解决这一问题。其基本思想是对检索到的部分文档进行聚类处理,并对每类文档自动生成关键词,从而帮助用户判断各个类别的文档和检索需求是否相关。该文提出文档相关度和类别相关度的概念,并利用词频信息以及知网(HOVNET)中词的概念计算模型计算类别相关度,将其作为聚类合并的依据。信息获取的仿真实验表明文档检索效率有较大提高。

关键词:文档聚类关键词抽取知网文档相关度

单位:哈尔滨工业大学计算机科学与技术学院; 哈尔滨150001

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

电子与信息学报

北大期刊

¥1272.00

关注 31人评论|2人关注