摘要:本文针对互联网的数据量的不断增加,准确搜索引擎的作用日益困难的问题,为了提高搜索引擎返回结果结构化聚类的效果,让信息的定位更迅速,本文采用基于标签的聚类算法,并使用自然语言处理技术中的依存句法分析和词典资源,深度挖掘语义结构,提出基于优化初始选择的K均值聚类方法.本文深入分析K均值聚类算法特点,并利用类别标签技术对该算法进行有效改进.实验证明该算法不仅在效果上优于一般聚类算法,对结果描述也有很大帮助,在效率上也得到很大提高.
关键词:检索结果聚类 ontology 标签
单位:哈尔滨工业大学计算机科学与技术学院信息检索研究室; 黑龙江哈尔滨150001
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社