线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

基于Lucene的数字作品搜索引擎的研究与设计

吴洁明 韩云辉 冀单单 计算机工程与科学 2013年第05期

摘要:在Lucene的全文检索工具包的基础上,分析现有的主流中文分词算法和Lucene相关度排序算法,提出了改进的分词算法和改进的相关度排序算法。还采用倒排索引、检索技术、分布式存储和并行计算等技术,分析并设计了一个对海量数字作品信息的搜索引擎,为用户提供对海量数字作品信息的快速、准确的搜索服务。实验分析比较了分词速度和分词效果,还比较了关键词搜索结果的响应时间、命中数量、准确率和召回率。实验结果表明,本系统在很大程度上提高了搜索速度,保证了搜索结果的准确性。

关键词:lucene分词算法索引相关度排序算法分布式

单位:北方工业大学信息工程学院 北京100144

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程与科学

北大期刊

¥624.00

关注 46人评论|5人关注