摘要:高校校园网信息资源数量巨大.各信息系统的相互独立及多种异构数据源的使用对在校园网范围内进行统一的信息检索设置了障碍.系统着重解决由非结构化文本数据和结构化数据库数据形成的多数据源的集成与整合问题.在Nutch搜索引擎基础上利用Lucene接口对多种源数据建立索引.构建多数据源全文信息检索平台,从而有效地实现全网信息检索并提高检索速度和精度。
关键词:信息集成 异构数据 odi nutch lucene
单位:宁波大学科学技术学院 浙江宁波315212
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社