摘要:当前农业垂直搜索引擎无法预测农产品价格趋势,难以满足农业生产者行情分析需要。文章设计农产品价格主题搜索引擎。首先网络爬虫从农业综合网站搜集网页,对网页进行转码、去重、提取内容等处理;使用主题相关度算法计算网页的主题相关度,用分类器对网页分类,将与主题相关的网页解析、存储;最后提取农产品价格及其影响因素信息。结果表明,系统可搜集农产品价格信息及影响农产品价格因素信息,为后续农产品价格预测提供数据支持。
关键词:网络爬虫 信息抓取 农产品价格 农业搜索引擎
单位:东北农业大学电气与信息学院; 哈尔滨150030
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社