摘要:网页分类是为了解决网络信息过载问题而延伸的一个热门研究领域,同时支持向量机以其出色的学习能力,在解决高维问题时表现出了特定的优势。本文在研究支持向量机和标准的免疫克隆优化算法的基础上,提出了一种改进的免疫克隆和支持向量机相结合的分类算法。标准算法中由于通过对抗体编码中某些位进行随机取反来实现抗体变异,造成搜索能力不强。该方法针对上述不足,将记忆单元和普通单元区分开来,对记忆单元定义自适应概率,从而加强在当前最优解邻域内的搜索能力,加快寻求全局最优解的速度。实验结果表明,该改进算法较其他算法具有更好的参数选择效果和更高的选择效率,是一种具有较高准确率和效率的网页分类方法。
关键词:网页分类 支持向量机 特征提取 参数选择 免疫算法
单位:天津大学 天津300072 河北工业大学计算机科学与软件学院 天津300401
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社