摘要:收集大量网站的包含30个特征属性的数据,用 k-means 属性聚类方法将特征属性划分为不同类别,利用不同类别中的属性数据训练基础分类器,通过集成各基础分类器的结果对未知网站进行预测。采用简单投票和贝叶斯投票对结果进行组合预测,结果表明,k-means 属性聚类方法大大增加了基础分类器的差异性,提高了分类检测的精度,其中基于贝叶斯投票策略的集成模型具有很高的检测精度。
关键词:特征提取 属性聚类 集成检测 贝叶斯投票 检测精度
单位:山西大学商务学院信息学院 山西太原030031
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社