摘要:特征选择作为机器学习过程中的预处理步骤,是影响分类性能的关键因素.网络流量具有数据量大,特征维度高的特点,如何快速提取特征子集,并提高分类效率对于基于机器学习的流量分类方法具有重要意义.本文提出基于分治与投票策略的特征提取方法,将数据集分裂为多个子集,分别执行特征提取算法,利用投票方法获得最后的特征子集.实验表明可有效提高特征提取的时间效率,同时使分类器取得良好的分类准确率.
关键词:分治 投票 流量分类 特征选择
单位:浙江大学计算机学院 浙江杭州310027 浙江科技学院理学院 浙江杭州310023 浙江大学图书与信息中心 浙江杭州310027 嘉兴职业技术学院 浙江嘉兴314036
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社