摘要:传统支持向量机分类过程的计算量和支持向量的个数成正比,当支持向量较多时,其分类过程的计算比较耗时。该文基于支持向量的稀疏性,证明了对支持向量压缩时,收紧新的快速决策函数和原始决策函数之间的误差等价于在样本空间对原始支持向量进行K均值聚类操作,据此提出了一种约简支持向量的快速分类算法FD-SVM(Fast Decision algorithm of Support Vector Machine),该算法首先对原始的支持向量进行特定比例的K均值聚类操作,聚类的中心为约简后新的支持向量,按照分类误差最小的原则构建优化模型,用二次规划方法求解得到新的支持向量的系数。标准数据集上的实验表明,保持分类精度的损失在统计意义上不明显的前提下,FD-SVM可以有效压缩支持向量的数量,提高分类速度。
关键词:支持向量机 快速分类 稀疏性 k均值聚类 二次规划
单位:江南大学数字媒体学院 无锡214122 香港理工大学电子计算学系 香港
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社