摘要:本文提出一种基于核SMOTE(Synthetic Minority Over-sampling Technique)的分类方法来处理支持向量机(SVM)在非平衡数据集上的分类问题.其核心思想是首先在特征空间中采用核SMOTE方法对少数类样本进行上采样,然后通过输入空间和特征空间的距离关系寻找所合成样本在输入空间的原像,最后再采用SVM对其进行训练.实验表明,核SMOTE方法所合成的样本质量高于SMOTE算法,从而有效提高SVM在非平衡数据集上的分类效果.
关键词:非平衡数据集 支持向量机 输入空间 特征空间 原像
单位:厦门理工学院计算机科学与技术系; 福建厦门361024; 浙江大学计算机科学与技术学院; 浙江杭州310027
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社