摘要:少类样本合成过采样技术(SMOTE)是一种新型的过采样方法,能够有效地处理不平衡数据分类问题,但SMOTE在产生合成样本的过程中,存在一定的盲目性.因此本文提出一种改进的过采样方法一自适应SMOTE,根据样本集内部分布特性,自适应调整SMOTE方法中近邻选择策略,控制合成样本的质量.算法分析和仿真结果表明,文中提出的方法在不影响计算复杂度的前提下,有效地提高了分类算法的整体分类准确率。
关键词:不平衡数据集 少类样本合成过采样技术 自适应smote 合成样本 近邻选择策略
单位:哈尔滨工业大学自动化测试与控制系; 黑龙江哈尔滨150080
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社