摘要:传统的K近邻(KNN)分类算法在实际应用过程中存在一些缺陷:没有考虑去除噪声样本,也没有考虑到在样本数据空间变换过程中保持样本数据本身的流形学结构,并且没有使用样本间属性的相关性.为此,提出引入稀疏学习理论,利用训练样本重构测试样本的方法,重构过程使用了样本间的相关性,也用到局部保持投影LPP保持数据结构不变,同时引入l2,1范数用于去除噪声样本的方法来寻找投影变换矩阵W,进而利用W确定KNN算法中K值的SA-KNN算法.在UCI数据集上的仿真实验结果表明,该方法比传统的KNN分类算法和Entropy-KNN算法有更高的分类准确度.
关键词:k近邻分类 相关性 去除噪声样本 局部保持投影 稀疏学习
单位:广西师范大学广西多源信息挖掘与安全重点实验室 广西桂林541004 桂林航天工业学院 广西桂林541004 广西师范大学计算机科学与信息工程学院 广西桂林541004
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社