线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

数据分类中的特征选择算法研究

赵宇 黄思明 陈锐 中国管理科学 2013年第06期

摘要:本文应用半正定规划支持向量机模型,将核函数特征子空间的组合作为核映射矩阵,提出一种新的将特征选择整合在数据分类过程中的学习算法。首先,将样本按其特征进行分组,计算每组样本子集的核矩阵;然后将这些核矩阵线性组合后加入基于半正定规划的支持向量机模型中,利用半正定规划支持向量机学习器求解得到各子特征空间的权重系数,其次,根据特征权重系数建立特征贡献度和支持度用于特征选择并控制分类准确率、特征数量和对不同类别样本的分类能力;最后根据最优分类准确率、最少特征数量、最佳泛化能力三项不同目标计算所对应的特征数量和分类结果。实证中采用医学、植物学、文本识别和信用等领域数据以及人工数据集比较该方法和SFS、Relief-F以及SBS算法的特征选择效果。结果表明,在实际数据中,本文提出的方法不但能够保持较好的分类学习效果,而且可以比SFS、Relief-F以及SBS特征选择算法的特征子集数目大幅减少;在人工数据中,该方法可以正确地选出真正的特征,去除噪声特征。

关键词:数据挖掘特征选择分类算法核矩阵半正定规划

单位:中国科学院科技政策与管理科学研究所 北京100190

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

中国管理科学

CSSCI南大期刊

¥1060.00

关注 32人评论|2人关注