摘要:与传统分类方法相似,多标签学习同样面临着因数据高维引起的问题,如过拟合和维灾难等.虽然目前已经提出了一些多标签分类算法,但多标签数据的高维性问题并未得到普遍重视.针对这个问题,利用条件互信息度量特征与类别标签之间的相关性,依此实施特征选择操作,以发现重要特征.在此基础上,提出了一种新的多标签集成分类算法.模拟实验结果表明,与经典分类算法相比,本文提出的集成算法在大多数情况下取得了较优的分类效果.
关键词:数据挖掘 多标签分类 特征选择 条件互信息
单位:浙江师范大学数理与信息工程学院 浙江金华321004 中国科学院数学与系统科学研究院 北京100055
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社