摘要:代价敏感学习中经常考虑测试代价和误分类代价。在实际应用中,一个属性的测试代价常跟属性值的粒度有关,而一个具有多个属性的对象的误分类代价又常受它的属性的总测试代价大小的影响。基于这一点,研究在总测试代价受限的情形下,数据的属性和粒度选择的问题。以最小化数据处理的平均总代价为目标提出了一种方法,该方法能同时选择最优的属性子集和数据粒度。首先建立了该方法的理论模型,再设计了一个高效的算法。实验结果表明,所提算法能有效地进行不同大小的测试代价约束下的属性和粒度选择。
关键词:代价 误差 邻域 属性选择 粒度选择
单位:电子科技大学信息与软件工程学院; 四川成都610054; 闽南师范大学数学与统计学院; 福建漳州363000
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社