摘要:信用评估数据集往往存在冗余属性,现有研究一般通过属性子集选择策略进行属性筛选,但并未深入研究不同属性子集选择策略在不同信用评估模型上的适用性。本文首先实证研究了 8 种属性子集选择策略对 7 种主流模型的性能提升情况,得到了一些有意义的结论;进而设计出一种结合多个属性子集选择策略特征的三阶段混合信用评估模型 TSHCE 模型。TSHCE 模型在第一阶段,根据多个属性子集选择策略对各属性的重要性排序,生成属性重要性序数向量;第二阶段,根据属性重要性序数向量,以赌方法选择不同属性子集,分别训练基分类器;第三阶段,以各基分类器的分类结果组合构成再训练样本集,进一步训练连接分类器以提升模型的分类能力。实证研究表明:TSHCE 模型在训练阶段能够深度挖掘样本集的可分类特征,五种性能评价指标均达到 92%以上;在测试阶段,相对于最优属性子集选择策略与分类器的组合,在两组大样本数据集上分别进一步提升了 1.36%和 12.83%的总体分类正确率,具有优越的平衡性,同时亦适用于小样本。
关键词:属性子集选择策略 三阶段混合信用评估模型 属性重要性序数向量 信用风险
单位:南京大学商学院; 江苏南京210093; 中国人民银行连云港中心支行; 江苏连云港222000
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社