线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

一种基于Boosting的集成学习算法在不均衡数据中的分类

李诒靖 郭海湘 李亚楠 刘晓 系统工程理论与实践 2016年第01期

摘要:针对多类别不均衡数据的分类问题,从数据集的特征选择和集成学习两个角度出发,提出了一种新的针对不均衡数据的分类方法—BPSO-Adaboost-KNN算法,算法采用基于多分类问题的可视化的AUCarea作为分类评价指标.为了测试算法的性能,本文选取了10组UCI和KEEL选取的测试数据集进行测试,结果表明本算法在有效提取关键特征后提高了Adaboost的稳定性,在十组数据的分类精度上相比单纯使用KNN分类器有20%~40%不等的提高.在本算法和其他state-of-the-art集成分类算法对比中,BPSO-Adaboost-KNN能够取得较优或相当的结果.最后,本文将该算法应用到石油储层含油性的识别中,成功提取了声波、孔隙度和含油饱和度三个关键属性,在分类精度上相比传统分类算法有了大幅度提高,在江汉油田五口油井oilsk81~oilsk85上的分类精度均达到98%以上,比单纯使用KNN的精度高出了20%,尤其在最易错分的油层和差油层中有良好的分类效果.

关键词:不均衡数据特征提取分类石油储层

单位:中国地质大学经济管理学院 武汉430074 中国地质大学数字化商务与智能管理研究中心 武汉430074

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

系统工程理论与实践

CSSCI南大期刊

¥840.00

关注 24人评论|1人关注