线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

面向短文本的动态组合分类算法

闫瑞; 曹先彬; 李凯 电子学报 2009年第05期

摘要:短文本分类是网络内容安全的一种主要方法.然而,短文本固有的关键词特征稀疏和样本高度不均衡等特点,使得难以直接使用现有针对长文本的分类算法.本文提出了一种针对短文本的动态组合分类算法.首先构造出一种树状组合分类器结构,可有效缓解短文本特征稀疏和样本高度不均衡对分类性能的影响;进一步,提出了一种动态调整策略来训练组合分类器,可以根据样本的分布特点自适应地调整分类器的组合结构.测试实验表明,相对于传统的单一分类方法和集成分类方法,动态组合分类算法在短文本分类中可以获得更好的准确率和召回率.

关键词:短文本分类组合分类器动态调整策略adaboost算法

单位:中国科学技术大学计算机科学技术系; 安徽合肥230027; 安徽省计算与通讯软件重点实验室; 安徽合肥230027; 解放军保密委员会技术安全研究所; 北京100091

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

电子学报

北大期刊

¥1272.00

关注 25人评论|0人关注