线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

向量空间模型的稀疏文本分类

刘江林 内蒙古师范大学学报·教育科学版 2016年第04期

摘要:针对稀疏文本特征纬度高、特征稀疏程度大的特点,根据词、文档和所属类别的关系,建立训练样本的特征概率分布函数,通过基于内容的滤波器去除背景噪声和非关键词后,利用特征分类方法对稀疏文本进行分类.用线性回归的分类方法与其他传统分类方法进行了比较,结果表明,该特征分类方法能够有效提高稀疏文本的分类精度,尤其是与线性分类中的岭回归方法相结合时,分类精度更高.

关键词:文本分类概率分布线性回归向量空间模型稀疏矩阵

单位:重庆电子工程职业学院; 重庆401331

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

关注 45人评论|5人关注