摘要:本文提出了一种基于标题类别语义识别的文本分类算法。算法利用基于类别信息的特征选择策略构造分类的特征空间,通过识别文本标题中的特征词的类别语义来预测文本的候选类别,最后在候选类别空间中用分类器执行分类操作。实验表明该算法在有效降低分类候选数目的基础上可显著提高文本分类的精度,通过对类别空间表示效率指标的验证,进一步表明该算法有效地提高了文本表示空间的性能。
关键词:标题类别语义识别 候选类别 类别空间表示效率
单位:哈尔滨工业大学计算机科学与技术学院; 哈尔滨150001
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社