线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

基于多重启发式规则的中文文本特征值提取方法

邹娟; 周经野; 邓成; 刘玲 计算机工程与科学 2006年第08期

摘要:本文根据中文文本的特点,以一种新的同义概念来替代传统的词为单位,并给出了同义概念之间权值的全新计算方法。我们不仅考虑了文本中词汇概率信息,还结合文本语义等多方面来提取文本特征值,从而提出了一种基于多重启发式规则的中文文本特征值提取方法,并给出了特征值提取模型和算法。通过与传统特征值提取方法的比较实验,证明本文中提出的特征值提取方法能有效地提高文本分类正确率,并达到了有效降低特征向量维数的目的。

关键词:文本分类特征值提取自然语言处理

单位:湘潭大学信息工程学院; 湖南湘潭411105

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程与科学

北大期刊

¥624.00

关注 46人评论|5人关注