线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

一种基于潜在语义分析和直推式谱图算法的文本分类方法LSASGT

戴新宇; 田宝明; 周俊生; 陈家骏 电子学报 2008年第08期

摘要:本文针对训练数据较少以及在基于图的分类算法中的文本表示问题,提出了一种基于潜在语义分析技术和直推式谱图算法的文本分类方法LSASGT,该方法将潜在语义分析技术和直推式谱图算法这两种基于谱分析理论的技术有机地结合在一起,对所有训练数据和测试数据进行统一建模,挖掘数据中潜在的多种结构信息。LSASGT引入潜在语义分析技术用于构造文本图表示模型,在能够反映人的分类标准的潜在语义特征空间中,描述文本之间的语义相关性;基于这样的文本表示,利用半监督的直推式谱图算法进行文本分类。在基准英文文本分类数据集Reuters21578和中文文本分类数据集Tan-Corp上的实验结果表明,本文给出的LSASGT文本分类方法获得了较好的分类结果。

关键词:直推式谱图潜在语义分析文本分类图构造

单位:南京大学计算机软件新技术国家重点实验室; 江苏南京210093; 南京师范大学计算机科学系; 江苏南京210097

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

电子学报

北大期刊

¥1272.00

关注 25人评论|0人关注