线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

文本分类中CTM模型的优化和可视化应用研究

马长林; 杨正良; 谢罗迪 计算机工程与科学 2017年第03期

摘要:如何从海量文本中自动提取相关信息已成为巨大的技术挑战,文本分类作为解决该问题的重要方法已引起广大关注,而其中文本表示是影响分类效果的关键因素。为此采用相关主题模型进行文本表示,以保证信息完整同时表现主题相关性;基于该模型,对主题数目和特征提取实施了优化处理,综合复杂度和对数似然函数来确定最优主题数目,引入基于互信息的主成分分析算法进行最优特征提取,降低数据维度和特征冗余,使用R语言进行可视化实验分析。

关键词:文本分类ctm模型特征提取

单位:华中师范大学计算机学院; 湖北武汉430079

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程与科学

北大期刊

¥624.00

关注 46人评论|5人关注