线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

词共现文本主题聚类算法

白秋产 金春霞 章慧 周海岩 计算机工程与科学 2013年第07期

摘要:文本主题是文本聚类的关键,而文档中共现词对对文档主题的表现力非常强。因此,在对现有文本主题挖掘和共现词对抽取算法深入研究的基础上,提出了一种基于关联规则词共现的文本主题聚类算法(TCABARWc),即首先采用关联规则挖掘算法抽取文档共现词对,利用词共现提取文本主题信息,然后根据共现词对建模并实现共现词对相似度量,最后结合层次聚类算法实现文本聚类。实验结果表明,相比其他聚类算法,基于关联规则共现词对的层次聚类算法,大大降低了文本向量的维度以及算法复杂度,在聚类效率和准确性上都有显著提高,并获得了较好的聚类效果。

关键词:词共现关联规则数据挖掘层次聚类

单位:淮阴工学院电子与电气工程学院 江苏淮安223003 淮阴工学院计算机工程学院 江苏淮安223003

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程与科学

北大期刊

¥624.00

关注 46人评论|5人关注