基于扩展概念格模型的文本分类规则提取的研究

周顽周才学计算机工程与科学 2010年第08期

摘要：文本分类是信息检索与数据挖掘领域的研究热点与核心技术，近年来得到了广泛的关注和快速的发展。概念格是规则提取和数据分析的有效工具，然而概念格的构造效率始终是概念格应用的一大难题。本文研究了基于扩展概念格模型的文本分类规则提取，利用粗糙集和扩展概念格模型来进行分类规则提取。该方法利用概念树，极大地除去了冗余的概念，只需要建造很少的概念就能够提取出全部的分类规则，不仅效率较高，而且同时提取的分类规则与概念格相同。本文算法在MATLAB7．0的环境中运行的实验表明，查全率比KNN算法和SVM算法稍低，但是查准率比它们都高，因此该分类规则用于文本分类时效果与KNN和SVM相当。

关键词：文本分类数据挖掘粗糙集概念格分类规则