摘要:决策树归纳的两个重要阶段是数据表示空间的简化和决策树的生成。在将训练集的不一致率控制在某一阈值的前提下,减少实例的属性个数和各个属性的取值个数保证了决策树方法的可行性和有效性。本文在Chi2算法的基础上运用它的一种变形进行属性取值离散化和属性筛选,然后运用算术运算符合并取值个数为2或3的相邻属性。在此基础上生成的决策树具有良好的准确性。实验数据采用的是一个保险公司捐献的数据集。
关键词:决策树 chi2的变形 离散化 筛选
单位:天津师范大学计算机与信息工程学院; 天津300387
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社