摘要:目前,基于FP-树的最大频繁项集挖掘算法存在的一个问题是FP-树的规模过大,遍历树需耗费大量的运行时间,并且挖掘出来的很多频繁项集是用户不感兴趣的,过多的无用频繁模式影响了挖掘的效率。本文提出一种排序紧缩非冗余的STFP-树,以及基于STFP-树的最大目标频繁项集挖掘算法STFP-MAX。该算法在满足用户需求的基础上有效地缩小了FP-树的规模,又加快了搜索的速度,从而提高了挖掘的效率。
关键词:关联规则 频繁项集 最大目标频繁项集
单位:广西大学计算机与电子信息学院; 广西南宁530004; 百色学院数学与计算机系; 广西百色533000; 百色学院计算机与信息科学系; 广西百色533000
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社