摘要:关联规则挖掘是数据挖掘领域中最活跃的一个分支.目前提出的许多关联规则挖掘算法需要多次扫描数据库并产生大量候选项集,影响了挖掘效率.针对加权关联规则挖掘算法中多次扫描数据库影响算法性能的问题,对其进行了优化,采取了以空间换时间的思路,提出一种基于向量的概率加权关联规则挖掘算法.以求概率的方式设置项目属性的权值,通过矩阵向量存储结构保存事务记录,只需扫描一次数据库,并且采用不同的剪枝策略及加权支持度和置信度的计算方式.使用数据实例进行模拟实验,结果表明此算法明显提高了挖掘效率.
关键词:数据挖掘 概率 向量 加权关联规则 剪枝策略
单位:广西大学计算机与电子信息学院 广西南宁530004
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社