基于Web数据挖掘的高效关联规则研究

陈晓红; 秦杨计算机工程与科学 2005年第11期

摘要：随着网络资源越来越丰富,Web数据挖掘逐渐成为因特网上资源有效利用的研究热点.本文提出通过对因特网上非结构化数据的XML格式进行筛选等处理,然后转化为结构化数据存储在SQL Servcr数据库中.并在此基础之上利用关联规则发现以生成最小关联规则集来代替完全关联规则集,就可以有效地剪除弱关联规则,大幅度地减少候选频繁项目集,从而提高规则发现效率.最后,在传统经典算法Apriori基础上,利用弱关联规则的向上关闭特性设计了一个相应的高效算法.

关键词：web数据挖掘数据仓库关联规则最小关联规则集