摘要:随着网络资源越来越丰富,Web数据挖掘逐渐成为因特网上资源有效利用的研究热点.本文提出通过对因特网上非结构化数据的XML格式进行筛选等处理,然后转化为结构化数据存储在SQL Servcr数据库中.并在此基础之上利用关联规则发现以生成最小关联规则集来代替完全关联规则集,就可以有效地剪除弱关联规则,大幅度地减少候选频繁项目集,从而提高规则发现效率.最后,在传统经典算法Apriori基础上,利用弱关联规则的向上关闭特性设计了一个相应的高效算法.
关键词:web数据挖掘 数据仓库 关联规则 最小关联规则集
单位:中南大学商学院; 湖南长沙410083
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社