线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

一种新的两阶段抽样算法

马光志; 张耀坤 计算机工程与科学 2007年第07期

摘要:两阶段抽样算法从海量数据集中抽取样本数据用于数据挖掘,当数据集规模过大时算法效率偏低,当数据集规模过大且为稀疏数据集时抽样精度偏低。本文改进了传统两阶段抽样算法,提出新的抽样算法EAFAST,可自适应地调节算法参数,而且能充分利用历史信息进行启发式搜索。实验证明,EAFAST算法可同时提高算法效率和抽样精度,弥补了传统算法的不足。

关键词:抽样两阶段频繁项目集剪枝精度

单位:华中科技大学计算机科学与技术学院; 湖北武汉430074

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程与科学

北大期刊

¥624.00

关注 46人评论|5人关注