摘要:本文研究了使用集群环境下的用户访问日志数据生成用户会话聚类的方法:编制Perl脚本从用户访问日志中生成用户会话,以新的相似度度量取代欧几里德距离改进Leader算法对用户会话集合进行聚类,并计算聚类的内部距离和间隔距离来验证算法的有效性.实验结果表明,这种实现能有效地对用户访问日志进行聚类,并能满足服务器预取机制在线分析的时间、空间要求.
关键词:集群服务器 用户访问模式 预取 相似度 聚类分析
单位:国防科技大学计算机学院; 湖南; 长沙; 410073
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社