摘要:目前存在的多数据流相关性分析方法大多只针对于单属性维数据流,无法体现多变量组成的场与场之间真实的相关性,为了在资源受限的环境下快速检测多维数据流之间的相关性,本文提出一种新颖的基于典型相关性分析(CCA)的多维数据流相关性分析算法StreamCCA,针对传统的CCA计算中的性能瓶颈,提出为样本方差阵与协差阵组成的乘积阵降维的高效低价近似方法,在保持分析精度的前提下显著地提高了计算效率.经理论分析和实验证明,Stre~nCCA能够在线精确地识别两条多维数据流的相关关系,可以作为通用的预报和诊断分析工具广泛应用于数据流挖掘领域。
关键词:数据流 典型相关性分析 低阶近似 不等概采样 数据流挖掘
单位:东南大学计算机科学与工程系; 江苏南京210096; 佳木斯大学公共计算机教研部; 黑龙江佳木斯154007
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社