摘要:特征表示和相似性度量是时间序列数据挖掘的基础工作,其质量好坏直接影响后期的挖掘结果.利用正交多项式回归模型对时间序列进行多维形态特征表示,分析特征维数对时间序列拟合效果的影响,选取部分特征来描述序列的主要形态趋势,提出了一种鲁棒性较强的形态特征相似性度量方法来近似度量时间序列,且具有较高的相似性度量质量.实验结果表明,基于多维形态特征表示的时间序列相似性度量方法不仅满足下界要求,具有较好的下界紧凑性和数据剪枝能力,而且在时间序列聚类和分类等数据挖掘任务中取得了良好的效果.
关键词:时间序列 相似性度量 形态特征 正交多项式
单位:大连理工大学系统工程研究所 大连116024 华侨大学工商管理学院 泉州362021
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社