线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

高维数据相似性度量方法研究

谢明霞 郭建忠 张海波 陈科 计算机工程与科学 2010年第05期

摘要:将低维空间中的距离度量方法(如Lk-范数)应用于高维空间时,随着维数的增加,对象之间距离的对比性将不复存在。研究高维数据有效的距离或相似(相异)度度量方法是一个重要且具有挑战性的课题。通过对传统的距离度量或相似性(相异性)度量方法在高维空间中表现出的不适应性的分析,并对现有的应用于高维数据的相似性度量方法进行总结,提出了高维数据相似性度量函数Hsim(X,y)的改进方法HDsire(X,y)。函数HDsire(X,y)整合了各类型数据的相似性度量方法,在处理数值型、二值型以及分类属性数据上充分体现了原Hsim(X,y)处理数值型数据、Jaccard系数处理二值数据以及匹配率处理分类属性数据的优越性。通过有效性及实例分析,充分论证了HDsim(X,y)在高维空间中的有效性。

关键词:高维数据相似性度量属性相似性空间相似性

单位:解放军信息工程大学测绘学院 河南郑州450052 75719部队 湖北武汉430074 68029部队 甘肃兰州730020

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程与科学

北大期刊

¥624.00

关注 46人评论|5人关注