线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

基于聚类汇总的记录匹配算法

王天江; 刘芳; 卢正鼎 计算机工程与科学 2004年第09期

摘要:记录匹配算法在异构数据的集成和数据开采等领域应用广泛,其主要任务是找出来自不同数据源中代表同一对象实体的记录,这些记录具备相似的属性和属性值.为避免组合爆炸问题,现有的记录匹配算法不再对数据库中的记录数两两匹配,而是结合排序策略和静态聚类匹配方法实现,但这种静态方法不适应数据的动态变化.因此,本文提出基于聚类汇总的记录匹配算法,该算法可以解决静态方法导致的匹配记录丢失问题,同时能够减少计算量,提高匹配记录搜索效率.

关键词:聚类汇总记录匹配模式匹配重复记录发现聚类分析

单位:华中科技大学计算机学院; 湖北; 武汉; 430074

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程与科学

北大期刊

¥624.00

关注 46人评论|5人关注