摘要:实体解析问题是数据挖掘数据清理过程中的基本问题.异质网络数据的大量涌现,要求能够针对包含多种类型对象的数据同时进行实体解析.针对包含两种对象的实体解析问题,提出了一种基于联合聚类思想的协同实体解析算法.将两种对象分为决定对象和辅助对象,提出了一个基于联合聚类思想的两阶段协同实体解析框架,能够同时获得决定对象和辅助对象的各自聚类结果,其中每一个类包含的若干实体参考表示是对现实世界中同一实体的共同引用.最后对提出的算法进行了数值实验.
关键词:数据清理 实体解析 异质网络 联合聚类
单位:北京科技大学东凌经济管理学院 北京100083 北京语言大学图书馆 北京100083
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社