摘要:万维网(World Wide Web,WWW)现在已经成为一个巨大的信息平台,理论上,人们可以找到任何感兴趣的信息。问题是目前的信息检索效率很低,通过传统基于关键词匹配的信息检紊通常检索到大量不相关的冗余信息。由B.Lee 1998年提出的语义网,被称为下一代网络,将会对信息检索起到根本性的改变。而语义网中语义元数据是其中的核心基础。本文设计并实现了一种基于Ontology的网络元数据抽取系统。它使得用户可以构建和维护领域本体,对网页、PDF文件以及图像等网络资源进行元数据标注,然后基于构建的Ontology对标注过的网络资源进行元数据抽取,并且将抽取的各类元数据以统一的格式存储到元数据信息库中。
关键词:元数据 语义网 领域本体 抽取 www
单位:解放军电子工程学院,安徽合肥230037
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社