摘要:Web包装器将网页内容转换为XML格式,用于系统集成。进行XML转换的XSLT技术能较好地支持包装器的信息抽取和组织。本文从包含查询接口、结果模式和映射规则的包装器描述文件(XML)出发,给出了自动生成可执行代码的技术方案。包装器的执行及其生成过程完全基于XSLT技术,系统具有较强的可移植性。提出“元数据对齐”方法进行内容辅助定位,提高了对页面变化的容忍度。原型系统的实现验证了以上技术的可行性。
关键词:web包装器 xslt xml schema
单位:清华大学自动化系CIMS工程研究中心; 北京100084
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社