线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

基于本体的办公文档处理研究

田英爱 李宁 张钰晗 北京信息科技大学学报·自然科学版 2010年第S2期

摘要:目前的办公文档通常都是基于XML格式的,其树型存储结构中包括逻辑内容、格式描述、页面版式描述以及编辑元素描述,它们之间既相互分离又相互融合,给文档的处理带来复杂性。论文分析了办公文档的结构特征,提出了在两种典型应用处理场景中基于本体的文档操作方法。本体的引入可以使办公文档的处理能够根据不同的应用环境,通过机器推理机制实现文档处理的智能化,同时有利于实现文档处理的互操作;在处理过程中节点的定位相对于XPath更高效,并能够满足在特定应用中,文档的处理不破坏文档的基本结构需求。本文以中文办公软件格式标准UOF为基础建立基于本体的文档结构模型,并利用SWRL推理规则,实现办公文档的智能化处理。

关键词:办公文档本体智能操作机器理解uof

单位:北京信息科技大学计算机学院

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

关注 25人评论|0人关注