线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

基于正则表达式的专利信息提取方法研究

邱清盈; 郑国民; 冯培恩; 武建伟 中国机械工程 2007年第19期

摘要:针对图像格式专利文献难以进行全文检索和深入分析利用的问题,根据专利文献的结构特点,通过集成光学字符识别工具和建立具有容错性的专利信息提取正则表达式,提出了专利文献的数字化和信息提取方法。开发了相应的软件系统,实现了专利信息的批量提取,为后续高效率地对专利文献进行自动分析和知识挖掘提供了数据基础。

关键词:专利分析信息提取正则表达式设计知识

单位:浙江大学CAD&CG国家重点实验室; 杭州310027

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

中国机械工程

北大期刊

¥640

关注 30人评论|2人关注