企业专利专题数据库建设步骤与方法
2015-05-30黄艳
黄艳
目前,大多数企业利用网上免费的专利信息数据库资源进行检索,如国知局的专利检索与查询系统、Soopat搜索引擎、Pantentics检索网站等。同时,网上也开放了一些专题数据库资源,影响较大的如国知局的药物专题库、国知局联合知识产权出版社和各行业协会建立的汽车、钢铁等十大重点产业数据库及其检索分析平台等。但这些资源对具体企业来说,针对性不强,无法满足企业个性化需求,使用时效率不高。因此,企业建立自己的专利专题数据库的需求越来越迫切,也是必然趋势。
数据库建设步骤
企业专利专题数据库建设主要可分为数据库调研、基础数据库建设、专题库建设、上线运行、数据库运维等几个阶段。各阶段主要工作内容见表1。
表1 各阶段主要工作内容
专利专题数据库建设方法
下面以大容量直流输变电设备为例,简要介绍专利数据库建设主要步骤的实现方法。
1、确定技术分解表
通过对大容量直流输变电设备进行调研确定数据检索边界,对技术进行分解,形成技术分解表,见表2。
表2 大容量直流输变电设备技术分解表
2、梳理关键词、分类号
技术分解表确定后,需要系统梳理各技术分支对应的关键词和分类号,以保证较为准确地检索出企业所需文献数据。以直流输电换流阀技术分支为例,通过梳理,其中文关键词包括:直流、输电、供电、换流、变流,反向等,英文关键词包括:direct current、DC;converter、inverter;分类号包括:H02M1/00,H02J1/00,H02J3/18,H02M7/12,H01L23/473,H02J13/00。同样的方法,我们可得到柔性直流输电换流阀和电子高压直流断路器的关键词和分类号。
3、专利检索
(1)确定检索策略
采用分总式的检索思路,针对每一技术分支进行以下步骤检索:利用常规关键词进行初步检索,再进一步扩展关键词,领域、效果或者功能限定;完善IPC分类号的扩展;利用扩展的关键词和分类号进行结合检索。各分支检索完成后,将各数据集合并即可得到大容量直流输变电设备基础数据库。
(2)数据除噪
采取利用噪声关键词以及噪声分类号进行标题以及摘要的批量除噪,利用同在算符以及词频进行全文库的摘要以及说明书内容的批量除噪,以及人工阅读除噪等方法,对检索结果进行除噪。经过上述方法,针对大容量直流输变电设备,筛选出中文文献730篇,英文文献1046篇。
4、检索结果评估
检索结果评估主要是对所获得的数据文献集合进行查全率与查准率的评估,以确保检索结果的客观性。本文采用通过申请人文献来进行验证,以中文文献为例,利用“中电普瑞、许继、南瑞继保、 鞍山荣信、国网智能电网、上海思源、特变电工、ABB 、西门子、北京四方、 GE、阿海珐、阿尔斯通、艾默生、东芝、富士、电工研究所、西安交通大学、武汉大学、华北电力大学、 中国西电等作为申请人和关键词进行相与比对,去除噪音后,得到样本集为669篇,与前述检索查询得到文献集相与比对,样本集中有541篇在其中,求得查全率为541/669=80.8%,基本符合要求。
5、建立数据库和分析功能
基础数据采集完成后,企业需准备好数据库安装的软硬件环境,包括服务器、数据库软件、操作系统、存储设备等,然后将数据导入完成基础库的建设。对于专题库,建设方法类似,即通过构建如技术主题、竞争对手等专题的检索式,在基础库中作进一步的主题检索,通过建立专题导航,将各主题专利文献结果集导入至相应的专题导航下即可。
数据库建好后,可进一步开发符合企业需求的检索分析功能,这更贴合企业使用者的操作习惯,提高对专利文献的分析利用效率。
6、数据库更新维护
鉴于专利信息动态变化的特点,企业应指定专人定期,(如按周、月)对数据库进行更新,将新公开的专利、原有专利信息的变化更新到数据库中,否则数据库将逐步丧失掉其使用价值。同时,根据企业、技术不断发展变化,对数据库范围、分类导航的设置等也要适时地进行修正,补充遗漏、缺失数据,持续进行维护。
结语
企业专利专题数据库和互联网上综合性的专利数据库、行业数据库、专题库相比,避免了网站功能的限制和互联网查询的高风险性,同时具有企业专业领域专利信息集中全面、信息挖掘度高、检索方便等优点,满足企业对所关注技术的专利信息的充分挖掘和深入分析的需要。借助企业专利专题数据库进行综合分析,可有效帮助企业充分了解竞争环境,借鉴已有技术、避免专利纠纷等,对企业技术发展路线、企业经营发展战略、技术贸易等决策的制定提供有力支撑。