面向煤化工产业的专利信息加工与应用
2016-07-22葛川
文章编号:2095-6835(2016)13-0004-03
摘 要:在全球化与知识经济时代,市场竞争已由产品制造提升到研发创新、专利(技术标准)创造价值的层次,专利已成为企业竞争的有力工具。专利是发现新技术信息独特的信息源,也是竞争情报最重要的信息源之一。探讨了面向煤化工产业的专利信息加工及其应用,以服务于产业技术创新和科技进步。
关键词:煤化工;专利信息;煤化工专利信息服务平台;信息加工
中图分类号:G203 文献标识码:A DOI:10.15913/j.cnki.kjycx.2016.13.004
中国的能源构成中,具有典型的“多煤少油”的特点。为了弥补油气资源欠缺,保障国家整体能源安全,发展和储备现代煤化工技术成为重要的国家战略选择。多年来,在国家发改委、能源局的宏观指导下,我国的煤化工产业经历了一个快速发展期,特别是在富煤地区,发展煤炭深加工、构建煤化工产业园、完善煤化工产业链,已经成为振兴当地经济的重要举措。山西作为我国的重要能源基地,煤炭资源丰富。在当前煤炭价格不断下行的经济背景下,发展煤化工产业具有更加积极的现实意义。在向新兴煤化工方向发展的过程中,技术瓶颈是摆在我们面前的现实障碍。要想突破技术瓶颈,既要发挥科研单位和重点企业在技术创新方面的主导作用,同时应充分利用信息资源对研发工作起到有利的支撑作用,通过对科技信息的充分挖掘,探索出一条多快好省的技术研发新途径。
本研究运用信息化和数据加工手段,通过对产业专利信息的加工与应用,发挥煤化工专利信息对煤化工关键技术研发与创新的科技情报支撑作用,服务于煤化工科研单位的技术瓶颈攻关和企业的市场竞争。
1 主要实施内容
主要的实施内容有以下四方面:①面向山西省煤化工产业的创新主体,调研创新主体市场模式及研发类型,探索满足特定服务对象需求的专业服务方式与方法。通过搭建经深加工的专利专题数据平台、提供重点产业技术分析报告,帮助创新主体充分利用行业内的专利技术信息。②建立煤化工产业的专利信息标引规则,对煤化工专利数据进行多层次的标引加工,形成科学、系统的标引规则,满足不同类型的用户对专利信息不同层次、角度和范围的调查和分析需求,提升检索效率和专利利用价值。在标引过程中,形成煤化工产业技术示范性主题词和同义词表。③建立煤化工行业的深加工数据平台,以经过深加工的煤化工专利数据结合专业检索分析系统构建一体化平台。该平台系统具有功能覆盖全面、检索分析方式灵活等特点,能实现煤化工深加工专利数据全面、综合的运用和展示。④对深加工平台进行推广和应用培训,面向客户群体对煤化工产业数据平台的操作使用进行专门培训,调查客户的应用体验,对平台的使用效果进行总结和评估。
2 行业调研及分析
面向不同目标群体,采用不同调研形式对煤化工产业展开多维度、全方位的调研,以求全面探查不同类型的创新主体在煤化工产业的技术研发及市场运营过程中对知识产权服务的需求,为制订相应的知识产权服务策略提供参考。
2.1 问卷调查
该调研方式具有普适性。通过设计调查问卷,面向煤化工产业内的不同岗位进行调研,了解产业内对于知识产权了解的平均水平以及其对专利信息的需求和使用程度,探索知识产权服务的延伸方向。
2.2 重点企业走访调研
选择若干家煤化工重点企业进行实地调研。深入到企业当中,了解重点企业在发展中遇到的知识产权问题,探索知识产权发展战略与企业市场经营战略的结合办法。
2.3 组织行业专家研讨
召集煤化工行业专家,结合专家对煤化工产业形势及技术的深入理解,论证标引规则的合理性;发掘煤化工产业重点技术,后续可针对重点技术或热点技术做进一步的专利信息挖掘和分析。
3 煤化工产业标引规则及体系的建立
3.1 专利申请号、名称、分类号和文摘的标引
标引单中的申请号、名称、分类号和文摘4项标引项主要通过计算机导入。标引员需要对照专利原文检查以上各项内容的正确性,特别是标引内容和申请号的一致性。此外,标引员还需要对题目和文摘出现的明显错误,如错别字、错误语句等进行修改。对于上述标引项目还需要按照后续标引格式的要求,对标引格式进行规范处理。
3.2 技术主题分类标引
根据专利类型和专利技术主题将专利分为设备、煤气化工艺及产品、煤液化工艺及产品、低温干馏工艺及产品、炼焦工艺及产品、煤基合成化学品及技术、三废回收与处理和其他加工共8类。根据专利文献主要发明点所涉及的技术主题确定技术主题类型。一篇专利可以是其中的一种类型,也可以同时涉及几种类型。对于不能归类到上述技术主题的内容,可以归至其他加工一类中,并填写自己定义的技术主题名称。在后期整理时,可将该类的技术内容汇总。如果有统一的一致分类,可以考虑将其补充到技术主题类型当中。
设备:是指一种机械装置、部件或其改进,或一个生产系统。该分类通常与其他技术主题分类结合使用,例如当发明中明确给出某装置所应用的具体工艺类型时。
气化工艺及产品:是指与煤气化相关的新工艺或工艺改进。例如参数、生产步骤或反应条件等的确立或改进,及由此获得的新产品、新材料或组合物。
炼焦工艺及产品:是指与煤的炼焦技术相关的新工艺或工艺改进。例如参数、生产步骤或反应条件等的确立或改进,及由此获得的新产品、新材料或组合物。
低温干馏工艺及产品:是指与煤的低温干馏技术相关的新工艺或工艺改进。例如参数、生产步骤或反应条件等的确立或改进,及由此获得的新产品、新材料或组合物。
直接液化工艺及产品:是指与煤直接液化相关的新工艺或工艺改进。例如参数、生产步骤或反应条件等的确立或改进,及由此获得的新产品、新材料或组合物。
间接液化工艺及产品:是指与煤间接液化相关的新工艺或工艺改进。例如参数、生产步骤或反应条件等的确立或改进,及由此获得的新产品、新材料或组合物。
三废回收与处理:是指与上述工艺相关的工业废水、废气和废液的回收、后处理方法或综合利用,以及烟气的净化方法。
其他加工:不能归于上述技术主题分类的其他煤化工技术。例如一种从煤气回收氯化物的方法和设备。
3.3 关键词标引
关键词是对名称的适当补充。标引关键词标引不仅可以避免丢失一些有用的信息,还可以提高查全率。关键词是与发明点关系密切的技术术语,将与发明点关系较弱的技术术语排除,从而提高查准率。所标引的关键词应能揭示出专利文献的技术内容,主要包括技术领域和采用的技术方案。必要时,可进一步揭示有益效果和特定用途。标引的关键词应能重点反映解决其技术问题所对应的发明点的技术特征。
技术主题为设备类的发明创造,关键词可标引的要素主要有:产品设备、部件、零件等,也可以是零部件形状方面,还可以涉及执行的功能。技术主题为工艺及产品类型的发明创造,包括分类中的气化工艺及产品、炼焦工艺及产品、低温干馏工艺及产品、直接液化工艺及产品和间接液化工艺及产品,关键词可标引的要素主要有:产品、反应物、组分、产品或材料的性能,发生的反应、工艺条件、工艺步骤、所用催化剂等;技术主题为三废回收与处理类型的发明创造,关键词可标引的要素主要有:产品、回收工艺等。
3.4 书写规范
中文:中文标引文字用宋体,标点符号用全角的;
英文:英文标引文字用Times New Roman,标点符号用半角的;
其他标引项里出现的英文单词,一律要求大写格式,但必须使用小写时例外,例如pH;
关键词项,标引词之间用“;”分隔;最后一个标引词后面不要带标点符号;
化合物:①标准化学式和化学元素符号。例如H2SO4、Cu、Zn……②化学基团的标准缩写。例如Me、Et、Ph……③涉及化合物系统名的规范书写。在标引单中,只要涉及化合物系统名称时,名称中出现的字母、数字、逗号、各类括号、短横杠等均用英文半角,并且各个字符之间无空格。
4 煤化工数据平台功能
煤化工数据平台是一款高度集成的、具有强大检索、统计分析功能的检索和分析系统。该系统充分发挥了现代计算机硬件和软件的先进性能,实现了简单检索、表格检索、高级检索、同义词检索、相关度排序、实时统计、统计报表导出、会员管理以及相关内容的分析等功能,极大地提高了对海量专题数据的情报检索效率。
4.1 专利检索
专利检索是一个高度集成的专业化专利数据库集群检索系统。具有专用的专利数据检索引擎,并且吸收了目前世界上大多数著名联机检索系统平台的先进功能,同时结合众多用户的特殊检索需求,具有功能强大、使用灵活、检索效率高、用户界面友好的特点。它不仅提供简单易用的检索方式,还提供高度专业化的检索方式,适合初级、中级、高级用户使用。平台主要具有简单检索、表格检索、高级检索、国际专利分类号(IPC)和国际外观分类号检索、同族专利检索、引证信息检索、法律状态检索、数据下载、检索结果实时统计等功能。
4.2 统计分析
专利信息统计分析功能以强大的数理统计为支撑,实现从专利信息检索到统计分析、图形化显示,最终自动生成专利分析报告的专利信息分析业务流程。统计分析作为引领自主创新的技术预见工具,能够帮助预测产业及相关技术的发展趋势、发现技术的新分支和产品应用方向、判断技术的生命周期状况。同时,还可将其作为有效的市场竞争情报监测辅助手段,实现对竞争对手的时时关注,根据统计分析的结果强化专利布局、避免专利雷区,提高市场竞争能力。平台实现了常规统计分析、自定义统计分析、自动生成专利分析报告等功能。
4.3 数据管理及其他辅助功能
4.3.1 同义词管理
同义词管理分为同义词检索和同义词词表管理两大部分:①同义词检索。在简单检索、表格检索、高级检索中都包含同义词检索,将符合检索规则的关键字的所有相关同义词的专利数据检索出来。②同义词词表管理。提供新增、修改、启用、禁用、删除同义词词表的功能。
4.3.2 企业名称表管理
将企业旧名称、企业子公司、企业控股公司等与现有企业名称关联起来。当对专利申请人进行检索时,可以通过企业名称代码表将与此企业的相关联的名称选中,扩大命中范围。
4.3.3 自定义导航
提供快捷的专利检索入口。将用户定制好的检索结果放入导航中,方便其他用户参考,也方便自己下次登录系统——不必使用表格检索、高级检索等重新检索,只需在导航树中找到此节点打开,就可以看到检索结果。导航提供添加、删除、修改功能。具体功能如下:①导航检索。内置树状的快速导航。点击某个导航将进行检索并展示检索结果。②添加导航。提供将历史检索式添加到导航的功能。③修改导航。提供对自建导航的修改功能。④删除导航。提供对自建导航的删除功能。
5 数据深加工
为提高专利数据在平台中的应用效果,通过数据加工的手段对不同途径获取的专利数据进行规范化、关联化。数据加工标准是在吸取了国际先进数据标引基础上进行的优化,这项工作的开展将使用户可以对世界范围的专利信息获得最佳的检索效果。数据加工工作包含两个部分:①针对原始基础数据资源的进一步处理和加工。这可以有效保证甚至提升专利数据的质量。②针对平台数据的加工。
5.1 同族专利加工
同族专利信息是重要的战略情报,它通常可以体现某项(类)专利技术在不同国家的申请状况。通过查询同族专利,可以帮助企业了解竞争对手的某项关键技术都在哪些国家申请了专利保护,从而能够了解竞争对手的市场战略意图,并能及时避免在该国市场对其专利造成侵权,起到知识产权预警的作用。因而,有效查询同族专利信息,对企业具有积极的战略意义。然而,原始的专利文献中并没有同族专利信息,或同族专利信息并不完善,有相当一部分专利只有该族专利中的优先权(在先申请)的信息。根据同族专利定义,同族专利可分成简单同族、复杂同族、扩展同族、国内同族等;而判断是否同族的依据主要依靠优先权。进行同族专利处理需要通过编写程序把不同来源的海量专利原始数据的优先权信息进行提取和规范处理,然后根据规范后的优先权进行同族专利的关联整合与处理,将同族专利以优先权为线索进行归类,在原始文献中增加同族专利的字段信息,以供企业及时、方便地查询目标专利在不同国家的申请状况。
5.2 引证数据加工
专利引证信息同样是做技术情报分析的重要资源。它可以反映某目标专利引用过的先有技术以及引用过目标专利的后续技术。通过对引证信息进行分析,可以追溯某项技术的历史发展轨迹——在深入了解技术来源与演变的同时,可以对预测未来技术发展趋势起到积极的参考作用。同时,如果某项专利很少引用他人技术而被其他专利多次引用,可以体现出该专利在其领域中具有较基础和重要的作用,有可能为核心技术专利;反之,如果某项专利引用了大量的先有技术而很少被其他专利引用,也暗示出其可能为其他技术的叠加,技术价值和创新性不一定很强。在专利原始文献中,引证信息并不全面,仅有部分国家提供引证信息,同时也仅体现专利引用的先有技术信息,而不具备被引证的信息。通过数据加工,北京东方灵盾科技有限公司对专利引证信息进行格式整理,建成更加完整、更加规范的引证信息数据库。将数据库载入平台系统,通过平台的引证分析功能,得出引证专利和被引证专利间的向量关系,可查询目标专利前后三代(共七代)的专利引证信息,以树状结构展示。
5.3 同义词加工
针对专题数据库所涉及的各个技术领域,在建立技术分类的过程中,通过对数据库所包含的技术领域中的重要技术特征和产品名称的相同词意的不同表达词汇进行加工,筛选出不少于200组关键词形成包含中英文词汇的同义词表。同义词表的
设立结合相应平台功能,在检索效果和效率上取得明显突破,能够有效地克服语言障碍,降低用户在使用不同语言检索时的漏检率。
5.4 法律状态加工
法律状态加工是将法律状态数据按照终止、失效、无效、权利转移、许可贸易等不同情况进行筛选分类,便于用户在查看专利数据时进一步按照这些分类进行筛选。同时,法律状态加工工作还将自动计算出每件相关专利的理论存续期,给用户判断专利的生命周期予以有效的参考。
5.5 数据的规范、整理、索引及入库
由于原始的专利数据来源于美国、欧洲专利局、日本、世界知识产权组织、中国等不同的知识产权局和组织,各国的数据规范和提供的内容字段是完全不同的。因而,我方会把不同来源的数据进行格式规范,尽力补齐缺失的字段等信息,以便于进行统一检索。原始数据经过以上加工工作以后,还需要进行一些进一步的整理、索引和入库工作,以提高数据质量和平台检索效率。比如,针对所有相关文摘进行倒排索引,并对文摘数据进行分词;建立文摘库、同族专利库、法律状态库和引证库之间的向量关系;提供检索效率高的垂直索引数据库,供平台进行大规模、多类型的数据检索和分析使用。
6 专利平台的推广应用
《煤化工专利信息服务平台》建成后最大的价值在于通过应用解决煤化工科研单位以及企业在发展中遇到的技术问题、市场竞争问题和知识产权管理问题,为山西的煤化工产业打造一条高效安全的绿色发展之路起到支撑作用。推广工作的落脚点是持续地扩大受众面,持续提升应用的效率和效能。要想做好推广工作,引导驱动是关键,而最有说服力的引导和驱动在于以情报属性反映平台价值。真正意义上的科技情报需要通过专业化的情报分析人员通过对信息的统计、分析、加工、解读后才能得出。《煤化工专利信息服务平台》中经过加工标引的专利信息已经具备了科技情报的初级属性,情报人员可以平台为应用工具对整个行业或某一特定技术的专利信息进行检索、分析和解读,便可以生成具有情报属性的分析报告,这项工作重点在于把握住科研生产单位的需求和技术关键点。以《煤化工专利信息服务平台》为工具制作分析报告,可以体现出平台数据资源的价值以及平台应用功能的优点,通过分析报告牵引更多用户关注平台,驱使用户使用平台,逐渐现实自给自足。初期选定3~5家重点企业,针对企业在技术创新中或科技项目管理中的实际情况,指派专人指导企业通过《煤化工专利信息服务平台》获取有助于解决实际问题的信息,在指导的过程中对应用效果进行评估,后期可形成典型案例在行业内进行推广。
参考文献
[1]罗晓沛.数据库技术[M].武汉:华中理工大学出版社,2000:73-77.
[2]黄梯云.管理信息系统[M].北京:高等教育出版社,1999:17-20.
————————
作者简介:葛川(1982—),男,山西省科学技术情报研究所副研究员,研究方向为情报学和专利信息系统开发。
〔编辑:胡雪飞〕