智能化升级检索系统在专利检索中发挥优势
2023-01-05国家知识产权局专利局专利审查协作北京中心
国家知识产权局专利局专利审查协作北京中心 贾 宁
“要继续提升知识产权审查质量和效率。加快专利审查、商标注册智能化系统建设”。国家对提高知识产权审查质量和审查效率提出了明确要求,成为新时期知识产权工作的重要指南。近年来,云计算、大数据等人工智能技术蓬勃发展,各类机构在专利检索领域积极开展研究和应用,专利审查和检索系统智能化升级是我国建设世界一流专利审查机构的必然选择。
每一件发明专利申请在被授予专利权前都应当进行检索。专利检索是保障专利审查员客观、公正、准确、及时地进行专利审查的基础,检索质量直接关系审查的后续走向和审查效能。提高专利审查的质量和效率,首要任务就是提高检索的质量和效率。专利检索系统的智能化升级是支撑专利审查“提质增效”的重要举措之一。2021年,智能化升级检索系统上线运行,保留并优化S系统现有功能,新增智能检索功能,实现检索资源集约化、检索功能智能化、检索流程标准化,切实助力审查工作“提质增效”。下面,本文将结合实际案例,从整合检索资源、优化检索功能和完善检索策略三个方面对智能化升级检索系统的优势进行介绍。
整合检索资源
智能化升级检索系统对数据库进行了优化整合,对专利文献的整合主要包括:保留专利检索与服务系统(S系统)数据库并优化、全文库整合文摘数据、外文数据库译为中文、同种语言数据库整合等;对非专利文献的整合主要包括:内网本地非专利数据、内网镜像非专利数据、外网非专利数据等。
案例1权利要求:一种去除血液中白细胞的过滤装置,包括过滤器组件和滤芯,其特征在于:过滤器组件包括有形状相同的上过滤器部件和下过滤器部件;上下两个过滤器部件的形状为喇叭口形;上下两个过滤器中间设置有滤芯。
本申请的分类号B01D29/085(漏斗过滤器;其支架)和B01D29/05(带有平的被支撑的过滤元件)仅表达普通的过滤器,没有体现过滤器具体的应用领域(用于过滤血液中物质的过滤器),以上述分类号检索不能准确表达发明点,需要重新确定合适的分类号。经预检索后初步分析,本申请的过滤器发展较为成熟,检索中发现该技术早在二十世纪六十年代国外一些发达国家已开始研究,因而调整检索策略,选择在外文库中进行检索。
在S系统中,获取分类号的主要手段包括:分类号查询器、分类号统计分析命令等。在CNABS库中利用关键词“白细胞s过滤”进行检索,对结果采用分类号统计分析命令“..mems/ic,..li m2”,得到分类号A61M1/34(通过膜滤出血液中物质的医用吸引或汲送器械),该分类号很好地表达了涵盖应用领域的发明构思。接着对体现过滤对象的“白细胞”的英文关键词进行充分扩展,得到检索式表达“or leucocyte?,leukocyte?,(white 5d blood 5d cell?)”,用上述分类号结合关键词,可在VEN中得到对比文件JP平1-256971A,但需要浏览594篇外文文献,浏览时间较长,且对外文文献阅读水平有较高要求。
在智能化升级检索系统中,为了更高效便捷地获取分类号,该系统提供了新的操作手段,在检索历史统计分析按钮中增设分类号分析功能,通过点击相应按钮,可以快速对分类号进行更为直观的统计分析,同样可以得到分类号A61M1/34。在WPABSC中,用该分类号结合采用中文表达的关键词“白细胞”进行检索,并对结果进行语义排序(语义排序基准选为本申请的申请号),可以在中文检索及浏览模式下快速得到对比文件JP平1-256971A(排名97位)。
尝试采用不同数据库对检索结果进行比较可得,在ENTXTC中,采用分类号A61M1/34结合中文关键词“白细胞”进行检索,语义排序后在992位获得目标文献。在WPABS中,采用分类号A61M1/34结合扩展后的英文关键词表达“or leucocyte?,leukocyte?,(white 5d blood 5d cell?)”进行检索,语义排序后在49位获得目标文献。在ENTXT中,采用分类号A61M1/34结合扩展后的英文关键词表达“or leucocyte?,leukocyte?,(white 5d blood 5d cell?)”进行检索,语义排序后在955位获得目标文献。
通过比较可知,智能化升级检索系统中的WPABSC、ENTXTC均为中文翻译库,可以采用中文关键词进行检索,同时提供中文浏览模式,浏览更加高效,便于审查员专注检索外国专利,提高外文检索和文献筛选的效率。另外,检索过程中还需要考虑技术领域以及技术术语的特点,如果英文表述方式较多,而中文表述较统一,优先考虑使用WPABSC和ENTXTC,反之优先考虑WPABS和ENTXT,但目标文献出现的位次会基于中英文表达不同有一定变化。
除了能够更快捷地获取准确分类号,智能化升级检索系统中的检索历史统计分析按钮中还包括区域分布分析、申请人分析、发明人分析、申请/公布时间分析、法律状态分析和语义分词统计分析等功能,在专利分析功能方面具有一定优势,展示结果的形式包括饼状图、柱状图和表格,能够清楚、直观地了解技术发展趋势。另外,通过点击上述按钮,可对检索结果的区域布局、创新主体排名、申请趋势、法律状态、关键词扩展等方面均有较为全面的展示,也为进一步检索调整方向提供了有力的保障。
优化检索功能
智能化升级检索系统在优化了S系统现有功能的基础上,还新增了智能检索功能,如融合检索功能,以语义检索为核心,实现了选库、检索、概览、辅助工具一体化。相比较于传统的布尔逻辑运算,语义检索不再拘泥于文字信息的匹配,而是寻求获得文本语义最相关的文献。语义排序基准是语义检索的基础,可以输入申请号、词句、段落对检索结果进行排序,还可通过语义分词来调整其权重。如果能够构造出准确的文本作为语义基准,可提高命中对比文件的效率,在检索实践中可以进行尝试。
案例2权利要求:一种高速除油装置,其特征在于,包括:除油机构、储液机构、抽液机构和搅拌机构;除油机构包括除油缸和安装于除油缸内的过滤网格,过滤网格包括第一过滤层和第二过滤层,第一过滤层和第二过滤层垂直设置,过滤网格将除油缸分隔成第一空间和第二空间;储液机构包括储液箱、与储液箱连通的入液管和安装于入液管的第一水泵,入液管远离储液箱的一端伸入第一空间;抽液机构包括抽液箱、与抽液箱连通的抽液管和安装于抽液管的第二水泵,抽液管远离抽液箱的一端伸入第二空间;搅拌机构包括旋转电机和与旋转电机传动轮连接的传动轴,传动轴伸入第一空间内,传动轴位于第一空间的一端安装有搅拌轮。
本申请的权利要求撰写篇幅较长,发明点较为宽泛,不易概括,关键词有多种表达方式,难以扩展全面。利用Patentics智能语义排序的优势,使用“R/公开号”进行尝试,可在第9、35位快速获得CN107164645A、CN107913539A两篇对比文件。但是,对于“过滤网格包括第一过滤层和第二过滤层,第一过滤层和第二过滤层垂直设置,过滤网格将除油缸分隔成第一空间和第二空间,增大了过滤面积”的发明构思,上述对比文件均没有体现,需要针对该点进一步检索。
在S系统中,虽然上述关键技术特征已经限定清楚,但是对于过滤层、网格、分隔、垂直、面积的表达方式较多,如面积的表达方式包括容积、容量、体积、大小、空间等,垂直的表达方式包括竖直、正交、垂向、竖向、纵向等。由于关键词的表达方式多,表达难以扩展全面,且分类号较为分散,采用关键词和分类号的常规检索方式费时费力,很难获得合适的对比文件。
在智能化升级检索系统中,首先使用本申请的申请号、说明书、权利要求书分别作为基准进行语义检索,均没有得到合适的对比文件,通过查看语义分词,发现语义分词中未体现两个过滤层垂直设置分隔出两个空间的相关语义分词表达,存在较多无关的描述,仅使用申请号、说明书、权利要求书进行语义排序的效果不佳。基于所要寻找的目标文献,需要人工改写语义排序基准。首先,选取权利要求中对应该发明构思的技术特征“过滤网格包括第一过滤层和第二过滤层,第一过滤层和第二过滤层垂直设置,过滤网格将除油缸分隔成第一空间和第二空间”作为基准进行语义排序检索,仍没有得到合适的对比文件。接下来,尝试人工改写语义排序基准,提高语义排序的精准度。选取上述技术特征结合技术效果,人工改写后加工形成比较精准的一段话“过滤网格包括相互垂直的第一过滤层和第二过滤层,过滤网格将除油缸分隔成第一空间和第二空间,增大了过滤面积”作为基准进行语义排序检索,在第65位即可获得对比文件CN208650239U。
通过比较可知,智能化升级检索系统的融合检索支持语义检索,在使用申请号进行语义检索时,如果排序结果噪音较多,还可通过人工改写的方式提高语义检索的精准度,以提高检索效率。另外,在智能化升级检索系统中进行语义检索时,可通过调整语义分词及其权重,更好地表达专利申请的发明构思,提高对比文件的排序,快速获得体现核心发明构思的对比文件,从而提高检索和对比文件筛选效率。
完善检索策略
在智能化升级检索系统中,可尝试多种方式进行检索,如纯语义检索:以申请号为语义基准自动执行纯语义检索,也可以调整基准后再次进行纯语义检索;先布尔检索、后语义排序:通过输入布尔检索式进行检索,圈定文献的范围,并可以对布尔检索结果进行语义排序,实现布尔检索和语义检索的融合;先语义检索、后布尔筛选:语义检索推荐一定数量最相关的文献,布尔检索在该范围中进行筛选。
案例3权利要求:一种过滤器,包括至少一纳米纤维层和至少一基层,其特征在于,纳米纤维层包括含有金属掺杂纳米活性吸收颗粒的疏水性合成聚合物,纳米纤维层通过静电纺丝工艺形成在基层上。
以本申请作为优先权的国际申请案件的国际检索报告给出了3篇X类文献,上述文献公开了纳米纤维中可添加活性炭、壳聚糖、负离子粉、氧化锌等,即公开了从多种选择中选2种。经过分析,在纳米纤维层的疏水性合成聚合物中添加含有金属掺杂纳米活性吸收颗粒,即同时加入金属和纳米活性吸收颗粒的方案需要进一步检索。另外,本申请的分类号B01D39/14(其他自持式过滤材料)和B01D46/00(专门用于把弥散粒子从气体或蒸气中分离出来的经过改进的过滤器和过滤方法)仅表达普通的过滤材料、过滤器和过滤方法,无法与传统空气过滤器相区分,也没有体现具体的材料层(纳米纤维)以及添加的材料(含有金属掺杂纳米活性吸收颗粒),上述分类号较为宽泛,检索不能准确表达发明点,采用上述分类号容易造成漏检。
在S系统中,首先采用关键词进行初步检索,通过检索结果浏览给出的分类号,配合分类号统计功能,选取与本申请相关度高的分类号,进一步采用分类号+关键词的方式,结合同在算符、临近算符锁定适当的检索范围,没有得到合适的对比文件。考虑到该领域的分类号分布较分散,限入分类号可能造成漏检,于是调整策略,仅采用关键词进行检索,结合体现发明点的功能限定,在CNTXT库进行检索,检索式为“and(s(or金属,银,Ag,锌,Zn,锰,Mn),(or抗菌,抑菌,杀菌,灭菌,除菌,细菌)),(s(纳米纤维),(滤))”,结果数为851,超出浏览上限,无法进行浏览,进一步缩小检索范围有漏检的风险。
在智能化升级检索系统中,采用多种检索方式对检索结果进行比较分析。选用纯语义检索的方式,以申请号作为语义排序基准,在CNTXT中进行检索,第4位直接命中X类对比文件CN105821586A。接着,选用先布尔检索、后语义排序的检索方式,采用上述S系统中相同的检索式“and(s(or金属,银,Ag,锌,Zn,锰,Mn),(or抗菌,抑菌,杀菌,灭菌,除菌,细菌)),(s(纳米纤维),(滤))”进行检索,同时配合语义排序功能,第3位即可命中上述文献。可见,采用布尔检索圈定文献的范围后,可提高命中对比文件的效率。选用先语义检索、后布尔筛选的检索方式,语义检索推荐400篇最相关的文献后,采用上述检索式进行筛选,同样在第3位即可命中上述文献。可见,该检索方式同样可以进一步提高纯语义检索的精准度。
接着,尝试动态调整关键词后,选用先布尔检索、后语义排序的检索方式,采用检索式“s(or金属,银,Ag,锌,Zn,锰,Mn),(or 吸收,吸附,活性炭,活性碳,沸石,气凝胶),(or掺杂,混杂,掺入,混合,交换)”,配合语义排序功能,第33位可获得另一篇X类对比文件CN101804275A。通过验证,上述文献采用纯语义检索或先语义后布尔筛选的检索方式均无法检索得到。可见,采用纯语义检索或先语义后布尔筛选的检索方式,均对语义检索的准确度有着较高的要求,如果在语义检索圈定的范围内无法命中对比文件,在该范围内进行布尔检索,同样也会遗漏该对比文件,该方式可能存在一定的漏检风险。
通过比较可知,智能化升级检索系统中纯语义检索不需要构建复杂的检索式,进行智能化检索,可配合人工调整语义排序基准,初步检索阶段可节省检索时间和精力。先语义检索、后布尔筛选的方式可进一步提高纯语义检索的精准度,但也需要依赖于语义检索的准确度才能更好地发挥作用,若语义检索准确度不高,在语义检索圈定的范围内进行布尔检索,可能会遗漏对比文件。选择合适的语义排序基准,采用先布尔检索、后语义排序的方式,可有效提高命中对比文件的效率。
本文通过三个审查过程中的实际案例,从整合检索资源、优化检索功能和完善检索策略三个方面,探讨了智能化升级检索系统的主要优势。智能化升级检索系统对专利及非专利文献数据进行整合,对检索、浏览及辅助工具等功能模块进行优化,对检索策略进行扩充完善,体现快速、准确、全面的检索优势。合理、灵活地运用智能化升级检索系统,可以准确、高效地获取目标文献,提高检索质量和效率。