发明专利实审中非专利文献的检索策略
2019-03-22谢晶
谢 晶
(国家知识产权局专利局专利审查协作天津中心,天津 300304)
一、引言
检索是发明专利申请实质审查程序中一个重要的步骤[1],尤其是在以“三性”评判为主线的审查程序中,是判断一件发明专利申请是否具备授权前景的重要手段。在发明专利实质审查中用到的资料包括专利文献及非专利文献。随着人工智能的飞速发展,该技术领域的发明专利申请也大幅增长,而人工智能技术涉及很多先进的计算机算法的应用,这导致越来越多的发明专利申请中出现算法类的相关描述,因此,非专利文献的应用也越来越广泛。
二、非专利文献的检索策略
(一)为了解现有技术而进行的非专利文献检索
随着人工智能的飞速发展,发明专利申请中引入了越来越多的高新技术,作为人工智能技术领域的审查员,在进行实质审查前需要了解更多的现有技术,以充分向本领域技术人员靠近。面对飞速发展的高新产业,非专利文献的公开往往会优先于专利文献,因此,为了更好地了解现有技术,需要在非专利库中进行检索,以获取更多的背景知识。
一般以了解现有技术为目的的非专利文献检索,可以不了解技术方案的实质,而仅以发明主题或方案中涉及的相关算法的名称为关键词进行简单检索。例如,主题名称为“基于红外视频的SF6气体泄漏自动检测方法”的发明专利申请,其技术方案是利用红外视频实现SF6气体泄漏位置的定位。面对该专利申请,审查员为了了解相关领域的现有技术,仅以“红外”“气体泄漏”为关键词,在百度学术中进行了简单的检索,获得大量的相关文献,了解了该技术领域的发展现状。又如,主题名称为“融合KL变换与灰色关联度的非局部均值去噪”的发明专利申请,其技术方案主要是利用KL变换算法与灰色关联度分析算法对非局部均值滤波算法进行改进,以获得更有效的去噪效果。该专利申请中涉及很多的具体算法描述,审查员在不熟悉这些算法的基础上首先利用“KL变换”“灰色关联度分析”和“非局部均值滤波”作为关键词,在百度学术中进行了简单检索,获得相关算法的介绍。对于计算机领域的专利申请,尤其是技术发展更新较快的领域,如图像处理、模式识别等,很多较新颖的算法往往发表在国外的期刊或国际会议上,因此,外文非专利文献的检索也十分重要。例如,涉及“卷积神经网络进行图像处理”的发明专利申请,可以利用“convolutional neural network”以及该算法在方案中的作用或目的为关键词在常用的外文非专利库中进行检索。
(二)为寻找XY类文件而进行的非专利文献检索
对一件发明专利申请进行检索之前,首先要分析该申请的特点,以制定合理的检索策略,提高检索效率。
作为人工智能领域的审查员,对本领域中适合进行非专利文献检索的案件进行总结,得出如下几个特点:(1)发明专利申请为高校或研究院所的申请;(2)发明专利申请为高校与企业的联合申请;(3)发明专利申请为企业或个人申请,但发明人为高校老师;(4)发明专利申请为企业或个人申请,但技术方案中记载了复杂的算法或公式;(5)发明专利申请为企业或个人申请,但技术方案偏向于博客或论坛记载的内容。
针对不同特点的专利申请,本文制定了不同的非专利文献检索策略。
首先,对于符合第(1)~(4)条特点的专利申请,可首先利用申请人或发明人在非专利库中进行追踪检索,笔者一般选择的非专利文献库为“百度学术”CNKI和万方。一般高校、研究院所或校企联合申请,发明人或相关人员会发表与专利申请技术方案相关的期刊文献。例如,专利号为“2014*****8902”的发明专利申请,申请人为杭州电子科技大学,该专利申请独立权利要求步骤详细,具备典型的高校专利申请的特点,针对该专利文献,审查员使用发明人名称及申请人名称在CNKI中的作者发文检索中检索到发明人在前发表的论文,用以评述了该专利申请的新创性。例如,专利号为“2014*****3265”的发明专利申请,申请人为广州嘉琪智能科技有限公司,该专利申请为公司申请,但通过对发明人进行检索,发现其中两个发明人为南京航空航天大学博导及博士生,因此,利用发明人继续进行追踪检索,最终检索到可以用来评述该专利申请新创性的对比文件。又如,专利号为“2015*****8156”的发明专利申请,申请人为薛笑荣、刘永革、刘明亮,该专利申请为个人申请,但其权利要求中涉及较多的算法和公式,以申请人姓名为关键词,在百度学术中利用作者进行检索,检索到可影响该专利申请新创性的文件。同时,该申请人为西北工业大学计算机科学与工程系的老师。当利用申请人及发明人追踪不到合适的对比文件时,对于与高校或研究院所相关的专利申请,其发明人中往往有该高校或研究院所的老师,并且其技术方案往往具有延续性,可能为某个技术团队持续性研究的课题,因此,可以以该发明人姓名为关键词,在CNKI的博硕士库中,以导师为入口,检索到与该导师相关的学生的博硕士论文。在此基础上,进行追踪检索,也可检索到相关的对比文件。例如,专利号为“2016*****7481”的发明专利申请,申请人为华中科技大学,在利用申请人和发明人进行追踪检索时,未检索到合适的对比文件。而发明人“钟胜”的单位为华中科技大学图像识别与人工智能研究所,因此,在CNKI的博硕士库中,以导师“钟胜”和作者单位“华中科技大学”进行检索,检索到该导师的一名博士生发表的论文可以影响该专利申请的新创性,而该博士生并不是该专利申请的发明人。当利用上述追踪方法,不能检索到相关的对比文件时,可以利用“发明人&关键词”的组合进行检索。当然,此时更多的是外文非专利文献的检索。例如,专利号为“2014*****7787”的发明专利申请,申请人为国家电网公司、南瑞信息通信科技有限公司,该专利申请的独立权利要求较长,权利要求中包含许多模型公式,其撰写方式偏学术,而且发明人较多,在利用发明人追踪未检索到合适的中文对比文件时,在百度学术的高级检索中,利用权利要求中出现的数学模型的英文表达以及发明人的英文名称,检索到可评述本申请新创性的对比文件。
在实际审查过程中,对于某些高校或研究院所的发明专利申请,利用申请人或发明人追踪检索,可以检索到与该发明专利申请技术方案一致的在后公开的博硕士论文或期刊文献,而该文献不能作为影响本申请新创性的现有技术。此时,可以追踪检索到的在后公开的论文中的参考文献,可以参照参考文献中技术方案确定本申请的技术方案相对于现有技术实际做出改进的技术点,以此进行更加有针对性的检索。
当利用上述追踪检索均不能检索到相关的对比文件时,则需要利用关键词及其中英文扩展在非专利库中进行检索。此时,笔者常用的非专利文献库为“百度学术”和CNKI。在进行关键词提炼时,可提炼技术方案中使用的某种算法或某种数学模型的标准表达方式,此类关键词在本领域中通常具有固定的表达,检索时“噪声”较小。或利用说明书中与某个技术点相关的一句话中的关键词,在CNKI中利用句子检索进行检索,此方法一般较适合针对确定的区别来检索给出结合启示的对比文件。对于一些有算法描述的发明专利申请,有些对比文件,其可能不会以文字描述,而是以公式的形式记载,此时,可以根据专利申请中的文字描述概括其效果或作用,利用该效果或作用进行检索。例如,专利号为“2016*****9656”的发明专利申请,其申请人为成都信息工程大学,其技术方案的实质是将频繁项集算法部署在Map Reduce框架下,实现算法的并行处理,该技术方案共包括6个步骤。在检索过程中,检索到大量的相关文献,与技术方案的步骤1~4相同,但权利要求中的步骤5~6是本申请针对现有技术做出的改进,分析步骤5~6发现该步骤的目的是为了得到更加完整的频繁项集,因此,在百度学术的高级检索中利用“包含全部检索词(Map Reduce FP树 全局频繁项集)and包含至少一个检索词(完整,完备)”,检索到可以影响本申请新创性的对比文件。
对于符合第(5)条特点的专利申请,可以直接在“百度”中进行检索,但要注意网络公开时间的确定,以及证据保存,以防网页过期等原因造成证据灭失。例如,申请号为“2015*****0567”的发明专利申请,其申请人为云南电网有限责任公司红河供电局,该技术方案中限定了“使用搜狗浏览器下载swf格式文档的过程”,通过对权利要求分析,发现其撰写方式更偏向于某些博客或论坛的撰写方式,因此,直接在“百度”中进行检索,在百度知道中检索到“如何下载网页中的flash文件”,与权利要求中的下载过程完全一致。
(三)为公知常识性举证而进行的非专利文献检索
《专利审查指南》中规定,“审查员在审查意见通知书引用的本领域的公知常识应当是确凿的,如果申请人对审查员引用的公知常识提出异议,审查员应当能够说明理由或提供响应的证据予以证明”[1]。同时,《专利审查指南》中规定了公知常识性证据为技术词典、技术手册、教科书等所属技术领域的公知常识。
一般在进行公知常识性证据检索时,选择非专利库“读秀”检索相关的教科书或工具书,利用万方数据库进行“标准”检索,该数据库中包含了国家标准及部分行业标准的全文。在上述数据库检索时,通常使用关键词进行检索,具有针对性。
三、总结
本文针对人工智能领域的专利申请的背景技术类非专利文献、XY类非专利文献以及公知常识证据性非专利文献的检索策略进行了分析,并总结了适合进行非专利文献检索的专利申请文件的特点,并根据不同的特点制定了不同的非专利文献的检索策略,以期提高该技术领域的发明专利的检索效率及审查质量。