利用CNKI数据库高效检索现有技术的方法
2020-10-21陈优
陈优
摘 要:现有技术检索是发明专利实质审查工作中最重要的环节。目前,现有技术的检索通常优先考虑在专利库中进行,非专利库检索作为补充。但是对于某些类型的专利申请应该优先在非专利库中进行检索。CNKI是常用的非专利数据库,本文结合实际案例介绍如何利用CNKI数据库实现高效检索。
关键词:CNKI;专业检索;句子检索
中图分类号:G306文献标识码:A 文章编号:1003-5168(2020)03-0153-03
1 绪论
专利法第22条第1款规定,授予专利权的发明应当具备新颖性、创造性和实用性[1],一项专利申请是否具有“三性”的审查在发明实审中及其重要性。而判断一项发明专利申请是否具有三性,则是基于对现有技术的检索。检索是发明专利申请实质审查过程中最重要的环节。检索的效率、准确性,将直接影响实质审查的效率、专利申请的走向及专利权的稳定性。提高检索水平是提高专利审查效率与质量的关键。
随着信息系统的发展,检索资源越来越丰富。如果对于每一件专利申请,都在各个检索系统中进行穷尽检索,这显然是不现实的。如何合理、恰当利用非专利库进行检索,是提高检索效率与质量的关键因素之一。CNKI是最常用的非专利数据库之一。CNKI中常用的检索方式有一般检索、高级检索、专业检索、句子检索,检索字段可为“篇名”“关键词”“主题”“全文”“作者”等。由于非专利文献量非常大,在利用CNKI数据库进行检索时,如何准确地选择检索方式、检索字段,如何表达检索要素是检索的关键。下面笔者将结合自己在审查过程中的一些经验心得,结合实际的案例,介绍在使用CNKI数据库进行检索时,如何选择检索方式,如何基于选择的检索方式合理构建检索式,以实现高效检索。
2 如何选择检索方式
CNKI中常用的检索方式有一般检索、高级检索、专业检索、句子检索。图1为“一般检索”的界面示意,从图1不难看出,CNKI的“一般检索”较简单,只可以选择单一检索字段,例如“主题”,然后简单组合检索关键词,例如:红外and探伤and检测,可检索方式简单。
CNKI“高级检索”可以单独或简单组合使用各检索字段进行检索,图2为高级检索的界面示意,高级检索可以组合多种检索字段,例如“主题”“作者”,并进行简单的组合运算,例如“并且”“或”。然而,高级检索组合检索字段的形式较受限制,不灵活,每一个检索字段可表达的信息量也较少,图2中示出的“主题”字段只可限定两个主题词。
而CNKI的专业检索则可很好地对各种检索字段进行自由组合表达,图3为CNKI高级检索的一个检索示例,其可以组合多个检索字段进行灵活的语法运算,可检索字段丰富,每个字段可限定的检索词数量多,表达灵活,可以提高检索的效率与准确性。在检索中,可优先考虑采用“专业检索”方式进行检索。
3 如何利用“专业检索”实现高效检索
确定了检索方式后,接下来更为关键的即是构建检索式。CNKI专业检索可使用的检索字段包括“篇名”“作者”“关键词”“主题”“全文”等,如何从这些丰富的检索字段中选择合适字段进行检索也是能否实现准确、高效检索的关键。分析这些字段收录的信息可知,“篇名”“作者”“关键词”字段收录信息量少,单纯使用这些字段容易漏检,“全文”涵盖的信息量又太大,引入的噪音太多,无法准确高效获得对比文件,“主题”字段饱含信息范围相对合适,实际使用中多采用“主题”字段作为检索入口。下面将结合案例一对该种检索方式进行介绍。
案例一
技术方案:利用红外波谱的石榴子石分析方法,包括步骤:利用热红外波谱仪对待测物进行测试,得到热红外波谱,若红外波谱的轮廓包括两个吸收波峰,且第一吸收波峰的波长小于第二吸收波峰的波长,第一吸收波峰的吸收强度大于第二吸收波峰的吸收强度,以及主吸收波谷和次级吸收波谷,且主吸收波谷的波长小于次级吸收波谷的波长,将该矿物确定为石榴子石。
【分析检索】
该申请涉及领域较窄,理论性较强,适合在非专利库中检索。该申请技术方案核心实际是利用红外检测方法,通过红外波谱形状特性判断被测矿物是否为石榴石,而“石榴石”可扩展的表达词很多,例如,相关的文獻中,可能将被测物描述为石榴子石,石榴石,岩石,岩矿,矿物,矿石,各种榴石(可统一表达为“榴石”)等等,如果使用“一般检索”或是“高级检索”则无法将这种并列关键词全部进行“或”运算,表达不全面。而“专业检索”则可以很好地将这些要素全部表达出来。综合以上分析,在CNKI数据库中,采用专业检索方式,使用检索式:主题=石榴子石+石榴石+岩石+岩矿+矿物+榴石and主题=红外,获得文献[2]。其公开了对石榴石进行红外分析的方法,获得了与本申请一致的石榴石的红外波谱图。
另外,对于一些发明实质的核心改进点很小,而方案整体涉及内容又较宽泛的申请,此类申请的关键信息通常在“主题”字段中没有体现,只在全文中收录,此时若单纯以“主题”字段为检索入口,则很难获得好的检索效果。对于这类方案,则可将表达准确信息的“主题”字段和囊括全面信息的“全文”字段进行组合,再利用“专业检索”可灵活组合各检索字段的优点进行检索,以同时保证检索的全面性和准确性。下面将结合案例二介绍该种检索方式。
案例二
技术方案:烟叶分切的判定方法,包括步骤:挑选20片烟叶,逐片测量烟叶叶基到叶尖的长度;将20片烟叶叠放在一起,切分成小段,各小段距离相同,将各小段烟叶切成烟丝,混匀,分成2份,一份用于常规化学成分含量测定,一份用于感官质量进行评定;以常规化学成分指标和感官质量总分作为评价因素,进行统计分析,找出这些指标变化的明显拐点,以出现明显拐点,即变化最大处作为烟叶分切点。
【分析检索】
该申请的申请人为国内企业,且该申请属于烟叶检测领域,领域相对较窄,相关专利申请较少,优先考虑在非专利库进行检索。基于此,笔者在CNKI数据库中,利用检索条件“作者”进行追踪检索;然后使用检索条件“主题”,采用关键词要素“烟叶、分切、判定、拐点”进行了检索,获得多篇类似烟叶切分的文献,但均未公开本申请的具体切分方法。
对申请文件进行详细分析,可发现,该申请的核心实际是切分的手段:将烟叶从叶基到叶尖切分成等距的小段。使用“烟叶”“切分”“判定”进行检索获得的文献的切分手段与本申请不同,不能影响本申请的新创性。并且,此类文献在撰写摘要时,通常只会对文章内容进行整体概括,即烟叶的检测分析方法,对应于本申请的核心——“烟叶的具体切分方法”一般不会在“主题”字段中描述。因此,单纯使用“主题”字段进行检索无法获得理想的文献。
此类申请还有一个特点即是只要某文献可以影响本申请的新创性,则在全文中基本会包含相应的切分方法的描述,即:切分和/或等分叶片、叶基;并且,“主题”字段会包含具体切分对象——烟叶。因此,综合考虑减小检索噪音与提高检索准确性,可结合“主题”与“全文”两个检索条件,利用CNKI的“专业检索”方式,使用如下检索式进行检索:主题=烟草+烟叶and全文=叶片+叶基and全文=等分+等份,获得文献[3]。其公开了与本申请基本一致的切分方法。
4 如何利用“句子检索”实现高效检索
CNKI中还有一种检索方式为“句子检索”,句子检索不仅可以实现全文范围内的检索,还可以通过将检索范围限定为同一句而大大缩小全文检索所带来的检索噪音过大的问题。对于核心发明点可以采用一句话概括的发明特别适用“句子检索”功能。下面将结合实际案例介绍如何利用CNKI的“句子检索”功能实现高效检索。
案例三
技术方案:一种应用吸应力特征曲线预测液、塑限的方法,包括步骤:现场取样,通过直接测试土样的吸应力特征曲线或通过测试土样的土水特征曲线,换算获得土样吸应力和含水量的关系曲线;以含水量作为横坐标,吸应力作为纵坐标绘制吸应力特征曲线,得到吸应力随含水量的变化规律;通过绘制的吸应力特征曲线,根据吸应力随含水量变化时的两个明显的拐点确定土体的液限和塑限。
【分析检索】
该申请技术方案简单,涉及内容领域窄、理论性强,同样应优先考虑在非专利库中进行检索。笔者先在CNKI数据库中,采用“专业检索”方式,利用“曲线、拐点、液限、液限”等字段,组合各要素构建检索式,进行了检索,但噪音很大,未获得好的检索结果。
转而分析可发现,该方案核心实际可以采用一句话概括:采用曲线的拐点判断液限和/或塑限,基于以上分析,笔者转入CNKI的“句子检索”,采用“曲线s拐点”“拐点s液限”“拐点s塑限”的检索方式,获得多篇相关文献[4-5],可以影响本申请的新创性。
5 结语
本文介绍了使用CNKI数据库时如何选择检索方式,并介绍了利用“全文检索”和“句子检索”功能来提高检索效率与命中率的方法。具体通过几个案例分析,介绍了如何针对具体技术方案适时选择CNKI数据库进行检索,以及如何利用CNKI数据库的“专业检索”和“句子检索”功能实现高效检索的方法,可以为检索工作提供参考、借鉴,为实现高效、准确的检索提供新的思路。
参考文献:
[1] 中华人民共和国国家知识产权局.审查指南[M].北京:知识产权出版社,2010.
[2] 熊燕等.白色軟玉及其相似玉石的红外吸收光谱差异性比较[J].红外技术,2014(3):238-243.
[3] 户艳霞等.烤烟叶片总多酚积累的位置差异分析[J].云南农业大学学报,2009(6):825-828.
[4] 曹晓毅等.含水量对晋西黄土抗剪强度影响的试验[J].煤田地质与勘探,2014(5):77-80,99.
[5] 吴琼等.义马煤业北露天矿弱层流变强度特征[J].露天采矿技术,2014(4)-42,46.