APP下载

影响科技查新报告质量的关键因素案例分析

2018-01-26牟韶彬

天津科技 2018年4期
关键词:查新主题词检索

马 磊,牟韶彬

(东北大学图书馆 辽宁沈阳110819)

科技查新报告是查新机构就其处理查新项目的过程以及得出的查新结论向查新委托人或有关部门所做的正式书面报告[1],其主要内容包括查新项目的基本信息、查新目的、项目的科学技术要点、查新点、查新范围要求、文献检索范围及检索策略、检索结果、查新结论、查新员与审核员声明、附件清单、备注等。在查新报告的形成过程中每一个环节都直接影响着查新报告的质量,文章从查新过程中的关键环节——“文献检索范围及检索策略”出发,结合实例,分析总结查新过程中的经验、技巧以及需要注意的问题,以期优化查新报告质量。

1 检索范围的选择

检索范围是指查新过程中查新员实际使用的检索工具及其时间范围。在实际工作中,应针对查新项目的技术主题、查新范围和查新目的,确定文献检索的专业范围、地域范围、时间范围、语种以及文献类型等,以便于选择适当的检索工具。选择全面、准确的数据资源是开展科技查新工作的物质基础,是保证“查全”的前提。因此,在实施检索之前,查新员应在充分理解项目内容的基础上,选择合适的数据库。

1.1 兼顾基础性数据库与专业性数据库

查新报告中数据库的选择要与项目内容相辅相成,既要有与项目内容相关的基础性数据库,也要有与项目内容相关的专业数据库。如:在所有理工类查新项目中都要检索 EI、SCI等理工科综合性数据库,化学及相关领域的项目必须检索SciFinder等。

1.2 以国际联机检索系统作为保障

以 Dialog为代表的国际联机检索系统由于数据量大、回溯时间长、更新速度快、内容全面,基本能满足查找外文文献的需求。因此,做国内外查新项目时,对网络数据库检索之后,非常有必要利用国际联机检索系统进行补充检索,从而为保证查新质量提供有效支撑。

1.3 互联网资源作为有效补充

随着互联网技术的发展,网络资源日益丰富,对于专业数据库资源具有很好的补充作用。特别是涉及到产品、工法等项目查新时,互联网资源是必不可少的组成部分。

案例 1:隧道二衬钢筋精确定位施工工法,要求查找“利用一种三角架定出圆心位置,将二衬钢筋按照设计弧度施作;利用一种可调整的支撑杆使二衬钢筋钢中环向架立筋与纵向定位筋联合形成整体的受力体系”。该类项目涉及具体施工工法,在CNKI、万方等数据库中很难找到密切相关的文献。在筑龙网中,“隧道二衬施工方案”、“隧道工程质量控制要点”均为相关施工方案,可作为密切相关文献,做进一步细节对比。

2 检索词的拟定

检索词是构成检索提问式的最基本单元,深度理解主题,适度选择检索词,是保证查新质量的关键[2]。在实际工作中,确定检索词是正式接受查新委托后的第一步工作,将直接影响文献的查全率和查准率以及查新结论的准确性[3]。查新员一般能够做到以用户提供的主题词为参考,注意检索词的不同表达方式,包括检索词的同义词、相关词、全称和简称、上下位类词的扩展、外来词的译写变化、英美不同拼写方式等等。除此之外,提取主题词时还要注意以下两个方面:

2.1 理解委托人自己杜撰的词

在实际工作中发现,部分委托人试图通过偷换概念、自创关键词、型号等方法使项目具有新颖性,遇到这种情况,查新员要及时与用户沟通,正确理解概念的具体含义,不能单纯按照委托人提供的关键词进行检索。

案例 2:高维大数据查询处理与优化技术研究,要求查找“基于属性列组模型和行列存储相结合的高维大数据存储模型”。其中,“属性列组模型”即为委托人自己提出的名词,实际上是先按照数据的属性划分,然后分类进行存储。因此,在检索时要按照“属性列组模型”表述内容的实际含义来检索。

2.2 适当采用分类号检索

检索过程中,人们往往习惯于使用主题词进行检索。但是,从查新角度来讲,由于科技词语中一词多义、一物多名等现象的存在,以及文献中自由词的广泛性和不确定性,使得单凭主题词进行检索难以达到查全、查准的要求。

案例 3:要查找“碳纤维数控机床龙门架”的专利,“龙门架”的表达方式很多,如加工中心、龙门吊等,只用主题词检索,专利数据库很难做到查全,结合IPC分类号检索更方便。

对同一技术主题而言,不同的专利申请文件的描述方式可能不同,再加上分类过程中的人为因素,对同样的技术主题给出的分类位置可能有细微的差异[4]。

3 检索算符的使用

为了准确快速地筛选出有价值的信息,查新员通常会使用不同的算符来连接检索词,以表达更复杂的概念。一般使用逻辑算符、位置算符表达检索词之间的限定关系,使用截词符表达检索词词形的变化。目前,检索算符的使用规则各数据库未做统一规定,具体要参照数据库的使用说明。

3.1 谨慎使用逻辑算符“not”

布尔逻辑算符是最常用的检索算符,适用于各个数据库及互联网资源,但在涉及排除某个概念的情况下,要谨慎使用“not”,以免排除掉相关文献。

案例 4:串联法氧化铝生产工艺,要求查找“不配碳酸钠调整液溶出技术,熟料溶出用调整液不配入碳酸钠,避免二次反应”。其中“不配碳酸钠调整液溶出”,在检索式中不能直接用 not去掉“碳酸钠调整液”,而应直接检索“用调整液进行熟料溶出”的文献,然后阅读检出文献,看其调整液中是否含有碳酸钠。

3.2 灵活运用位置算符

位置算符用来规定算符两边的检索词出现在记录中的位置,进一步强化了对概念的限制,比布尔逻辑算符更能表达复杂的概念,并能避免“and”逻辑组配产生的词义含糊或误检。在实际工作中发现,检索结果中部分文献虽然符合检索条件,但与项目内容相关性并不大。分析其原因,主要在于检索词在命中文献中的位置相对较远,与检索式想要表达的含义并不相同。这种情况,特别适合使用位置算符调整检索式。

案例 5:山参培育技术的集成与示范研究,要求查找单株山参重达多少克。该类项目涉及具体指标,若只在“标题”“摘要”等字段中检索,很可能检索不到相关文献;若在“全文”字段中检索,会检索到大量不相关文献。这种情况使用位置算符调整检索式得到的结果比较理想。在 CNKI中检索式如下:SU=(山参+林下参+野山参+移山参+人参)and FT=('单只 # 重 # 克'+'单支 # 重 # 克'+'一只 # 重 #克'+'一支 # 重 # 克'+'单只 # 达 # 克'+'单支 # 达# 克'+'一只 # 达 # 克'+'一支 # 达 # 克'+'单只 #重量 # 克'+'单支 # 重量 # 克'+'一只 # 重量 # 克'+'一支 # 重量 # 克'+'单只 # 达到 # 克'+'单支 #达到 # 克'+'一只 # 达到 # 克'+'一支 # 达到 # 克')

由于检索结果较多,一般查新员不采用“全文”字段进行检索。但查新中的文献检索和判读不能仅在“主题”字段进行,而应尽量深入阅读全文并从中提取关键数据及涉及项目查新点的若干细节内容,这在《科技查新技术规范》中已明文规定[5]。工作中应根据实际情况,灵活使用位置算符,既扩大检索范围,又减少文献判读时间。

4 国内外查新注意的问题

随着中国科学技术的进步和创新能力的提高,越来越多的科技项目需要做国内外查新。与国内查新不同,查新员在做国内外查新时,一方面要面对语言障碍,另一方面要面对数量众多的国外数据库。如何更准确地、更有效地进行检索,是摆在查新员面前的一大难题。

4.1 提取英文主题词

在检索外文文献时,如果只使用委托人提供的英文单词进行检索,往往检索得到的文献数量很少,或者是有一定数量的文献,但多为中国作者的文章。遇到这种情况,查新员一定要与项目技术人员进行深入沟通,把握技术要点,尽可能请技术人员提供相关国外文献;同时,可通过查找专业词典和数据库受控词表、在外文数据库中试检等方式,至少要找出几篇相关的英语国家作者发表的文献,认真阅读并找出合适的主题词及同义词、缩写等。否则,检索出的文献要么偏离课题内容,要么只检索出中国作者发表的英文文献,进而导致查新员做出错误的判断。

案例 6:广义经济生物系统的复杂性分析与控制,要求查找“把经济管理变量通过建模直接与所研究的生物状态变量联系起来,得到的模型由微分方程和代数方程表示,研究代数方程的内在涵义,以及对系统动态行为的影响”。其中用户只给出主要概念“广义系统(descriptor systems)”,查新员在检索中文文献时,发现了同义词“微分代数系统(differential-algebraic system)”。当用这 2个检索词查找英文文献时,发现检索不到国外作者的文献,显然存在问题。经阅读相关英文文献,发现同义词“奇异系统(singular systems)”,该词在中文经济类文献中较少使用,但检索出很多国外作者的英文文献,并且相关性较大。

4.2 排除中文文献

查新员在做国内外查新时,通常从检索中文文献开始,因此在检索英文数据库时,无需再查找其中收录的原文语种为“中文”的文献,编写检索式时可直接去除中文文献(如:Ei中“not la=Chinese”),这种方式方便快捷,可减少阅读文献时间,提高工作效率。

5 结 语

综上,在整个查新过程中,检索范围的选择和检索策略的制定直接影响着查新报告的质量。选择检索范围时,要在深入细致了解项目内容的基础上,尽量做到对论文、专利、成果和互联网免费资源的全面覆盖;确定检索词时,要在不同的数据库里进行试检,确保检索词准确、全面;制定检索策略时,要针对项目内容,灵活运用各种运算符,采用组合检索的方式,从各个角度保证检索的全面性。实践证明,丰富的背景知识和查新经验有利于保证查新报告的质量。因此,在日常工作中,查新员要注意消化吸收新知识,了解科技文献的基本构成,对科研动态保持敏锐的观察力,多了解国内外的最新科研动态;同时,要及时总结、学习数据库的检索方法和技巧,从而保证查新报告的质量,为我国建设创新型国家做出积极的贡献。

[1]中华人民共和国国家质量监督检验检疫总局,中国国家标准化管理委员会. 科技查新技术规范:GT/T32003—2015[S]. 北京:中国标准出版社,2015.

[2]张仁琼. 科技查新工作的理论与实践[M]. 合肥:合肥工业大学出版社,2014:28.

[3]张岚,张柏秋,于非. 科技查新检索质量优化策略研究[J]. 情报科学,2011,29(6):852-855.

[4]马磊,宋建玮. IPC分类法在科技查新工作中的应用[J]. 图书馆学刊,2012,34(3):32-34.

[5]周广西. CNKI同句和同段检索功能在查新中文文献检索中的应用[J]. 图书馆工作与研究,2017(4):83-85.

猜你喜欢

查新主题词检索
基于文献分析浅谈医院科技查新服务
关键词的提取与确定
《中国医学计算机成像杂志》2020 年第26 卷主题词索引
瑞典专利数据库的检索技巧
一种基于Python的音乐检索方法的研究
基于微信登陆的科技查新系统模块及流程设计和实现
浅议专利检索质量的提升
《中国骨与关节杂志》2016 年第五卷英文主题词索引
科技查新工作问题发现及应对