APP下载

火炸药科技查新系统的设计

2021-12-04郝晓春李跃青付改侠刘素梅张创军杨晓哲

科技与创新 2021年22期
关键词:主题词炸药准确性

郝晓春,李跃青,付改侠,刘素梅,张创军,杨晓哲

(西安近代化学研究所,陕西西安 710065)

1 火炸药科技查新的发展

1.1 科技查新的定义

科技查新咨询是一项以文献检索为基础,以文献分析为手段,从科学技术发展的宏观角度对所检索文献运用综合分析和对比方法,为评价科研立项、成果鉴定、专利和基金申请等的新颖性和先进性提供文献依据的一种公众性信息咨询服务工作[1-2]。同时,科技查新也是一项比较复杂的信息服务工作,在进行查新的过程中,需要查新人员、查新审核人员、相关专家具备较高的专业化的文献检索能力、高度的工作责任感和多学科的专业知识素养,综合运用文献分析、对比、归纳等查新手段,为查新委托人提供一个明确并且客观的文献事实综述。其目的是为科技管理部门和评审专家提供立项选择、鉴定成果的客观文献依据,从而提高科研项目立项、科研成果鉴定的准确性和评价结论的可信度。

1.2 火炸药科技查新的发展历史、现状

火炸药科技查新是伴随着中国科技查新特别是国防科技查新的产生、发展而发展的。由于历史的原因,中国的国内外火炸药技术资料分散地保存在国防各大部委的情报所如兵器、航天、航空、船舶、电子、核能、国防科技情报所等相关情报机构,以及相关部委主管的大学、研究所、重点大企业中[3-4]。

火炸药科技查新检索经历了从手工检索,翻找纸质资料,到计算机通过专线远程检索固定的数字化的文献数据库查寻信息,再到计算机通过光盘、光盘塔检索,直到现在的多种手段检索过程。国外数字化的文献数据库起步较早,从20 世纪六十年代就开始了。其代表就是始建于1963 年的美国的DIALOG 数据库系统。国内的联机检索系统开始于20世纪80 年代末,90 年代初开始提供文献信息检索服务。其代表如:由中国科技情报研究所研发的万方数据,由国防科技情报所研发的国防科技情报检索系统。目前通过国防科技情报检索系统就可以检索兵器、航天、航空、船舶、电子、核能、国防科技情报所等单位收藏的国防科技信息。

1.3 火炸药科技查新目前存在的问题

火炸药技术是国防关键的技术之一,是先进的高技术武器的核心技术,其发展水平直接制约着高技术武器的发展。因此世界各国特别是发达国家均对火炸药技术的发展给予高度重视,投入了巨大的人力、物力。

目前网络上以及在大型的综合数据库中查找信息主要还是使用主题词/关键词进行查找。另外,火炸药技术的应用专业性很强,但火炸药技术涉及面又很广,这个特殊性决定了火炸药技术的最新信息资料的来源分散,分布很广。网络检索往往得到的信息量非常大,在海量的信息中如何快速找到所需的内容,目前仍然需要一定的经验和技术。即在目前的技术条件下,火炸药技术查新仍然面临着查找技术信息不准、不易分辨的问题。

在科技查新的实践中,出现过个别的查新委托人员为了某种目的,在与查新人员共同分析相关文献与查新课题的异同点时,利用查新人员专业知识、专业外语不强的弱点刻意回避一些文献,诱导查新人员做出对其有利的查新结论[5]。

为了有针对性的解决上述问题,笔者们借助先进的计算机技术、网络技术、数据库技术,结合对规范的科技查新流程数字化的研究,特别是结合火炸药科技查新的专业特点,构建了火炸药科技查新系统,将现有规范的查新工作集成在计算机平台系统中[6-7],将火炸药科技查新过程以工作流的形式呈现、操作和管理。结合先进的数据库技术,利用权威的《兵器科学技术叙词表》(兵器工业出版社1995 年版)构建了火炸药主题词数据库,以帮助查新人员在检索资料时选取权威、准确、专业的关键词,提高检索文献的正确性。

同时,笔者们将相似度算法引入查新流程中,利用计算机强大的运算能力,对检出的文献进行相似度排序,提高查新人员、查新委托人员对相关文献的分辨、鉴别能力,提高查新的正确性和准确性。

2 火炸药科技查新系统的设计

2.1 查新流程的改进

目前的科技查新工作已经形成了规范的流程,如图1 所示。

图1 现有科学查新流程

笔者们在现有的查新流程中集成和应用智能处理技术,将火炸药技术主题词数据库和文献相似度排序算法集成到查新系统中。从技术手段入手,提高查新中文献检索的准确性,同时提高查新人员对相关文献相似度的判断能力,确保科技查新的准确性和客观性。提出的新查新流程如图2 所示。

图2 火炸药科技查新流程

对比新旧查新流程,可以看出新流程增加了智能处理环节,依托新增的火炸药主题词库和集成现有的相似度排序算法,对查新主题词的选择、相关文献的判断,提供技术手段的智能化支撑,从技术上对查新检索的准确性、相关文献选择的准确性提供保障。

2.2 主题词分类数据库的建立

主题词分类数据库是为解决检索的准确和全面而设,所以其词源的选择就必须以检索文献的准确和全面来考虑。为选择合适的主题词源,笔者们考察了《现代科学技术词典》(上海科学技术出版社1980 版)、《科学技术主题词典》(北京文献服务处1980 版)、《国防科学技术叙词表》(军事科学出版社1992 版)和《兵器科学技术叙词表》(兵器工业出版社1995 年版)。就其权威性和准确性来讲,前三个各有所长,它们都是老一辈情报人多年研究、编辑的成果,其权威性和准确性不容置疑。但由于其编辑时间较早,涵盖的学科较多,所以其火炸药词汇的同义词近义词等明显比《兵器科学技术叙词表》的少,这不利于查全。另外《兵器科学技术叙词表》在编辑时参考了上述三个词典,吸收了它们的长处。在考虑了查准和查全两方面的因素后,确定采用权威的《兵器科学技术叙词表》(兵器工业出版社1995 年版)中的火炸药技术相关的词构建了火炸药主题词数据库,以帮助查新人员在检索资料时选取权威、准确、专业的关键词,提高检索文献的正确性和全面性。在设计主题词表时,不仅考虑到主题词的中英文表达及其同义词的中英文表达,还根据火炸药中化学材料名称,将美国化学文摘社给每个成分确定的化合物编的化学物质登记号引入主题词表中。考虑到在查新检索时,经常会检索专利信息,所以在主题词表中,还引入了国际专利分类号。

2.3 文献相似度排序方法

将相似度排序算法引入查新文献分析环节,对题目、关键词、文摘等字段设置了各字段的权重。题目字段的权重值最大,文摘字段次之。按照检索词在各个字段出现的频率,乘以各字段的权重值,再将相应的计算分值相加,按照所得分值的大小,对检索到的文献加以排序。这里表示的相似度是在所检索的文献中,与已检索策略表示的检索主题的相似程度。在以后的实际运行中还可以对权重值进行调整,还可以根据以后技术发展的情况增加新的运算字段,以进一步提高系统的相似度排序的相关性、准确性。这样就能确保系统的技术与时俱进。

该功能主要用于对检索文献的分析,帮助检索和课题委托单位的研究人员客观的确定相关文献,减少人为因素对相关文献分析的影响,提高查新对比的客观性和准确性。

2.4 查新系统的构建

根据上述思路,研究提出了模块化的火炸药技术科技查新系统。从查新人员的角度出发,研究设计了系统的各功能模块的关系,如图3 所示。

图3 系统各功能模块关系

火炸药科技查新系统是采用浏览器/服务器(B/S)的形式,运用纯Java 语言编写的,可跨系统运行的平台。它在现有成熟的操作系统环境中,采用先进的工具软件构建的。

系统的各部分均采用模块化设计。其主要部分“查新工作”所包含模块及其各模块的关系如图4 所示。

图4 查新系统构成模块关系示意图

火炸药查新系统规范查新管理,从根本上实现查新工作流程及查新管理工作的自动化和科学化,达到了提高查新工作效率的目的。且其利用权威、规范的主题词数据库对检索词进行补充和规范,利用计算机的运算能力对检索的相关文献进行相似度排序,提高了查新人员对相关文献的判断力。

猜你喜欢

主题词炸药准确性
CT及超声在剖宫产瘢痕部位妊娠中的诊治价值及准确性
空气也能当炸药的神秘武器:云爆弹
CT诊断中心型肺癌的准确性及MRI补充诊断的意义
产前超声检查和磁共振成像对胎盘植入诊断的准确性评估
议论火炸药数字化制造
常规高效毁伤用火炸药技术发展趋势
智能传感器的智慧战略,新技术创造新价值
为什么炸药的威力会很大?
取消公文主题词的真正原因是什么?
公文主题词消失的原因浅析