科技事实型数据库建设研究
2014-12-11王玉峰
葛 川,王玉峰
(苏州市科学技术情报研究所,江苏苏州 215021)
0 引言
事实型数据是对客观世界中事物的描述,可客观地反映事物发展的过程和结果。对于科技领域来说,事实型数据是指长期积累形成的与科技创新全过程相关的各类科技信息资源,涉及客观描述科技创新决策和具体的科技创新活动全过程的各类科技信息资源[1],具体可涵盖科技政策、技术开发成果、知识产权信息等内容以及其他有支撑作用的信息资源。为此,本文在分析苏州市科技事实型数据建设现状的基础上,提出相关对策建议,对提升该市科技计划项目的发展和决策具有十分重要的意义。
1 科技事实型数据库建设的现状
目前,科技情报机构往往采用的是购买商业数据库的方式来提供服务。但是,我们可以看到,商业数据库提供的都是普遍性服务,数据大部分主要集中于期刊、学术论文和学位论文等内容,并且在使用上有很多限制,功能也比较单一(见表1)。要想在研究工作中形成优势,科技情报机构必须构建服务于特定对象和目标的事实型数据资源库,对资源实现最大化利用,提升数据的使用价值。
科技事实型数据中有一部分数据主要贯穿于科技计划项目管理的整套流程中,如项目指南发布、项目申报、项目评审、项目立项、签订项目合同、项目中期检查、项目验收、资料归档[2]。在各个阶段,项目申报系统都会产生大量的事实型数据,对这些数据的积累、使用和分析将会对我市的产业分布以及科技领域的发展情况有非常大的帮助作用。
表1 苏州市科技情报机构采购的商业数据库比较
目前,科技情报机构的业务很大程度上成为科技管理部门的职能延伸,承担着越来越多的外围性工作,成为科技管理部门的得力助手。我们搭建并维护着市科技计划项目信息管理系统,具有科技事实型数据库数据整合和建设的独有优势[3]。科技计划项目管理系统虽然包含了从项目申请到项目验收等流程中的很多数据,但是,这些数据基本上还是处于一种分散的状态,没有连结性。同时,这些数据还仅仅局限于科技计划类别所包括的范畴,对于科技决策的支撑力度还远远不够。
此外,科技情报机构尽管采用自建或者与其他单位合作的方式开展科技发展动态研究、产业发展问题研究、科技发展战略研究、科技发展跟踪研究和科技发展预见研究等研究工作。但是,这些研究通常限于一隅,和当地实际情况结合的力度显得不足,或者欠缺相关方面的事实数据导致研究成果不够全面,从而不能对上级主管部门起到有效的辅助决策作用。
2 科技事实型数据库建设的主要内容
科技情报机构建立完善的科技事实型数据库不仅能提高自身能力建设,还能对上级主管部门在进行项目决策时提供有依据的支撑。因此,科技情报机构应着重建设以下5 类科技事实型数据库,为上级主管部门进行科技发展的决策和科技政策的实施奠定基础。
(1)建设科技查新类事实型数据库
科技查新是文献检索和情报调研相结合的情报研究工作,它以文献为基础,以文献检索和情报调研为手段,以检出结果为依据,通过综合分析,对查新项目的新颖性进行情报学审查,写出有依据、有分析、有对比、有结论的查新报告[4]。因此,查新有较严格的年限、范围和程序规定,有查全、查准的严格要求,要求给出明确的结论,查新结论具有客观性和鉴证性。基于这些事实型数据,我们可以有效积聚、整合和保存科技查新事实型数据资源,建立科技查新数据库,分析科技成果的分布以及科技创新的发展态势,从而更有效地支持科技计划项目的管理和实施。
(2)建设科技项目类事实型数据库
科技项目管理包括发布项目指南、项目申报、项目评审、中期检查、项目验收等过程[5]。在每个过程中都会产生大量的事实型数据,如项目申报书、中期检查报告、结题报告、验收报告以及学术论文、学术专著和软件著作等。基于这些事实型数据,不仅可以进行科技发展趋势的分析以及科研机构的评价等基础性研究工作,还可以进行技术发展预测与分析等服务。例如,基于项目申报书,就可以了解当前的研究热点,建立技术领域的发展演化模式等[6]。基于中期检查报告和验收报告,可以掌握项目的进展状况,如各种参数指标的考量等,对产业或技术发展进行一些趋势走向分析工作。
(3)建设政策类事实型数据库
科技情报机构在为上级主管部门对某些产业或者地区发展进行调研时,经常需要了解某个国家或地区在某一时期的科技政策,如果平时没有积累这些数据,则很难对需要调研的内容提供令人信服的数据支撑。因此,科技情报机构应有意识地、长期地收集并加工国家、省、市科技政策类数据,具体包括科技政策、产业政策、税收政策、投资政策以及人才政策等,以提高科技政策制定的权威性[7]。基于这些事实型数据,能够直观、清晰地看出国家、省、市在科技发展方面的走向和态势,同时能够进行比较,引领国家、省、市向有利于区域发展的产业过渡。
(4)建设产业类事实型数据库
当前,随着科技服务业在经济发展中占的比例越来越高,各级政府都纷纷将其列为政府的工作重点,与第一和第二产业一起支撑着区域的经济发展。由于业务密切联系着科技主管部门,科技情报机构能够更深刻地感受到科技服务业在经济发展中发挥的作用。产业类数据包括一些宏观统计数据,如产业发展情况、投资情况,还包括产业统计数据,如产业内企业数量、企业销售情况等,以及企业自身数据,如企业基本情况、技术创新情况等等。基于这些事实型数据,科技情报机构可以对产业发展态势、企业发展方向、区域经济发展情况进行分析,形成专题报告,以供上级主管部门在进行科技发展的决策时作为参考。
(5)建设专利信息事实型数据库
专利信息作为科技创新成果的重要成果,对于科技战略研究具有更加重要的意义。通过对专利信息的分析,可以获取大量的情报,可以反映出技术发展趋势、专利申请的经济利益趋向,以及专利申请者的研究开发方向、能力和经济实力等内容[8]。科技情报机构可以通过技术手段整合中国国家知识产权局、美国专利商标局、欧洲专利局、日本专利厅的多种专利数据源,并综合专利题录信息数据源、专利法律状态信息发明说明书等内容进行统计分析技术,对这些数据进行深加工,形成高质量的专利信息数据库。基于这些事实型数据,不仅可以对某一领域的发展情况进行分析,并用可视化的表达方式绘制出来,如专利地图,从而能够直观地反映出历年专利动向、专利技术分布和技术发展趋势等信息;还可以对某一专利的研发人员进行跟踪,掌握研发态势,挖掘高精尖人才为企业发展助力。
3 科技事实型数据库的应用
科技事实型数据库的建设将对今后的科技情报工作带来充分便利,而大样本、全样本的分析,将为今后的科技项目决策提供强有力的支持。对这些数据的进一步分析和整合,可以实现如下的信息分析服务内容。
(1)立项监测。基于项目类事实型数据,可以对项目负责人承担项目情况进行分析,避免项目负责人同一年承担多个项目的情况;同时,还可以对项目承担单位进行监测,避免承担单位在多个计划类别下进行申报造成的重复立项,为科技主管部门提供立项管理。
(2)产业研究。基于项目类事实型数据和产业类事实型数据,可以分析区域内不同行业或领域的发展变化情况,还能够反映出区域对各种行业或领域的支持变化情况。而且,通过横向和纵向比较,可以建立动态的产业地图,直观地显示出区域产业发展情况,为科技主管部门在进行产业规划时提供辅助决策参考。
(3)创新能力评估。基于项目类事实型数据和专利信息事实型数据,可以对企业的历年承担项目、取得成果、科研人员构成和专利著作等情况进行分析,从而能够更好地判断企业的发展情况,如研发实力和产出水平等,并能对真正具有创新的企业在经费支持方面时有一定的提升,从而能够更好地推动企业的发展以及区域的经济发展。
(4)技术预见。结合科技查新类事实型数据、产业类事实型数据和专利信息类事实型数据,可以反映未来可能的发展趋势及带来这些发展变化因素的认识,为主管部门和企业决策者提供实施决策的基础信息。
4 科技事实型数据库建设的建议
科技事实型数据库建设是一项长期性的基础工作,需要上级科技主管部门的重视和支持,同时也需要科技情报机构采取有效的机制和开发新技术,一同来推动这一项工作的开展。
(1)主管部门应统筹规划科技事实型数据库建设工作
科技查新类、科技项目类和科技政策类事实型数据是基础性资源,目前大多数都以数字化形式呈现,如果不及时收集、加工和集中保存,数据就可能丢失。因此,上级主管部门应统筹规划科技事实型数据建设工作,加大科技事实型数据收集加工整合的经费投入,推动科技事实型数据库建设工作有序地开展。
(2)采用合作共建机制推动科技事实型数据库建设工作
科技事实型数据通常都缺乏连结性,而且还需要长期的积累,加上科技情报机构自身业务依托上级主管部门的性质,往往都很难做到全面、完整地收集和加工这些事实性数据。因此,科技情报机构需要与其他机构协作共建科技事实型数据库,拓宽合作渠道,一方面既可以提升自身能力,另一方面也可以有效地提高数据建设的质量,从而能够很好地支撑科技情报研究能力的整体提升。
(3)研究开发新技术支撑事实型数据库建设工作
利用新技术来开发高效的服务平台,连通这些数据之间的关系,才能有效地对这些数据源进行整合,从而能够更好地提升这些数据的使用价值。以往的数据库建设方法和技术已不适应目前的环境,信息技术的快速发展,需要我们利用各种技术,如数据分布处理的技术、数据的抽取、数据的清洗、数据的标引、数据的索引等来对这些科技事实型数据进行加工整理。而一旦随着这些数据量达到一定的级别,则需要使用大数据及相关技术,如Hadoop,NoSQL,Mongo DB 来对数据进行处理,提升数据使用和运转的效率。
[1]贺德方.基于事实型数据的科技情报研究工作思考[J].情报学报,2009(5):764-770.
[2]刘军,范文虎.初探山西省科技计划项目科学数据的汇交管理[J].中国科技资源导刊,2010(5):37-42.
[3]刘军.科技计划项目事实型数据库建设研究[J].中国科技资源导刊,2013(3):97-99.
[4]李万伦,黄文斌.我国科技查新工作存在的问题与对策[J].中国科技成果,2005(21):10-11.
[5]李海峰,党延忠.科技项目管理中知识的界定与表示方法研究[J].项目管理技术,2010(2):29-34.
[6]党延忠.科技管理及科研项目管理——我国基础性研究科研管理中的知识管理[R].大连:2009.
[7]贺德方.事实型数据:科技情报研究工作的基石[J].情报学报,2010(5):771-776.
[8]吴元良,黄雍,唐顺梅,等.浅析专利信息利用在企业专利预警分析中的应用[A].武汉市科学技术协会.科技创新与国家中心城市建设——武汉市第五届科学年会论文集[C].武汉:武汉大学出版社,2013.