APP下载

广西科研数据基础设施发展的现实困境和对策分析

2022-04-28

大众科技 2022年2期
关键词:基础设施广西数据库

崔 薇 陈 洁

广西科研数据基础设施发展的现实困境和对策分析

崔 薇陈 洁

(桂林理工大学图书馆,广西 桂林 541004)

为促进广西科研数据基础设施建设的发展,提高广西科研工作的公共服务能力,文章在调研广西科研数据基础设施发展现状的基础上,分析广西科研数据基础设施在发展过程中存在的科研数据基础设施管理计划不健全、科研数据资源建设能力不完善、科研数据资源采集能力不完备、科研数据分析能力建设不到位等问题,提出广西科研数据基础设施建设发展的调整路径,即加强体制机制改革,提升科研数据基础设施建设动力;发挥各方积极性,提升科研数据基础设施建设能力;加强支持技术开发,提升科研数据基础设施服务能力。

科研数据;基础设施;广西

引言

科研数据产生于科技研究的过程中,是学术论文和科研项目的重要支撑。科研第四范式的到来,科研数据已成为推动科技发展和社会进步的重要战略资源。而科研数据基础设施是科学研究基础设施中的“基础设施”,不仅是“e-science”的重要组成部分,更是区域创新和科研工作者开展现代化科研工作的必备条件。

1 广西科研数据基础设施建设现状

1.1 广西科研数据源建设现状

本文主要从联合数据库、购买数据库、自建数据库、共享数据库的建设情况来探究广西科研数据源的建设现状。

1.1.1联合数据库的统计数量与分布情况

数据库是数据存储计算机网络系统的基础,为使科研数据资源得到充分开发利用与共享,联合数据库的建立尤为重要,它对数据资源的搜集、整理、加工、开发利用与传递等,是多个科研平台的联合共建共享开放的过程。如表1所示,通过对广西科研平台进行调查分析发现,现有的联合数据库主要分为国外联合数据库、国内联合数据库、区内联合数据库、区外联合数据库、特色资源联合数据库等。总的来说,广西各公共图书馆、高校图书馆和科研所的数据库联合实现了共建共享及对数据资源进行搜集、整理、加工、检索与传递的过程。

表1 广西科研平台联合数据库的统计分析

数据来源:广西壮族自治区图书馆、桂林图书馆、广西大学图书馆、广西民族大学图书馆、广西科技情报研究所文献馆等官方网站整理所得。注:√代表联合全国、全区同类型的数据库;/代表无

1.1.2购买数据库的统计数量与分布情况

广西科研数据库的调查分析主要面向高校、公共图书馆、科研图书馆网站等,购买的数据库资源主要从数据库集成商处购买,根据自身数据库的资源需求通过购买协议或采购方案获得的数据库资源具有长期保存或一定期限内的访问权。如表2所示,购买的数据库主要分为中文数据库、外文数据库、电子期刊、电子图书、工具与软件等多种类型资源。资源种类丰富,涵盖图书、报刊、学位、会议论文、影视、图片、音乐、专利、数值事实、工具类和培训考试类等。购买的数据库分布以中文数据库、电子期刊和电子图书的种类为主,其他数据库虽有购买,但是数量上相对较少。总的来说,广西科研平台购买的数据库资源较为丰富,数据资源也较为齐全,实现了数据平台的浏览、文献查询、下载、传递等服务。

表2 广西科研平台购买数据库的统计分析

数据来源:广西壮族自治区图书馆、桂林图书馆、广西大学图书馆、广西民族大学图书馆、广西科技情报研究所文献馆等官方网站整理所得

1.1.3自建数据库的统计数量与分布情况

自建数据库及由该平台自主建设的数字资源库,已成为科研平台数字资源的重要组成部分。对高校图书馆而言,自建数据库的建设不仅为师生提供了丰富、专业、系统的科研资源,还彰显了高校的特色与实力[1]。如表3所示,广西公共图书馆、高校图书馆和科技图书馆根据本身数据库的特色自主建设了该平台所需共享的数据库。总体上各科研数据平台都能根据自身平台的需求,服务于公众,建设特色的资源数据库,但现有的自建数据库仍较少。

表3 广西科研平台自建数据库的统计分析

数据来源:广西壮族自治区图书馆、桂林图书馆、广西大学图书馆、广西民族大学图书馆、广西科技情报研究所文献馆等官方网站整理所得

1.1.4共享数据库的统计数量与分布情况

通过对数据的整合、清洗与交换,从而形成的共享数据库是实现信息的联通与共享过程,也是面向公众通过共享数据库对科研数据进行采集与共享的过程。如表4所示,广西科研平台的共享数据库建设根据不同的科研平台特色,建设的数据库标准也不一样。如公共图书馆的共享数据库主要对广西文化共享、广西特色资源共享;高校图书馆则是对国内外高校图书馆的共享,购买的国外资源数据共享。总体上,广西各科研机构都建设了共享数据库的信息共享平台,实现了信息的联通与共享过程。

表4 广西科研平台共享数据库的统计分析

数据来源:广西壮族自治区图书馆、桂林图书馆、广西大学图书馆、广西民族大学图书馆、广西科技情报研究所文献馆等官方网站整理所得

1.2 广西科研数据采集能力现状

科研数据采集能力主要体现在数据的获取和储存能力两方面。本文通过对北部湾科学大数据集成共享平台、广西大型科研仪器共享网络管理及服务平台、广西海洋研究员科学数据共享平台的更新频次、数据量、数据类型等文本数据的统计,建立矩阵结构,以达到分析目前广西科研数据采集能力现状的目的。

1.2.1北部湾科学大数据集成共享平台科研数据采集能力现状

北部湾科学大数据集成共享平台的数据采集仅收录了2020年及2019年各类别的基础科研数据,其中2020年新闻资讯尚未更新。如表5所示,总体观察,北部湾科学大数据集成共享平台建立以来,收录的大数据种类分类较为清晰,但各分类下的基础数据采集极为有限,数据采集更新能力亟待增强。

表5 北部湾科学大数据集成共享平台科研数据采集能力现状

数据来源:北部湾科学大数据集成共享平台官方网站http://beidu.gulf.onlymepower.com/整理所得

1.2.2广西大型科研仪器共享网络管理及服务平台科研数据采集能力现状

广西大型科研仪器共享网络管理及服务平台成立之初,其目的是为了促进广西区内大型科学仪器设备共享,减少重复购置。目前,广西大型仪器协作共用网已经发展至成员单位104家,分布于广西区内多个城市;拥有入网仪器1046台/套,仪器总价值8.3亿元,涉及农产品食品、医药卫生、生物医学、地质矿产、材料等十几个研究领域。

表6 广西大型科研仪器共享网络管理及服务平台科研数据采集能力现状

数据来源:广西大型科研仪器共享网络管理及服务平台官方网站https://www.gxyq.cn/Home/Index整理所得

如表6所示,相较于北部湾科学大数据集成共享平台,广西大型科研仪器共享网络管理及服务平台运营较为成熟,数据较为完善从2000年至2020年均有数据收录,但2000年至2015年存在数据断层情况,新闻数据更新频率较为稳定,其不足之处在于数据收录分类情况不够清晰。

1.2.3广西海洋研究院科学数据共享平台科研数据采集能力现状

广西壮族自治区海洋研究院于2012年11月成立,瞄准国家和自治区海洋事业发展的重大需求,开展海洋科技与战略研究,致力打造“海洋科技发展平台、海洋决策支撑平台、海洋智库平台”三大平台,为广西海洋事业的发展贡献力量。如表7所示,广西壮族自治区海洋研究院数据分类明晰,前期研究院成立之初至2017年数据更新及收录情况都较为可观,但从2017年至2020年,数据收录情况开始出现逐年下降,甚至2020年至今仅更新了院内新闻情况,其余大数据均未被收录。

表7 广西海洋研究员科学数据共享平台科研数据采集能力现状

数据来源:广西海洋研究员科学数据共享平台官方网站http://www.gxao.org.cn/gxhyyjy_kxsjgxpt整理所得

1.3 广西科研数据分析能力建设现状

1.3.1广西科研数据分析能力建设现状

对于广西科研数据分析能力建设现状的调查,本文选取了广西大学、桂林电子科技大学、桂林理工大学、广西民族大学四所高校及中国地质科学院岩溶地质研究、广西社会科学院作为研究对象,建立矩阵结构,以各高校和科研机构是否具备云平台、计算服务、仿真服务、国家重点实验室、广西科技文献共享与服务平台为分析指标,统计分析各研究对象科研数据分析能力建设现状,详见表8。

表8 广西科研数据分析能力建设现状总体分析

数据来源:广西大学、桂林电子科技大学、桂林理工大学、广西民族大学、中国地质科学院岩溶地质研究所、广西社会科学院等官方网站整理所得

综合以上四所高校及两所广西科研机构的科研数据分析能力建设成果发现,广西范围内各高校及科研机构在科研数据基础设施建设方面正在走向全面化和成熟化,科技基础条件平台、科学数据共享中心等科研数据基础设施建设稳步推进。然而,也可以看到高校的社会科学科研数据基础设施依然主要局限于作为技术支撑的基础资料数字化获取,主要集中在科研数据管理生命周期的数据采集、检索和成果管理等阶段,既没有形成全管理生命周期的覆盖,也没有形成“一体化”的数据与计算平台。

2  广西科研数据基础设施建设困境

2.1 科研数据基础设施管理计划不健全

从现状可以看出来,广西在科研数据基础设施建设的体制机制建设方面已经迈出了较大的步伐,取得了一定的成就。但是,第四科研范式下的科学研究对科研数据基础设施建设的要求已经不仅仅停留在文献和数据共享层面。目前广西科研数据基础设施建设管理计划在体制机制上仍然存在一些问题。

2.1.1管理计划仍以政府意志为主导

在相关文件中仍然以传统的科层制管理模式组织科研数据基础设施建设与资源共享,采用的方法依然是以行政命令为主。科学研究有其自身发展的规律,必须尊重科研生命周期和数据生命周期的结合,应以科学研究主体为主导力量,政府在其中主要承担引导、规划、制度保障和资源支持的作用。

2.1.2社会力量参与不足

管理计划中所涉主体以科技厅、自治区各部门、各设区市人民政府和科研院所及高校等为主,对促进科学数据共建共享、分级分类建设与管理的主体缺乏社会力量的参与,虽设有专家委员会开展相应的技术咨询工作,但缺乏各行业领域的细分,缺乏科研数据基础设施建设高端智库(论坛)。

2.1.3缺乏科研数据基础设施联动机制,横向共享机制不健全

广西科技文献信息共享服务的绩效考核内容提出对广西科研数据建设管理在开放共享、文献服务、应用推广、高端服务方面建设发展,虽然目前各科研平台做到了纵向的联合与共享,但是不同科研平台之间的横向联合并没有得到发展,也没有实现共享的机制,也缺乏跨学科的交流。这无疑也是广西科研数据管理建设发展的不足之处。

2.2 科研数据资源建设能力不完善

根据对广西科研数据建设现状调查分析发现,广西科研数据建设在数据库的建设发展总体上呈良好的发展趋势。但是随着数据洪流的涌现,还是存在一些不足之处,使得科研基础设施的建设管理计划未真正得到良好落实。

2.2.1创新特色数据库建设与共享不足

通过对以上科研机构数据管理的分析可发现,目前已经建设开通的只有北部湾科学大数据集成共享平台、广西海洋研究院科学数据共享平台等少数几个行业特色数据库集群和共享服务平台。广西气象、地貌、农业等相关研究领域的基础性研究数据库,与广西现代特色农业产业“10+3”、做大做强做优广西工业“14+4”产业集群相关的行业研究数据库集群,与广西各级科研单位长期积累的科学研究相关的机构数据库等建设与共享明显不足。

2.2.2科研数据基础设施平台服务功能与使用界面不完善

联合数据库、共享数据库与自建数据库的网页有部分无法打开使用;每个科研平台都大量购买了电子资源数据库,造成了资源的重复建设与浪费;部分数据库的网页在外网的情况下无法访问或需重新注册账号登录操作。各科研平台的自建数据库现有量少,规模小,更新、宣传不到位,利用率不高。

2.3 科研数据资源采集能力不完备

在已经建成的科研数据基础设施运行过程中,对科研数据的采集与更新存在明显的不足。

2.3.1科研数据资源重平台建设,轻数据采集与更新现象严重

通过调查和分析发现,在现有的科学数据共享平台中普遍存在平台建设“一遍过”的现象。平台虽然搭建了较为完善的数据库集群、数据共享和服务、决策支持等平台各项功能框架,但是其数据采集与更新却十分滞后。部分平台如海洋科学数据共享平台数据量极少,并且以公开出版发行的统计数据为主,缺乏海洋科学研究的科学数据,且多年没有更新;大部分平台均存在数据更新周期长、更新量小,或者集中时间段更新,而没有按照科学研究的进度及时更新。

2.3.2科研基础设施提供的信息数据资源单一化

通过对广西科研基础设施平台的调查分析发现,现有的数据资源大多数只停留在文献共享的阶段,多种数据类型缺失。如联合的数据库、购买的数据库、共享的数据库与自建的数据库都是以文献的类型存档,大多数是地方文化文献、期刊、学位论文、电子图书、辅助类工具、视频等。对于由实验、调研、访谈产生的自然科学数据较为缺乏,除了部分高校图书馆有相关的统计数据可检索外,很少有经实验、测量的数据可提供。

2.4 科研数据分析能力建设不到位

科研数据基础设施建设不仅要注重数据的采集存储和分享应用,更重要的是要提高数据分析的能力。因此软件、算法库、决策支持、信息可视化等IT技术支持都应该纳入科研数据基础设施建设的内容之中。目前广西科研数据基础设施建设过程中,针对科研数据分析能力和通讯、信息技术支撑工具的开发严重不足。

2.4.1经费使用范围狭窄

在科研数据基础设施建设项目中,大部分经费支持主要用于数据库的购置、采集与建设工作,缺乏相应的分析工具、算法、软件开发的经费支持。

2.4.2数据分析能力欠佳

在调查的科研数据基础设施平台中,能够提供软件、算法库、决策支持、信息可视化等IT技术支持平台和机构较少,行业性、专业性分析工具开发与产品化、共享使用不足。

2.4.3数据资源、算力资源与网络通讯资源整合不足

从调查的情况来看,能够提供云计算、数据挖掘与分析、算法开发,提供数据采集、存储和检索、共享的机构不少,但能够把三者进行整合,将算法库、分析工具和决策支持工具等纳入到数据平台建设中的机构和平台较少。

3 第四研究范式下广西科研数据基础设施建设的建议

3.1 加强体制机制改革,提升科研数据基础设施建设动力

3.1.1优化协同机制

处理好科研数据基础设施建设与社会经济发展、重大科学研究项目、基础性研究等协同发展,优化科技创新布局;发挥区域相关领域的科学技术积累和资源地理优势,明确建设发展重点和优先顺序,处理好已建设施与新建设施和计划建设设施之间的合作协同;坚持硬件建设与软实力打造相结合,推进研究、教育、创新等功能协同,促进预研、建设、运行、升级管理与研究管理有机衔接[2]。

3.1.2汇聚各方资源,拓宽融资渠道

发挥集中力量办大事的制度优势,除争取中央财政投入以外,还应充分发挥区域优势,汇聚地方政府和社会的优质资源,完善基础研究多元化投入体系,扩大相应领域社会科研基础设施的投资规模[3],有效配置资源要素。探索地方政府参与大型科研基础设施建设的多种机制,统筹政府各类资金支持力度,积极引导社会资本加大投资力度[4],提高技术水平和国际竞争力。

3.1.3完善科研数据基础设施建设机制

坚持“专项”建设与各机构、重大科研项目分布式建设相结合的机制,在管理计划上将科研生命周期和数据生命周期相结合[5],实行分级分类管理,坚持“面向用户、需求驱动、应用导向”的发展理念;对其他机构和项目鼓励科研数据资源共享与开放。建立基础性、通用性与共用性专项建设与专用性、领域性、行业性科研数据基础设施分布式建设共同发展框架。

3.2 发挥各方积极性,提升科研数据基础设施建设能力

3.2.1加强特色数据库集群的建设与共享开放

紧密结合广西经济社会发展、重点产业发展和基础研究的实际需要,以各类科研机构、企事业单位为依托,有序推动基础性科学研究、行业性科学研究科学数据的数据库集群与共享服务平台建设。建设与广西现代特色农业产业“10+3”、战略性新兴产业倍增发展行动、做大做强做优广西工业“14+4”产业集群相关的行业研究数据库集群建设[6]。

3.2.2提升现有数据库和平台的数据采集能力

对现已建成的北部湾科学大数据集成共享平台、林业科技信息服务共享平台、广西海洋研究院科学数据共享平台、广西石漠化区科学数据共享与决策支持平台等进行升级,加强数据采集与更新能力建设[7],保持科学数据的可持续更新。

3.2.3对科学数据资源建设加强顶层设计,避免重复建设

一方面要加强购置数据的共建共享,减少资源重复购买造成的浪费,变“我有”为“我用”的资源建设思路;另一方面要加强各类数据库集群建设的顶层设计[8],避免数据资源重复采集、重复供给。

3.3 加强支持技术开发,提升科研数据基础设施服务能力

3.3.1拓展科研数据基础设施建设的范畴,加强三大资源的有效整合

紧密结合第四研究范式对科研数据基础设施提出的全新要求,将科研数据基础设施建设从单纯的科技文献、科学数据资源建设或相关数据库建设进行拓展,加强算法库、软件、分析工具(共用性和专业性结合)、信息可视化等算力资源与科学数据资源的整合,并通过互联网为广大用户提供更全面的数据服务,达成算力、数据和网络三大资源的有效整合。

3.3.2完善科研数据基础设施平台服务功能与使用界面

对科研平台的可及性、可用性进行提升,建立科研数据基础设施统一身份认证制度,提供多个平台互认以及跨平台登录、数据建设与数据传递服务[9]。加强科研数据基础设施建设的宣传力度,提高服务能力和资源利用率。

4 结束语

通过实际的调查研究能促进广西科研数据基础设施建设的发展提供建议,有利于我们深入了解广西科研数据基础设施建设的发展现状,及时调整其发展路径,从而提高广西科研数据基础设施建设的能力,更好的实现提高公众服务能力水平。

[1]何小月,雷锦怡,江翩翩. 中美高校图书馆自建数据库比较研究[J]. 图书馆学研究,2019(6): 40-48.

[2]张绍丽,郑晓齐,张辉. 互联网环境下国家“开放—共享—协同”创新体系研究[J]. 科技进步与对策,2016,33(19): 1-7.

[3]黄红华,张婧. 大学图书馆开展研究数据服务策略分析[J]. 图书馆理论与实践,2020(4): 58-62.

[4]刘莉,刘文云. 基于解释结构模型的科研数据共享影响因素分析[J]. 情报科学,2020,38(5): 27-33.

[5]金贞燕,阿童木. 科研数据管理服务内容体系构建研究[J]. 情报理论与实践,2021,44(8): 42-50.

[6]陈宝珠. 图书馆提升学科服务能力对策研究[J]. 图书馆建设,2020(S1): 177-179,183.

[7]彭鑫,邓仲华. 数据密集型科研环境下的科研数据管理框架研究[J]. 数字图书馆论坛,2017(7): 61-67.

[8]王海彪,卫军朝. 科学数据管理关键因素研究——基于爱丁堡大学科学数据管理实践及启示[J]. 图书馆杂志,2017,36(1): 20-26.

[9]孙茜. 欧洲科研开放获取基础设施项目OpenAIRE的建设与启示[J]. 图书情报工作,2019,63(3): 138-148.

Analysis of the Practical Difficulties and Countermeasures of the Development of Scientific Research Data Infrastructure in Guangxi

In order to promote the development of Guangxi’s scientific research data infrastructure and improve the public service ability of Guangxi scientific research, based on the investigation of the development status of Guangxi scientific research data infrastructure, this paper analyzes the problems existing in the development of Guangxi scientific research data infrastructure, such as imperfect scientific research data infrastructure management plan, imperfect scientific research data resource construction capacity, imperfect collection capacity of the scientific research data resources, and inadequate construction capacity of the scientific research data analysis, etc., this paper puts forward the adjustment path for the construction and development of scientific research data infrastructure in Guangxi, that is, strengthening the reform of system and mechanism, promoting the driving force of scientific research data infrastructure construction; giving full play to the enthusiasm of all parties and improving the capability of scientific research data infrastructure construction; strengthening support for technology development and improving the service capacity of scientific research data infrastructure.

scientific research data; infrastructure; Guangxi

G311

A

1008-1151(2022)02-0190-05

2021-12-07

2019年度广西壮族自治区科协资助青年科技工作者专项课题“第四研究范式下的广西科研数据基础设施调查及发展对策研究”(桂科协〔2019〕ZC-18);广西哲学社会科学规划研究课题“大数据驱动下面向科研第四范式的高校图书馆应对策略研究”(17FTQ004)。

崔薇(1985-),女,桂林理工大学图书馆馆员,硕士,研究方向为信息科技、信息服务。

陈洁(1981-),女,桂林理工大学图书馆副研究馆员,博士在读,研究方向为信息科技。

猜你喜欢

基础设施广西数据库
农业基础设施建设有望加速
公募基础设施REITs与股票的比较
振动搅拌,基础设施耐久性的保障
数据库
广西尼的呀
充分挖掘基础设施建设发展潜力
数据库
数据库
数据库
广西出土的商代铜卣