APP下载

E-Research环境下高校图书馆科学数据共享机制研究

2020-04-09伍晓光

图书馆学刊 2020年2期
关键词:科研活动数据服务数据管理

伍晓光

(南京中医药大学,江苏 南京 210000)

科学数据是在科研活动中产生的,以文字、图表、音频等形式存储的数据集合体。科学数据是重要的科研产出成果,是科研机构、政府部门等制定决策的参考依据,也是有助于国家科技创新的战略资源。高校图书馆作为科研支持机构,拥有丰富的科学数据储备,在科学数据管理方面具备优势,能够利用多样化的技术工具,为用户提供与科学数据相关的知识产权、隐私保护等咨询服务。而促进科学数据开放共享,有助于科研人员之间的信息交互,能够加快科学数据流通和科研成果转化,减少重复科研成本[1]。然而由于国内很多图书馆对科学数据缺乏系统性的管理,受到政策、技术等因素的限制,科学数据的共享程度较低,整体利用率不高。随着移动互联网技术的普及,具有高性能广域分布特点的信息环境基本形成,促进了全球范围内的跨区域无障碍数据传输,改变了信息传输的手段,也为科学数据开放共享提供了支持。尤其是E-Research 这种新兴科研模式的提出,要求充分利用虚拟现实、数据挖掘、可视化等先进技术,突破数据资源利用的时空阻碍。E-Research 改变了传统的科研环境,也给高校图书馆服务带来机遇和挑战,这就要求图书馆科学定位,建立科学数据共享机制,为用户提供更加优质的服务。

1 E-Research 环境对高校图书馆服务的新要求

E-Research 引发科研模式变革,对科学数据服务提出新挑战。面对E-Research 为主导的用户新需求,高校图书馆作为科学数据管理机构,有必要进行重新思考、定位与规划。

1.1 实现科研成果开放共享

数字化技术的不断发展,使得数字化资源的数量迅速增多,逐步超过纸质信息资源,成为科学数据的主体。数字化科研环境改变了科研人员的交互方式,数据的可复制、高效传递与共享特性,成为现代科研活动的新需求。科学数据是科研活动的支撑,没有稳定、可靠的数据传输途径,科研任务很难顺利完成[2]。而E-Research 是建立在移动网络技术之上的科研活动形式,综合了虚拟现实、网格计算等关键技术,目标在于为科研人员营造安全、开放、共享的协同式、数字化科研平台。E-Research 建立在精准化、高质量的数据集之上,要求高校图书馆尽快实现数据开放共享,用于支持可重复的科研工作,加快科研成果转化进程。

1.2 强化科学数据管理水平

如今数字化资源的应用日益普遍,大规模科学数据的传输流通,在满足科研活动需求的同时,也要求相关存储机构提升数据管理水平。为了更好地适应E-Research 环境,国外很多科研机构制定了科学数据管理政策,从立法角度明确了不同主体的职责,要求高校图书馆等管理机构实现数据开放共享,最大限度为科研项目提供支持。如英国研究理事会出台多项管理规定,要求研究机构承担共享责任,鼓励科研人员共享科研数据。我国也颁布了《科学数据管理办法》,明确了科学数据管理机构的职责、流程和保密措施,充分利用大数据等新技术,建立科学的数据管理框架,以规范有序的管理推动科学数据开放共享。1.3 提供科学数据保障服务

E-Research 环境下科学数据成倍增长,尤其是数据密集型学科产生的数据量惊人,对这些数据进行加工处理,占据了科研人员大部分时间,耗费了大量人力与物力。面对日益复杂的数字化科研环境,以及亟待处理的大规模异构分散的数据资源,科研人员迫切要求高校图书馆等机构提供可靠的服务,通过对科学数据进行迅速采集、整合与分析,降低科学数据处理成本,更好地为科研活动提供支持。尤其是E-Research 改变了科学研究范式,提供了跨区域、跨机构、跨学科的交流环境,加快了数据传递共享[3]。高校图书馆只有顺应EResearch 发展趋势,全面分析科研人员新需求,才能更好地发挥自身在数字化科研中的价值。

2 E-Research 环境下高校图书馆促进科学数据共享的障碍分析

科研活动的开展需要可靠的数据支持,也需要专门的机构负责科学数据管理工作,以实现数据的长期保存与共享。高校图书馆作为教学科研服务机构,虽然在科学数据管理方面积累了丰富的经验,但在科研数据共享上依然面临较多障碍。

2.1 数据安全存储面临挑战

如今科学数据的增长速度惊人,大量非结构化的数据给高校图书馆的管理带来难题,表现在数据筛选、过滤难度增大,数据之间的互操作性不足等。并非所有数据都需要长期存储,这就需要依靠适宜的软件进行过滤,而不同学科的数据由于独立存储,使得彼此之间的关联不足,这势必影响到科学数据的高效整合,不统一的数据存储方式,也影响到用户的检索体验。同时科学数据在长期存储过程中,还面临数据丢失、泄露等风险。高校图书馆虽然会对科学数据进行学科分类,并依据分类标准确定存储模式,但大数据环境下信息流通频繁,很难界定数据的流向与转化方式,甚至难以实现准确定位,这不仅增加了数据整合难度,也增加了数据安全管理的风险。

2.2 缺乏完善的硬件基础设施

先进的数据管理传输技术,是实现科学数据集成与共享的前提。E-Research 环境下语义网、可视化等先进技术的应用,为科学数据流通提供了便利,也成为高校图书馆科学数据管理的新工具[4]。如今很多高校图书馆建立了专业学科数据库,用于数据资源储备的高端服务器增多,科学数据存储空间不断扩大,科学数据管理效率大幅度提升[5]。然而从目前高校图书馆科学数据的组织模式来看,存在基础设施建设不到位等问题。高校图书馆在学科数据库建设方面,对不同学科资源的组织,一般采用该学科公认的管理标准。然而不同学科技术标准的差异性,影响到平台对资源的集成效率,无法保障用户对资源的集中式获取。加上无论是数据库还是云存储中心,其网络传输系统建设都需要大量资金支持,若资金不足势必影响到系统的维护和更新,进而阻碍科学数据的长效存储与共享。

2.3 科学数据服务缺乏协作性

高校图书馆的服务对象主要为科研工作者,提供科学数据服务的目的在于支持科研创新。科研用户在检索利用科学数据方面,对数据的专业性要求较高,这就对科学数据服务提出更高的要求[6]。随着E-Research运动的发展,开放存取理念深入人心,也要求进一步扩大科学数据开放范围。然而很多高校图书馆仅向本校用户开放,在科学数据服务方面存在独立性,不同机构之间缺乏协作,极大阻碍了技术交流与经验分享,也不利于科学数据的广泛共享。同时很多高校图书馆采取封闭式管理体制,并没有建立资源传输共享机制,导致不同机构之间科学数据无法顺利流通,加上受到知识产权等因素的影响,部分图书馆不愿意共享特色资源,这就很难满足E-Research 环境下的协同式科研交流需求。

3 E-Research 环境下高校图书馆科学数据共享模型的构建

高校图书馆要想顺应E-Research 发展趋势,营造开放共享的科学数据服务生态,有必要建立科学数据共享模型,对科学数据进行统一汇总,以语义描述与关联数据的方式组织管理,方便用户对科学数据进行检索、查阅与传播(如图1)。

图1 高校图书馆科学数据开放共享模型

3.1 基础数据层

高校图书馆获取科学数据的途径,主要是与科研机构或科研人员协同合作,对其科研成果进行统一整合。由于研究学科与方法的差异,用于描述科学数据的元数据标准不一,不同机构提供的数据质量也参差不齐,这极大地阻碍了科学数据的广泛传播。高校图书馆需要设置统一的元数据标准与格式,方便服务系统进行识别、分析与传输,避免数据冗余和错误发生。同时要求科研人员按照要求传输科学数据,遵循共享平台的数据规范,共同实现数据共享。为了提高科研人员提供数据的积极性,高校图书馆需要做好学术成果评价工作,综合分析科研成果的学术地位,认可科研活动的社会价值,保护科研人员的知识产权,以吸引更多人参与到科学数据共享中来。

3.2 关联分析层

面对来源各异的数据资源,高校图书馆在多方采集整理后,可以对已有科学数据进行语义转化,在赋予唯一标识基础上,促进既有数据与关联词汇集中本体的匹配,若匹配成功则进行URI 复用和实体关联化。若匹配不成功,则由专业人士介入进行处理,选择适宜的URI 命名方式实现数据关联化[7]。然后利用RDF结构模型,实现不同科学数据之间的语义关联,将大规模数据转化为具有语义特征的数据集,并通过服务系统对外发布。为了扩大科学数据传播范围,高校图书馆可以构建关联数据链接,以语义映射的方式,清晰展现不同科学数据之间复杂的关系,发现更多数据资源的相关性,进而实现大范围的数据共享。

3.3 应用共享层

高校图书馆将关联数据纳入服务系统,为用户提供可以展现科学数据之间复杂关系的服务界面,有助于用户根据需要检索、浏览、下载数据资源,并且通过与馆员互动,提出自己对共享平台的建议。科研用户之间的在线沟通交流,也可以促进科学数据的传播,他们可以相互浏览评价对方上传的资源,或者根据经验给出相关的建议,这样不仅营造了良好的学术交流氛围,也可以提高科学数据的转化率。与传统的检索方式不同,基于语义关联的科学数据检索支持SPARQL查询语言,能够实现多个数据库的数据关联,以建立网页链接的方式扩大检索范围,将具有学科相关性的数据整合起来,并反馈给用户个性化的检索结果,进而保障服务的专业性与高效性。

4 E-Research 环境下高校图书馆科学数据共享的保障机制

E-Research 环境下科学数据来源复杂,涉及主体众多,实现科学管理需要多方力量的协同合作。而建立良好的运行保障机制,从政策、技术与服务层面提供支持,是高校图书馆科学数据共享得以实现的关键。

4.1 制定分层科学数据共享政策

科学数据的生产、传播与利用,涉及科研机构、图书馆、出版社等众多主体。要想切实实现科学数据开放共享,有必要根据不同主体的特点和需求,从宏观、中观和微观层面,制定合理的科学数据共享政策。具体而言,国家可以从宏观层面制定法律法规,确定科学数据的所有权、共享方式等,为E-Research 环境下科学数据的合理利用提供指导。中观层面,由科学数据提供方设计数据共享规则,明确元数据标准和格式规范。微观层面,由科学数据管理服务机构制定,包括存储方式、提交规范、引用途径、产权保护措施等。尤其是高校图书馆作为数据存储、管理与服务主体,应该依据国家政策法规要求,做好知识产权保护工作,明确学术规范与伦理,切实保障科研用户的基本权益。

4.2 建立软硬件结合的技术体系

E-Research 环境下各种先进技术的应用,有助于高校图书馆服务系统升级,提高科学数据流通管理效率[8]。从硬件层面看,高校图书馆可以利用物联网、大数据等技术,搭建科学数据管理服务平台,为大规模科学数据的整合提供支持。同时利用云计算技术,在高效计算基础上建立系统安全认证机制,实现从数据采集、分析、管理到利用的一体化认证,避免信息丢失与泄露(如图2)。例如北京大学图书馆依托国家自然科学资金资助,建立开放研究数据平台;武汉大学图书馆成立数据管理中心,开发专门的科学数据管理加护模块,为科学数据共享提供了安全的环境。从软件层面看,高校图书馆不仅要积极开发数据管理工具,也要注重与科研组织深入合作,实施统一的数据管理标准,并且强化科学数据素养培训,引导用户更好地检索和使用各类资源。

图2 高校图书馆基于云计算的系统安全认证模型

4.3 建立多主体协同的服务体系

科学数据是在科研活动中产生的,这些数据具备从生产、存储、流通到消亡的生命周期,不同阶段的参与主体各异,对科学数据的组织管理要求也不尽相同。由于很多科研项目是由多个机构协作完成的,结果就是多个单位均存储有这些数据,如不能有效共享信息,势必导致数据资源的重复建设与浪费。高校图书馆作为科学数据服务主体,需要针对不同阶段的服务特点,有意识地开展科学数据共享宣传工作,从学科专家、校领导、学科办等入手,提高更多主体的科学数据服务意识。此外,强化与科研院所、政府部门、出版社等机构的合作,形成多主体协同的服务体系,创建统一的元数据标准格式,促进信息互通和资源互补,共同探讨适宜的科学数据共享路径。

5 结语

科学数据是实现科技创新的重要战略资源,是高校图书馆服务的新领域。随着E-Research 的深入发展,基于移动网络的协同式科研范式初步形成,改变了科研环境和方式,也要求实现更大范围内的科学数据开放共享。高校图书馆必须审视E-Research 发展态势,重视科学数据管理与共享工作,依据国家政策法规健全科学数据共享机制,以功能完备的技术平台和可靠的服务体系,让科学数据服务工作紧跟时代变化,为科研活动的开展提供更加有力的支持。

猜你喜欢

科研活动数据服务数据管理
大数据时代高校图书馆数据服务的困境及优化路径
地理空间大数据服务自然资源调查监测的方向分析
基于大数据管理的管道智慧检验系统的研发及应用
企业级BOM数据管理概要
计算机学科科研活动行为规范建议
定制化汽车制造的数据管理分析
基于数据中台的数据服务建设规范研究
CTCS-2级报文数据管理需求分析和实现
数据服务依赖图模型及自动组合方法研究
机械卓越工程师教育培养计划学科竞赛和科研活动体系建设研究