开放科学环境下高校图书馆数据资源建设调查与分析*
2023-08-08叶继元
陶 蕊,叶继元
0 引言
进入数字时代,数据成为关键的生产要素、战略资源,政府数据、公共数据、企业数据、科学数据等各领域的数据资源建设受到广泛关注。科学研究领域内,随着数据密集型科学的快速发展,科研人员对可发现、可访问、可互操作、可重用的数据需求越来越强。以开放性、共享性、社会化、可重复为主要特征的开放科学随之兴起,强调通过数字化工具和网络实施、传播并转变科学研究的方式,提供无限制、无障碍、开放获取的研究成果,推动科学研究的高效和透明[1]。开放科学运动使得科研环境发生巨大变化,科学数据开放需求不断提高,科学数据的管理与服务任务加重,数据资源的建设面临着新要求。目前我国数据资源建设仍处于起步阶段,存在资源建设不平衡不充分问题,不同主体、不同领域、不同地区的建设情况参差不齐,尚未形成良好的数据资源保障系统。因此,加快数据资源的建设步伐已成为图书馆等信息服务部门的重点任务。高校图书馆(以下简称“高校馆”)作为数据资源的收藏方、主要供需方和开放科学的重要参与者,加强数据资源建设将成为开放科学运动和文献信息资源保障体系的关键一环。
数据一词有广泛的内涵和外延,其含义可概括为数字、字母与符号的集合,系客观事物与主观思维的具体表达,现常用来指可以由计算机处理的信息单元[2]2,此为广义数据。从外延看,数据包括数值、字母、图表、图像等多种形式;从类型看,有科学数据、政府数据、空间数据等丰富内容。而具体到与开放科学运动和高校馆建设密切相关的数据,则专指狭义的数据,即与知识生产相关的数据,主要是科学数据以及部分应用于科学研究和教学工作的公共数据、政府数据等。本文的研究对象主要是狭义上的数据。
中外学者已开展相关研究,内容主要为高校馆在开放科学环境下的科学数据管理与服务以及开放数据的建设。Tzanova指出,高校馆提供的信息服务与高校的教育和科研需求密切相关;开放科学环境下,高校馆应积极了解开放科学内容,掌握新的研究和教育需求,通过开发科学数据管理模型、制定数据管理计划、提高馆员的数据素养等方式应对挑战[3]。张俊等指出,开放科学环境下,科学数据管理是高校馆实现自身价值的重要途径,高校馆需从科学数据管理过程、共享政策、共享途径、管理规范等方面加强建设[4]。部分学者则结合具体实践开展论述:周力虹等调查我国高校馆的科学数据管理服务现状,发现科学数据管理存在计划服务缺乏、服务方式单一以及馆员提供的帮助有限等问题,建议关注用户需求特点,针对性地开展科学数据管理与服务[5];Agnieszka 等调查波兰医学类高校研究人员对科学数据的需求和态度,发现多数人员对科学数据的需求较大,但缺乏科学数据的管理、开放数据等知识[6];Ahmed等指出,马来西亚高校馆在开放科学的推进和开放科学数据的建设中存在思想意识不足、专门机构和人员缺乏以及政策不完备等问题[7]。此外,数据平台的开发作为科学数据管理服务的重要组成部分,也成为学者们的讨论对象。李洋等调查我国代表性高校馆的科学数据平台建设现状,提出高校馆在科学数据的开发过程中应加强政策规划,充分收集本校的科学数据,开展合作建设等方法策略[8]。总体看,已有成果集中在高校馆的科学数据管理与服务这一环节,研究范围比较固定且局限,对数据资源前期建设这一基础性环节关注较少,对各种类型的数据资源建设情况研究不足。研究基础性的数据资源建设,有利于后期数据管理、服务与利用等环节的顺利开展;而对数据资源建设的探讨,也有助于完善整个高校馆文献信息资源建设与保障体系。基于此,本文在新的开放科学环境下,重点研究高校馆这一信息机构的数据资源建设情况:调查中外部分高校馆数据资源建设现状,总结经验与不足;分析开放科学环境下高校馆开展数据资源建设面临的新形势;探讨开放科学环境下我国高校馆开展数据资源建设的策略。
1 国内高校馆数据资源建设调查
1.1 建设现状
国内的调查初步选取42所“双一流”高校的图书馆。样本的选取主要考虑两方面因素,一是“双一流”高校的教学科研发展对数据资源的需求较高,同时,“双一流”高校馆的人力物力对于数据资源建设的支持更强,数据资源建设的环境更好;二是通过前期的文献和网站调研发现,国内高校馆开展数据资源建设的总体水平不高,但“双一流”高校的图书馆资源建设相对较好。由于北京航空航天大学图书馆、电子科技大学图书馆等5所高校馆的网站无法打开,为此本文最终以其余37所图书馆作为调查对象,调研时间为2022年3月10-30日。通过网站调查并辅以文献调研,了解其数据资源建设的总体情况,并从资源的范围、类型、内容等方面做具体分析。
总体上,37所国内高校馆的数据资源建设普遍存在资源覆盖范围小、数量少、类型单一、内容不丰富、开放程度低等问题。如表1所示,在资源类型方面,依据资源来源渠道,已建设的数据资源主要有3种类型:购买的数据型数据库、网络开放数据资源和自建数据资源。其中,购买的数据型数据库是大多数高校馆的主体资源,但这类数据库并非只提供科学数据、公共数据等,还包含了研究报告、政策法规、案例等资源,其实质是以数据为主,涵盖多种资源的全文数据库,如中经网、国研网等。网络开放数据资源占比较小,主要是政府和部分公共机构、研究机构提供的开放数据,多以数据库或数据平台的形式呈现,如国家统计局数据、联合国统计数据、国家科技图书文献中心(NSTL)的开放科学数据等。自建的数据资源则聚焦于科学数据,仅有少数高校馆开展建设,如北京大学开放研究数据平台、复旦大学社会科学数据平台等;部分高校的院系也自建了数据平台,通过图书馆的资源列表提供获取服务,如湖南大学的校经济数据研究中心数据库。在语种方面,大多数高校馆的数据资源以中文为主,外文主要为英文。在学科方面,社会科学数据是大部分高校馆的主体资源,其中,金融、财经类的数据又占多数。自然科学和综合学科的数据资源较少,仅有北京大学图书馆、上海交通大学图书馆、华中科技大学图书馆、西北农林科技大学图书馆4所高校馆的自然科学数据数量高于社会科学。
表1 国内部分高校馆数据资源建设统计(单位:种)
近年“开放”和“数据”已成为科学发展的两大方向,数据的开放有利于加强学术交流,提高科学生产力,这一发展趋势进一步刺激了数据资源的开放需求。具体来说,调研中的高校馆建设开放共享数据资源主要有两种方式,一是提供网络开放数据的获取途径,二是自建开放科学数据平台。其中,网络开放数据在各高校馆之间的建设程度不一。统计网络开放数据占各图书馆全部数据资源的比重(见图1)可知,网络开放数据并非多数高校馆的主体资源。网络开放数据占比小于10%的高校馆有17 家,11%~30%的有14家;而高于30%的只有6家,如中国农业大学图书馆、四川大学图书馆等,当中北京大学图书馆提供的网络开放数据最为丰富,占比大于90%。同时,多数高校馆提供的网络开放数据以公共数据、政府数据为主,如国家统计局数据,对研究机构、数据中心开放的科学数据建设力度偏小。在自建开放科学数据平台方面,37所高校馆中仅有北京大学图书馆、复旦大学图书馆、武汉大学图书馆搭建了开放科学数据平台,而武汉大学的科研数据管理平台因管理运行原因暂无法使用。北京大学开放研究数据平台和复旦大学社会科学数据平台的基本情况如表2 所示。通过调查可知,经过几年的建设,北京大学和复旦大学在自建开放科学数据平台的实践上已取得一定的成效。具体来说,一是数据内容类型丰富,两平台均定位于科学数据,数据量达到一定规模,保存管理多个学科的资源内容,数据类型涵盖了文档、数据文件、问卷、图片、软件或代码等多种形式;二是资源组织有序,平台的资源按照“数据空间-数据集-文件”三级结构组织,通过丰富的元数据进行资源描述,同时按照学科、机构、关键词等进行分类;三是数据开放初具成效,两平台都鼓励数据提交者共享数据,同时北京大学开放研究数据平台还向中外学者或研究单位征集数据,整理加工后开放共享。但两平台的建设也存在一些不足,一是技术自主性较低,均在国外平台的框架基础上二次开发完成,基础设施和核心技术受制于人;二是数据更新不及时,以复旦大学社会科学数据平台为例,其数据发布时间集中在2020年及以前,近两年新上传的数据量很少。
图1 国内部分高校馆网络开放数据建设统计
表2 北京大学开放研究数据平台和复旦大学社会科学数据平台资源建设情况
1.2 不足
(1)数据资源建设方向不明晰。高校馆的数据资源建设应有明确的方向,以本校的教学科研需求为中心,同时考虑国家的重大科技战略、创新发展等实际需要。而本调研中,大多数高校馆的数据资源建设以社会科学为主,其中又以财经、金融类居多,自然科学数据少。这一建设现状与部分高校的优势学科发展不完全匹配,同时也不能很好地满足科技创新的需求。
(2)资源类型单一、内容不丰富。国内高校馆的数据资源以购买的数据型数据库为主,网络开放数据的建设程度参差不齐,自建数据资源发展不足。此外,资源内容单薄,已建设的资源多为统计数据,对于其他类型的数据,尤其是科学数据建设不足,对基础学科、新兴战略等领域的数据资源保障不够。
(3)开放数据的建设力度不大。首先,37所高校馆在整合其他机构的开放数据方面程度不一。例如,北京大学图书馆提供了300余种网络开放数据的获取途径,但有10家图书馆却未将网络开放数据纳入资源列表中。这一建设现状与网络开放数据的发展实情有较大差距。部分政府部门、研究机构、数据中心等已不同程度地推进开放数据项目,高校馆作为中介性的信息机构,应当在高质量网络开放数据的扩散、传播中发挥中介作用,在用户和数据资源之间搭建桥梁,通过提供满足本校教学科研需求的网络开放数据来扩展图书馆的数据资源。其次,在自建开放科学数据方面,北京大学开放研究数据平台和复旦大学社会科学数据平台均取得较好的成效,但在数据开放的全周期性上仍有不足,其他图书馆在自建开放科学数据方面则鲜有可供利用的成果。
2 国外高校馆数据资源建设经验
本文重点选取斯坦福大学、芝加哥大学、牛津大学等7所国外高校馆开展调研,样本主要通过初期的文献和网络调研来获取,调研时间为2022年3月20日-4月15日。这些国外高校馆的数据资源建设情况良好且各有特色,有一定的借鉴意义。梳理调查内容可知,各馆数据资源数量众多,内容形式多样,组织管理有序,开放保护并行。
(1)数据资源的内容形式多样。7所国外高校馆的数据资源均已形成较大规模,数据资源有3种主要类型。一是数据型数据库。此类资源多列举在数据库资源这一门类下,通过数据库资源的分类以方便获取。例如,斯坦福大学图书馆将数据资源分为统计数据(Statistics)、数据集(Data sets)、人口普查数据(Census data)等,在这些门类下又包含了各种内容的数据库,如商业数据库、公共数据平台等[9]。二是机构知识库。机构知识库是一个以本机构成员在工作过程中创建的各种数字化产品为内容的数据库和服务系统[2]94,机构成员所生产的科学数据也是其重要的资源。国外部分高校馆通过加强机构数据库的资源建设来保存、利用本校的科学数据。例如,芝加哥大学图书馆的机构知识库(Knowledge@UChicago)支持本校成员上传数字格式、完整、可使用的数据集,数据内容可以是学术性的、创新性的和教学科研相关的等等,并且允许在尊重版权和数据安全的前提下开放共享[10]。三是数据存储库。部分图书馆搭建专门的数据存储库来保存数据资源。例如,芝加哥大学图书馆为查找和共享数据而建立了专门的学科数据存储库(Data Repositories),对多渠道多学科的数据资源分类汇总,既有国际组织的开放数据和调查报告,也有所在国家、州的人口普查、选举、财政、刑事司法、环境、交通等政府数据和公共数据,学科多样、知识面广,很好地扩展了该校的数据资源[11]。哈佛大学的数据存储库(Harvard Dataverse)则不局限于收藏本机构的科学数据,校内外的研究人员、期刊、机构都可以在此平台上保存、管理、分享科学数据,不仅便利了其他人员、机构的数据管理,也极大丰富了其数据资源[12]。国外高校馆的数据资源内容丰富,既有诸如实验数据、观测记录等科学数据,也有地方司法、财政、人口等政府数据、公共数据,部分图书馆还提供空间数据(Spatial Data),覆盖从地球空间数据到图书馆空间数据等资源;学科全面,既有社会科学、人文学科类数据,又有大量的自然科学数据;空间范围广,既有本校拥有的科学数据,又囊括所在州、国家以及全球的可获取数据;资源语种以英语为主,同时兼有中文、德文、法文等其他语种数据。
(2)数据资源组织管理有序。数据资源的长期保存和有效利用,离不开有序的组织管理。元数据建设、数据分类、数据备份、文件格式控制等内容,是国外高校馆数据组织与管理的重点。在元数据方面,国外高校馆通过制定相应的元数据方案来描述及组织数据资源。例如,哈佛大学图书馆采用PREMIS保存元数据,并结合元数据封装标准METS,制定元数据实施方案,同时在PREMIS实体类型的基础上开发自有数据模型,作为整个服务技术体系的运行基础[13]。麻省理工学院的科学数据管理平台也从描述元数据、管理元数据和结构元数据三方面设计元数据方案[14]。另外,部分高校的机构知识库或数据存储库支持用户自行上传数据,与此相适应,图书馆也为用户创建与管理元数据提供指导。康奈尔大学图书馆提出,当既有的元数据标准不能很好地描述数据时,用户可以根据相关指南,编写符合要求的“自述”型元数据文档[15]。在数据分类方面,国外高校馆主要有形式分类和内容分类两种方式。对于形式分类,多数图书馆按字顺排列数据资源,而国别地区分类也是常用的方式,部分机构知识库还按本校的学院部门分类数据。内容分类上,学科、主题分类是国外图书馆常用的分类方法。芝加哥大学图书馆针对政府数据还按行政部门类别进行划分[10],牛津大学博德利图书馆将全部数据划分为定量数据(Quantitative data)、定性数据(Qualitative data)、 地理空间数据(Geospatial data)和元数据(Metadata)4 种类型[16],普渡大学的机构知识库则允许用户通过添加标签来自行分类数据。总之,多数图书馆并非采用单一分类法,而是将多种分类方式结合使用。在数据备份方面,为保证数据的完整度和安全性,康奈尔大学图书馆提出了数据备份的“三原则”,即建议至少保留3份数据副本:保存在数据创建本地的原始副本,保存在不同载体介质上的其他副本,以及保存在不同地理位置的远程副本。考虑到数据备份的成本问题,康奈尔大学图书馆允许备份部分数据,如备份全部数据中最有价值的、易受安全威胁的部分,或者只备份更新的数据内容[15]。此外,为更好地保存和利用数据,部分图书馆提供文件格式的选择建议。例如,斯坦福大学图书馆提出,在选择存档的文件格式时,理想的格式应该是非专有的、非加密的、非压缩的、研究人员普遍使用的、可兼容和互操作的,等等[9]。
(3)数据资源的开放与保护并行。近年来,欧美发达国家大力推进开放科学,高校馆在开放数据的建设上重点发力,并将开放数据作为馆藏数据资源的重要组成部分。国外高校馆建设的开放数据主要由两部分组成,一是其他单位的开放数据,如政府开放数据、研究机构的开放数据等;二是自建的开放数据,主要以机构知识库或数据存储库的形式建设,内容是本校本机构的科学数据。各高校馆针对自有科学数据的开放范围、开放程度做了不同的规定。芝加哥大学图书馆的机构知识库定位为开放的知识库,建议知识库中的数据尽可能开放,但允许设置访问权限,如仅在校内公开;同时,芝加哥大学图书馆还鼓励研究人员通过多种途径共享数据,如发布在数据期刊、研究网站、博客等其他渠道上[10]。斯坦福大学的机构知识库支持全球开放(World-access)和校内开放(Stanford-only),并针对不同的开放情况,提供了不同层次的协议来规范开放数据建设[9]。由于数据资源自身的特殊性以及数据开放的风险性,数据安全问题更加突出,国外高校馆通过多种途径来维护数据安全。例如,斯坦福大学图书馆通过数据分级政策来划分开放和保护的界限,将所有数据划分为3 类风险级别:低风险、中风险和高风险。低风险级别是指数据的损坏不会对机构的安全、声誉、财务等产生不利影响,这一级别的数据可用于开放获取;而中高风险级别的数据则出于法律规定、安全保护等原因不对公众开放[9]。此外,部分图书馆还通过制定数据安全政策、版权规定,提供数据安全存储设施,加强数据使用许可等方式保障数据安全。
综上可知,国外部分高校馆的数据资源建设情况良好。调研中的图书馆依据科学发展方向和本校学科建设等目标,系统制定数据资源建设规划,针对性地布局数据资源,初步形成了类型多样、内容丰富、覆盖广泛的数据资源保障体系。在提高资源数量的同时,注重数据质量的提升,从数据的采集、组织管理、检索利用到更新维护,实行全流程的质量监管。发展水平较高的图书馆还重点推进科学数据的管理与服务,鼓励科学数据开放,积极融入开放科学的建设。
3 开放科学下的高校馆数据资源建设形势
开放科学环境下,数据资源的内容与形式、供给与需求、管理与服务等都发生了深刻变化。高校馆的数据资源建设面临着新形势,机遇与挑战并存。
(1)数据质量的高要求。在数据建设过程中,数据质量是影响建设效果的关键因素。良好的数据质量可以提升数据价值,有助于整个数据资源系统长期安全地运行,质量差的数据则有可能让整个系统面临风险。数据质量是指数据的正确性、适时性、精确性、完备性、相关性及可访问性,用以评估数据的适用性[17]。数据质量属性众多,不同领域的数据属性也有所差别。高校馆的数据资源以科学数据为主,高校的科学数据具有多元性、跨部门性、价值密度低的特点,存在数据冗余、不完整、不准确、不一致等质量问题[18],而开放科学的发展对数据资源的兼容性、互操作性等提出更多更高的要求。当前,国内高校馆已建的数据资源和开放科学数据管理平台在数据完整性、可用性、开放性、及时性以及平台功能等方面都有待提高,而高质量的数据建设也需要大量的人力、物力支持。因此,高校馆的数据资源质量建设面临多方面的挑战,应选择合适的质量维度,采用多种方法提高数据质量。
(2)竞争对手对数据资源建设阵地的冲击。当前,数据的获取渠道日益多元化,出现了一些新兴的数据提供者。诸如阿里、腾讯、百度等互联网企业依托自身渠道积累了大量数据资源;第三方数据服务机构也提供大量行业、市场或综合性的数据;传统的数据拥有者,如政府、公共服务机构、研究中心、数据库商等近年来也逐渐在数据资源建设与服务方面持续发力。部分领域的数据商业化、集中化趋势日渐明显。在此环境下,图书馆作为传统的信息提供者,在数据资源供给与服务方面受到了竞争对手的强烈冲击。图书馆自身数据资源建设不足,数据服务匮乏,不能很好地满足用户的数据需求,在数据服务领域中面临边缘化的风险。高校内各部门为科学数据的生产大户,高校馆却未能充分利用其资源优势、有效地提供科学数据服务,造成科学数据资源的浪费。由此,如何在科学数据的建设方面确立自己的独特优势、提升竞争力,维护其信息中心的地位是高校馆面临的重要问题。
(3)缺乏友好的科学数据开放氛围。开放科学环境下,高校馆的数据资源建设重点之一就是开放科学数据,而高校馆在开放科学数据的建设过程中面临诸多障碍,其中一个主要障碍就是开放科学数据建设的氛围不够友好。总体上,国内虽已有部分学者和机构开始研究并建设开放科学数据,但并未形成完整的研究体系与实践系统,缺乏对开放科学数据的系统性顶层规划,全社会未能有效联动,开放的理念并未贯穿资源建设的全周期,开放科学数据的建设仍处于起步阶段。具体到高校馆的开放科学数据建设,高校的科研人员作为科学数据的主要供给者和需求者,处在高涨的数据需求和保守的数据开放这一矛盾态度之中,即一方面对其他主体提供的科学数据有着强烈的需求,另一方面对开放共享自己拥有的科学数据有所顾虑。其不愿开放自有数据的原因,主要有以下几点:出于保护隐私、保护未完成的研究内容、避免抢先发表等目的,不愿主动开放科学数据;对已上传和开放的科学数据的知识产权保护不完备,科学数据的知识产权易受侵犯;学术评价制度不太认同科学数据的贡献,当前图书、期刊论文、专利、研究报告等科研产出的价值均已被社会所公认,但对研究过程中产出的科学数据的贡献作用并没有明确,阻碍了研究人员开放其科学数据。此外,高校馆在建设开放科学数据时,也面临着数据开放与安全的问题,这些都影响了科学数据的开放环境。
4 开放科学下的高校馆数据资源建设策略
4.1 建设方向:支持国家发展战略与学校教学科研发展
当前,我国正处于创新驱动发展、建设科技强国的关键时期,数据资源的建设水平与服务能力对于我国科技高质量发展、提高国际竞争力至关重要。高校馆在科学数据方面拥有得天独厚的优势,在数据建设过程中,要面向国家战略需求,找准自身定位,积极融入国家数据资源保障体系中,在科学数据的建设与保障中发挥作用。“十四五”规划强调,要“发展壮大战略性新兴产业”,“加强信息科学与生命科学、材料等基础学科的交叉创新”[19]等。为此,高校馆的科学数据建设既要保障新兴领域、跨学科领域、基础学科领域的数据供应,参与重点科研领域数据资源管理与服务平台的建设,又要注重科学研究、实践应用和经济发展需求的有机融合,向企业开放科学数据,提高数据资源在产学研结合中的支撑作用。同时,应增强人文学科、社会科学领域的科学数据建设力度,为数字人文的开展、哲学社会科学领域的研究创新提供丰富的数据内容与充足的数据工具,以数据资源的高效建设推动中国特色哲学社会科学学科体系的构建。
高校馆数据资源的建设还应着眼于学校自身的需求,有的放矢地布局数据资源。首先,把握学校的学科建设与发展目标,有重点地规划数据资源的建设内容,形成具有本馆特色的数据资源。其次,充分了解用户的需求和资源利用方式,提供能满足用户教学科研需求、使用便利的数据,避免盲目增加资源数量导致资源利用率低等问题。再次,高校馆在馆藏资源建设中面临着经费、人才、资源结构等各方面的压力,对数据资源的建设提出了挑战。在开放科学环境下,高校馆可以通过资源的共建共享、整合推送其他主体建设的开放数据等方式来补充自己的数据资源,提高数据资源的保障能力。
4.2 建设内容:构建合理的数据资源保障体系
构建多元融合、组织有序、安全开放的数据资源保障体系,是开放科学环境下高校馆数据资源建设的必然要求。高校馆要充分发挥中介性的基础作用,融合各方数据资源,如整合中外研究机构的科学数据、收藏与教学科研任务相关的政府数据和公共数据、筛选数据库商和第三方数据平台的数据,充实本馆的数据资源馆藏,节约用户的数据获取成本。在已建成的数据资源的基础上,重点开发本校拥有的科学数据,打造本馆特色化的科学数据馆藏。
对数据进行有效的组织与管理,这是高质量数据与数据资源保障体系建设的基础。高校馆要重点建设数据资源的元数据,在吸收图书馆已有元数据的基础上,借鉴社会中的元数据应用,分析数据的保存管理环境、资源特性等,有针对性地构建适合高校馆数据资源的元数据体系。面对数据动态变化、格式多样等带来的数据管理和利用的不便,高校馆应采取必要的控制手段。例如,明确数据保存所允许的文件格式,为图表、数据集、统计报告等不同的数据类型分配不同的文件格式,但不论何种格式都应符合普遍性、规范性、兼容性、互操作性等要求。对上传的数据进行版本控制,明确已上传的数据版本在内容、格式等方面的完整性,同时允许数据的动态更新,并通过编写元数据等方法进行版本更新说明。此外,还应积极建立数据的长期保存机制、数据管理与利用的反馈机制等,以提高资源建设的有效性。
努力建造既开放又安全的数据资源保障体系。开放数据的建设,一方面要广泛集合各方开放数据,完善资源结构;另一方面应有序开放自有的科学数据,如向企业开放科学数据,助推企业提高生产力与创新发展,或向其他高校、科研机构开放科学数据,实现数据资源的开放共享,推动科技创新。在开放的同时,高校馆还需实施安全保护措施,保障数据安全,提高数据资源系统抵御风险的能力。例如,加强图书馆馆员和用户的数据安全教育,提高管理人员和用户的数据安全意识;建立数据分类分级制度,依据风险类别对数据进行等级划分,并对不同风险等级的数据实行不同的开放策略,借此实现数据安全的分级管理;加强数据安全相关的技术开发和基础设施建设,为数据的采集、组织管理、存储与传播利用提供安全的工作流程和工具等。
4.3 建设重点:营造友好的数据资源建设环境
高校馆的数据资源建设是一个基础性、持续性的过程,是推动科技进步的重要环节。因此,需要营造良好的环境来推动高校馆数据资源的建设与发展。具体可以从以下几方面展开。一是构建全方位的数据发展规划。数据资源的建设离不开政策规划的指导,良好的政策环境可以促进数据资源的发展。为此,应积极搭建横向上覆盖各领域、各环节,纵向上贯通各层级、各主体的数据发展战略。高校馆也需制定符合自身特点的数据资源发展策略,并针对重要的环节制定更为具体的行动指南,如数据安全保护指南、元数据使用指南等,指导具体工作的开展。二是保护数据的知识产权。高校馆在建设数据资源的过程中,要遵守知识产权相关的法律法规,不仅要尊重其他主体建设的数据的知识产权,也要合理界定并保护本机构成员生产的数据资源的知识产权,明确相关主体的权限范围,加强对开放数据知识产权的保护力度,创建安全有序的数据环境。三是制定标准规范。目前我国在数据方面的标准规范尚未形成完整统一的体系,数据建设在一定程度上混乱无序。高校馆作为数据资源的建设者,应积极推动并参与相关标准规范的制定,在标准规范的推行中贡献图书馆的力量,推动规范化的数据资源建设。四是认可科学数据的价值,建立开放科学数据制度。高校馆在科学数据,尤其是开放科学数据的建设中,要努力推动学术评价制度对科学数据地位的认可;同时,考虑将科学数据的开放以制度的形式固定下来,通过制度要求来提高数据开放的执行力。例如,高校的科学数据管理平台或机构知识库可以要求研究人员在项目结项后,上传相关的科学数据并酌情开放,以此来加快开放科学数据的建设。
总的来说,加强数据资源建设是开放科学及社会发展的一大趋势,高校馆应认识到数据,尤其是科学数据,在科学生产和社会发展中的作用,加快推进数据资源的建设。同时,也应时刻保持清醒头脑,理清各类文献信息资源的地位与关系,不能一味盲目地追求数据资源而忽视了原有的资源,要结合自身的实际需求,构建结构合理的文献信息资源保障体系。