APP下载

开放数据与数字图书馆转型

2019-02-19金钰

实事求是 2019年6期
关键词:图书馆资源用户

金钰

(中共新疆区委党校 图书馆 新疆 乌鲁木齐 830002)

在“数据革命”时代,数据作为一种新的基础设施,已经成为国家战略性、基础性资源,是日常生活中不可或缺的一部分。从开放获取到开放数据,以知识共享为特征的数据开放运动不断向纵深发展,越来越多的政府、机构、公众参与到开放数据中。大量开放数据被释放、传播,为图书馆转型发展,开展知识创新服务提供了坚实的数据资源支持。

一、开放数据建设对图书馆工作产生的影响

(一)开放数据发展概况

数据开放共享是国家大数据战略的第一步,核心在于数据的开放和利用。推进数据开放,鼓励社会力量进行增值开发利用得到包括图书馆界在内的各种社会力量的积极响应。开放数据最早由欧盟在2007年提出。2015年《开放数据宪章》将数据开放定义为:具备必要的技术和法律特征,从而能被任何人、在任何时间和地点进行自由利用、再利用和分发的电子数据,具有机器可读性(机器可读格式)、开放授权性(自由免费使用)、不受限制性(对任何人都开放)等特点,旨在加强原始数据的创新和培育,增强政务透明度,以便更好地带动数字经济高质量发展。近年来,数据开放已在全球范围内迅速推进,欧美发达国家目前居于领先地位。我国数据开放总体处于起步阶段,从认识到实践还有待提升和改善。2017年中央全面深化改革领导小组通过的《关于推进公共信息资源开放的若干意见》,将推进公共信息资源开放,强化信息资源深度整合,作为党中央国务院部署的重要改革任务。

(二)数字图书馆参与数据开放的优势

1.图书馆是传统的信息资源采集与存储机构,具有丰富的数据采集和创建经验。资源建设是图书馆承担各种职能的基础,积极开发、广泛利用资源是图书馆的重要职能之一。开放数据涉及社会各个部门与行业,图书馆作为与数据、信息、知识紧密相关的公共服务机构,是推动数据开放的中坚力量。同时开放数据资源是图书馆加强与社会联结的重要机遇,也是图书馆数据智能化改造、信息组织转型与发展的必由之路。

2.图书馆在数据管理方面具有专业技术优势。在数据资源方面,图书馆丰富的馆藏文献信息资源是开展数据研究服务的物质基础;在人力资源方面,专业图书馆员善于收集、加工、整理各类资源,提供参考咨询和扩展服务;在管理方面,图书馆拥有先进的信息技术,科学成熟的流程和规章制度,保障用户方便、快捷地获取、使用数据信息。

3.图书馆在发展读者和读者教育方面具有丰富的经验。图书馆是数据与用户之间的桥梁,是信息生产者与信息利用者之间的传递者。图书馆根据用户构成、用户信息行为分析用户对于数据的需求,将其反馈给数据供给侧,并帮助其制定开放数据目录,推动用户急需数据的开放进程;图书馆员通过分析用户信息服务的需求、阅读模式选择、用户阅读反馈等阅读数据进行分析,及时调整和改善用户服务策略,提高采集开放数据的准确性、及时性;馆员对数据和情报资料进行深度加工,提供个性化、深层次的“定制服务”,提高用户使用开放数据的良好体验;此外,图书馆还为用户提供获取和利用海量数据信息的软、硬件设备和专业技能,提升用户获取和利用开放数据的能力。

二、图书馆参与开放数据建设的几个问题

(一)开放数据创建与采集

将开放数据纳入图书馆资源建设规划。从标准数据创建、数据组织与数据发布平台构建、数据素养教育等方面全面变革图书馆资源建设范式。用户对于开放数据的期望是电子的、可机读格式的数据,以便于进行决策和分析。图书馆作为数据提供方和用户之间的桥梁,要同时关注两方,以及两者之间的互动,不仅要推动数据开放,更要侧重于推动数据的有效利用和经济、社会价值创造。

在开放数据创建与采集阶段,图书馆要对数据进行属性、特征、质量等识别、鉴定、筛选、重组、分析提炼、评价综述等处理,对数据资源进行加工整理,制定数据目录。明确各级各类数据的开放级别,持续更新,形成有序、源源不断的信息流,进行更广泛的交流与传递,为用户提供合作的潜能。在此过程中图书馆可能面临法律框架、政策和原则不健全、数据准备不足以支撑开放、数据管理架构不完善、数据采集和录入缺乏标准、身份管理和隐私以及网络安全等诸多需要解决的问题。

2018年1月,中央网信办等部委联合印发《公共信息资源开放试点工作方案》要求试点地区“研究制定公共信息资源开放技术规范,明确开放数据的完整性、机器可读性、格式通用性等要求”。图书馆数据采集必须符合国家法规、政策。在不涉及国家秘密、商业秘密、个人隐私的前提下,把数据开放给社会进行融合利用;图书馆发布的数据必须有完整的元数据,机器可读,向所有人开放;开发开放数据产品时要多方协作,通过制定以知识开放共享理论为基础的许可协议,规范开放数据的使用,最大化地对数据进行多元应用,最大限度发挥知识的价值潜能。

(二)制定符合开放数据原则的元数据标准

元数据是支持开放数据所需的基础架构的基本组成部分,帮助用户了解数据集的内容和背景,从而快速、有效地获取和利用数据。我国目前尚未形成开放数据的标准体系,没有统一的元数据标准,开放数据规范程度低,不同数据开放平台的元数据标准存在差异,著录的元素各不相同。元数据标准不统一直接影响到图书馆数据资源管理工作。图书馆在元数据标准与规范方面做出过诸多探索,在将现有的专业模型和知识扩展到开放数据标准方面具有专业优势,可以积极与相关部门沟通,参与协助制定开放数据格式和标准,制定更符合开放数据原则和需求的元数据方案,确保不同来源的数据资源具有完整性、准确性、有效性、时效性和可用性,能被统一存储、获取和利用。同时在数据开放的各阶段充分考虑数据开放的利益相关者,加强沟通,对数据发布者和利用者提供更有针对性的反馈,推动我国数据开放的标准化发展。

(三)数据资源整合发布平台建设

开放数据平台是数据的载体,是展示应用的中心,也是连接开放数据供给侧和用户的桥梁。数据平台的管理、运行和维护是一项持续性和常态化的工作。合理、规范地组织数据,持续更新和添加数据集是数据在开放平台上发布、提高可获取性、可利用性的重要前提。开放数据平台应以醒目的方式展示数据统计、数据动态、提供数据开放最新资讯并进行可视化呈现,为用户提供科学的分类导航、跨库检索、统计分析、相关数据推荐、平台链接等应用功能。由于数据广泛分布在多个机构或者平台,普通用户从分散、繁杂的数据海洋中获取数据很困难,加上有些平台分类导航缺乏用户视角,搜索功能不够精确完整,排序方法简单初级,数据无相关链接,平台之间缺乏互联互通等,如何在管理、保存开放数据过程中完成纸本资源、电子资源、数字资源的一体化资源整合、数据检索及知识服务等任务,是对图书馆专业数据管理能力和数据管理经验的考验。

三、协同促进数据开放与图书馆转型发展

开放数据环境能够改变数据交流速度和模式,图书馆在发展理念、功能定位、资源建设、用户服务、技术应用等方面必须同时创新调整、转变范式。

(一)图书馆理念与数据开放理念的融合

数据开放的核心目标是开放数据给社会,供其进行增值开发和协作创新。作为一个新生事物,数据开放的概念对于大多数人来说仍比较陌生,缺乏基本的概念普及和培训,更不清楚其具体目标和要求。政府借助开放数据,解决社会发展问题,提升了政府决策、治理和服务能力。比如大数据精准帮扶、智慧城市等应用,提升了社会治理智能化、智慧化水平;企业借助开放数据获得竞争优势和驱动创新的核心资源,为企业确定新的发展方向,提高创新能力,实现了企业的转型与创新发展;民用方面,开放数据运动的发展与我国“大众创业,万众创新”的号召相呼应,提供资源、工具和专业帮助等方面的创新创业资源支持,为实现公民创新创业注入了新活力。开放数据的意义不仅在于知识的开放和共享,更重要的是它能改变知识交流生态,刺激商业发展,催化社会创新,从而推动经济社会发展。

开放数据能带来的巨大经济和社会价值,一方面来自于市场因数据开放透明而节省的成本开支;另一方面通过结合开放数据,一些传统行业改革创新,新的应用服务得以实现。面对新时代、新要求,图书馆改革创新发展理念是大势所趋。图书馆通过政府政策指导、学界理论支撑、经典案例分享等,可以打造一个良好的数据宣传交流与应用推广平台。通过数据开放工作推动打造全社会尊重数据、保护数据、善用数据的文化氛围,紧密图书馆与用户、与社会的关系。从目前的发展情况来看,图书馆对开放数据的概念、价值、风险等认识还不到位,主动参与意识较薄弱,需要找准参与开放数据开发的切入点,与政府信息服务、民生公共服务、科研服务等业务流程协同,加强开放数据资源建设,促进开放数据进程,提高开放数据的利用率。

(二)推动开放数据相关政策、法规制定

政府部门是开放数据最大的拥有者,我国信息数据资源80%以上掌握在各级政府部门中。数据开放需要在保障安全的前提下推进。然而面对数据安全、数据质量、数据滥用等风险,数据开放相关的法律政策体系尚不完备。国家和地方层面都缺少明确的、清晰的、具有可操作性的法规政策和标准来指导实际工作的开展。图书馆应当是知识权益的规范者,在开放数据相关政策研究、出台上,提供参考咨询意见。探索制定数据权益保护、数据利用、数据安全与管理等立法,引导和规范数据开放和利用;加强数据开放风险管理,数据法规制度建设要和技术手段保持同步,确保国家安全、商业秘密和个人合法权益不受损害的红线;同时用法律法规保障图书馆权利,保障图书馆规范化发展和开放数据服务。在法规层面解决可能引发开放开发中的风险和争议,避免数据拥有方为规避风险从而退回到数据垄断,让数据开放发展步入法制轨道。

(三)加强数据整合集中管理

开放数据信息往往是海量且参次不齐的。真正符合数据开放公认标准的数据集偏少,数据更新力度不足。开放数据以及出版物等单独保存语言系统中,读者获取同一主题的资源要通过不同信息资源系统查询,极其不便,也容易造成漏检,数据搜索和获取体验还有很大上升空间。从原始信息、提取数据、编制目录,分类组织到存储和管理,图书馆数据组织和存储的基本目标是提高信息利用率,选择合适的存取方法提高检索效率。图书馆的每一步数据处理就是让数据信息的质量逐步提升,提供达到符合完整性、原始性、可机读性、非专属性、以接口形式提供等开放数据标准的数据集。

目前我国大力支持科技创新和数据共享,图书馆利用多种专业技术、信息资源、平台系统、馆员服务等发挥图书馆整体优势,进行析取、集成、创新,挖掘出其中的知识内容和语义关联,整合管理数据资源和图书馆传统资源共享和再利用。图书馆的信息服务将比传统服务更具有系统性,数据信息管理更趋科学化,读者服务管理更趋集约化,读者将拥有更好的图书馆知识传播平台。

(四)提供数据素养教育

促进数据开放的数据素养教育首先是图书馆员的自身继续教育。作为专业图书馆员在数据管理和服务中具有不可或缺的作用。用户看到的数据产品的内容只是呈现出来的表象,以不同形式,如图文、视频、音频等方式展现出来,在数据产品背后,是图书馆员通过一系列的业务工作把内容制作出来,形成数据产品,提供给用户使用。在开放数据服务的不同阶段,图书馆员依靠专业知识和技能,在策划过程中完成数据管理工作;在描述研究成果中,馆员帮助识别和甄选元数据;在保存成果时,帮助用户鉴别和选择合适的数据知识库;在科研成果资源整合过程中,实现数据检索等。图书馆员把内容生产者和内容需求者联系起来,更专业地为双方提供所需,完成数据的管理保存以及知识服务等工作,实现了数据的充分利用。因此,开放数据相关能力应纳入图书情报工作人员的业务培训体系,包括开放数据理念与图书馆范式变革、开放数据相关政策法规、数据素养教育、大数据环境下图书馆业务流程转型以及开放资源的再开发服务等,与时俱进地拓展图书馆服务新领域,培养基于知识服务的“全能型”馆员,以适应数据创建、访问及使用形式的改变和新时代发展带来的图书馆服务新领域出现的新任务。此外,保障开放数据充分有效的利用还需要加强用户的数据素养。数据开放的最终目的是满足公众数据需求,挖掘数据价值,推动社会进步与发展。数据的深度开发利用需要专业的信息技术知识和较强的信息利用能力。用户对大数据分析与处理的需求与大数据分析人才缺乏的矛盾日益凸显。图书馆在信息素养、数据素养教育等方面经过长期的积累,拥有丰富的经验和完整的培训体系。通过提升公众的数据分析、数据挖掘、数据再利用、数据安全等方面的专业知识培训,能够帮助用户更好地利用开放数据开展各类实践。在显著提高用户知识获取能力、知识利用能力和知识创新效率的同时,也充分体现出图书馆知识服务的知识密集性及价值增值特性。

结语

最早提出“大数据”时代到来的麦肯锡说:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。”全球数字化时代,数据共享、交换、交易的需求越来越多,图书馆宏观发展战略调整势在必行,包括图书馆自身组织结构和资源建设范式变革、服务内容与形式的创新、积极拓展与各方合作等。新一代的计算架构、软硬件结合的图书馆以及能够高效处理大数据、利用大数据的专业馆员将进一步提升开放数据的价值及使用效率,从而推动数据开放的广度和深度,让“数据孤岛”充分发挥其应有价值,助力新型智慧城市和数字化建设,让社会各方更多受益。

猜你喜欢

图书馆资源用户
基础教育资源展示
一样的资源,不一样的收获
资源回收
图书馆
资源再生 欢迎订阅
关注用户
飞跃图书馆
关注用户
关注用户
如何获取一亿海外用户