APP下载

基于生命周期的跨机构文化资源数字化建设*

2016-05-17刘香兰国家图书馆北京100081山东科技大学山东青岛266590

图书馆 2016年4期
关键词:生命周期机构数字化

刘香兰(1. 国家图书馆 北京 100081;2. 山东科技大学 山东青岛 266590)



基于生命周期的跨机构文化资源数字化建设*

刘香兰1,2
(1. 国家图书馆北京100081;2. 山东科技大学山东青岛266590)

〔摘要〕文化资源数字化建设是现代公共文化服务体系建设的重要组成部分,数字化新技术是推动文化资源建设、提高文化资源创新能力和传播能力的新引擎。基于生命周期理论,运用采集、加工组织、存储、版权保护、集群高并发检索与动态调度、智能展示等数字化高新技术,汇集、整合不同文化机构的数字文化资源,实现文化资源的集中管理、统一检索与联合展示,可为异构多形态文化资源的数字化建设提供技术手段和参考依据。

〔关键词〕文化资源生命周期数字化建设

〔分类号〕G203;G358

〔引用本文格式〕刘香兰.基于生命周期的跨机构文化资源数字化建设[J].图书馆,2016(4):62-65, 77

* 本文系国家“十二五”科技支撑计划项目“文化资源服务平台解决方案及标准研究”(项目编号:2012BAH01F01)和国家图书馆科研项目“基于关联规则的图书馆读者行为数据挖掘方法研究”(项目编号:NLC-KY-2015-08)的研究成果。

1 引言

文化资源蕴含着民族特有的精神价值、思维方式和想象力,体现着民族的生命力和创造力,是各民族的智慧结晶,也是人类文明的瑰宝,利用先进的数字化信息技术进行记录、编辑、管理和再现文化资源,是科学保护、传承、共享文化资源的有效手段。研究文化资源的数字化核心技术,汇集、整合跨行业、跨平台的多形态文化资源,消除资源分散造成的信息单一孤立、利用困难等问题,促进文化资源的传播与利用[1],保证文化资源建设与服务的可持续良性发展,已成为构建现代公共文化服务体系的一个热点问题。

2 文化资源数字化建设的必要性

2.1构建现代公共文化服务体系的需要

《关于加快构建现代公共文化服务体系的意见》[1]明确提出,加强公共文化大数据采集、存储和分析处理,统筹实施全国文化信息资源共享,构建标准统一、互联互通的公共数字文化服务网络,加快推进公共文化机构数字化建设。随着数字化信息技术的日新月异,数字文化资源共建共享已成为惠及千家万户的一项重要基础工程,是政府提供信息共享服务的重要内容之一,打破行业内、区域间信息闭塞的状况,缩小文化机构间数字鸿沟,提高海量信息资源的标准化汇集与整合,提升文化机构资源服务能力,形成协调推进复合型公共文化服务体系构建的强大合力。

2.2解决文化行业资源建设的条块分割

分属于不同文化机构的文化资源,在数字化过程中存在资源分散、数字化建设重复低效、资金及设备重复投入、资源碎片化和条块分割的诸多问题,文化资源的数字化建设可以将各文化机构物理上被分散在各个网络节点中、异构数据源系统中孤立的数据进行分布式存储与异构整合,通过诸如用户统一认证、统一检索、动态调度等数据库整合技术,借助于面向移动网络、电视网络的数据分发等运营系统的整合,实现不同来源、不同层次、不同结构、不同内容的文化资源共建共享与有机融合,为用户提供一个统一的、透明的访问界面。

2.3创新文化机构服务模式

新媒体,改变了文化资源的传播渠道与传播方式,实现了数字文化资源的多渠道传输、多功能服务及多智能终端的信息接收方式,培养、改变了与资源全媒体传播模式相适应的新型受众,主体参与意识的强化加速了受众个性化需求的萌发,文化机构的资源服务模式面临着诸多挑战。文化资源数字化建设,依托于媒体融合、网络融合、大数据等现代化信息新技术,集不同文化机构的人力、物力、财力,探索创新数字时代文化资源的服务模式,可增强各文化机构数字资源的提供能力和远程服务能力,扩大数字文化资源的覆盖面及提高受众的服务满意度。

3 数字化新技术对文化资源建设的影响

3.1资源建设内容及展现形式多样化

随着数字化、信息化、网络化技术的发展,可数字化的文化资源内容日益广泛,不仅传统的文献资源如图书、期刊、报纸,而且文物、艺术创作、民俗风情、非物质文化遗产等这些非文献文化资源也可进行数字化采集与加工组织,并可通过文字、图片、音视频、动画、网页、交互体验等多样化的资源展现形式呈现给广大受众。

3.2资源传播形式覆盖全媒体

在新技术的驱动下,新媒体与传统媒体不断融合发展,数字文化资源的媒介载体、媒体覆盖面、受众传播面均发生了翻天覆地的变化。依托于互联网、广电网、移动通信网、卫星等传播渠道,借助于电视、音像、电影、出版、报纸、杂志、网站等不同媒介形态,受众可通过电脑、手机、笔记本、IPad、阅读器、数字电视等覆盖全媒体的多智能终端设备,随时随地使用数字文化资源。

3.3资源的集约化管理

文化资源的集约化建设与管理,可以集各文化机构的人力、财力、物力,通过业务整合重组,优化资源配置及建设流程,减少软硬件设备的重复投入及资源的重复建设,节约人力及资金成本,规范文化资源的元数据建设,全方位整合异构、多形态的文化资源,构建惠及更多用户的超大型数字文化资源应用支撑平台,实现数字文化资源的共建共享及长期保存。

4 基于生命周期理论的文化资源数字化建设模型

信息(资源)生命周期指从信息的收集、生产、保护、传播、检索存取和利用,到消失或不再有利用价值、不再被传播的过程,一般经历生成、交流、整理、存储、利用、维护、恢复、再利用、再包装、再交流、降低使用等级、处置或废弃等阶段[2]。文章基于信息生命周期理论,集成资源的数字化采集、加工组织、存储、版权保护、展示、统一检索技术,整合多家文化机构的多形态文化资源,并实现跨机构文化资源的数字化建设,为文化资源的集中管理、统一检索与联合展示提供技术手段。

资源生命周期建设阶段的划分在文化资源的数字化建设过程中非常重要,文章在借鉴国内外学者划分标准的基础上[3-6],将文化资源的数字化建设模型划分为五个阶段:依次是文化资源的数字化采集/加工组织、存储/长期保存、认证/版权保护、检索/动态调度、展示/整合更新。文化资源数字化建设的每个生命阶段相互依存,互为依托,共同形成一个动态闭环管理体系,但模型的每一阶段又都是开放式的[7],管理人员可根据需求随时修改维护相应的资源数据。

4.1文化资源的数字化采集与加工组织

文化资源的数字化采集技术根据资源类型的特点,分别确定采集目标、采集要素、采集设备、采集流程,经过采集数据的分析与处理后获取不同类型资源的元数据;加工组织技术在分析资源自身特征与属性及资源所有者、管理者和使用者各种需求的基础上,确定选取各资源类型的元数据标准和具体应用规则,形成不同的元数据建设方案,利用统一的元数据结构、配置文件解析器进行元数据的转换与清洗,通过语义关联进行元数据的规范化再组织。

4.2文化资源的存储与长期保存

文化资源具有非直观性、易逝性、易损性,借助于存储和长期保存技术可实现资源在长久时间内被定位、读取、使用和发现。存储和长期保存技术针对文化资源建设的存储需求,利用多个存储设备,将集群功能、分布式文件系统、网格计算等功能联合起来协同工作,并通过一定的应用软件或应用接口,对用户提供一定类型的数据存储服务和数据访问服务。多机构数字文化资源的长期保存,既可以保证数字对象在整个建设生命周期内的完整性、真实性和可用性,又可以便捷地共享数据,易于扩充存储容量,大大降低保存成本。

4.3文化资源的认证和版权保护

在数字时代的大环境下,文化资源数字化后的传播渠道和传播方式更加多样化,但同样也面临着侵权问题,资源版权登记、版权存储标识、传播使用控制、版权追踪及侵权监测等资源认证与数字版权保护技术是对数字文化资源进行权益管理与保护的一项有效措施。综合使用各种技术手段,对采集加工后的原始资源数据进行封包结构化,将传播资源的版权控制在基于统一资源接口标准与资源安全存储的结构中,形成统一规范化的资源数据,提供在线、离线、第三方的版权控制与管理服务模式。

4.4数字文化资源的检索与动态调度

将多机构的文化资源数字化后采用元数据集中、对象数据分散的管理模式,一直以来都是资源整合领域所追求的目标。汇集各类文化机构自建或其它方式获取的数字文化资源,建立和维护高性能的分布式索引,结合基于互连网的信息收集和数据分析挖掘技术, 利用搜索引擎对各类数字文化资源的元数据进行快速检索,向用户提供统一、实时高效的数字文化资源元数据搜索服务,其对应的对象数据可以提交到统一平台与服务系统上去直接发布,也可以通过各机构自建的发布与服务系统进行发布,实现各机构文化资源的分布式动态调度。

4.5数字文化资源的展示与整合更新

对文化资源进行采集、转换、清洗、封包、版权控制等系列数字化工作之后,资源便可通过视频、平面、声音、VR虚拟现实等多种手段向用户提供展示服务,资源在展示服务过程中需要不断根据受众的需求及交互反馈意见进行整合、更新、替代或剔除,以更好地完善优化资源数据,提升受众的服务满意度。

5 文化资源数字化建设的技术框架设计

图1 文化资源的数字化建设技术框架

基于生命周期的文化资源数字化建设,不仅集成了传统的纸质文献、图片、音视频,还探索性地整合了部分旅游文化、民俗文化、动态艺术等异构文化资源,借助于系列数字化信息技术,实现了文化行业内、文化机构间资源的数字化共建共享与统一揭示,为利用数字化信息技术构建现代公共文化服务体系提供了借鉴。文化资源的数字化建设技术框架设计为五层架构(如图1所示)。

5.1文化资源层

最底层为文化资源层,涵盖了来自于不同机构的图书、期刊、图片、地图、字画、音频、视频、活态三维等多种资源,资源类型的划分跨越了各机构内数据的分类方法,主要根据文化资源数字化采集技术的不同整理划分为五大类[8]。静态格式的资源包括图书、字画图片、音视频、立体文物等,并又细化为静态二维和静态三维两类资源;不断创新被传承的资源类型定义为活态资源,如音乐、民间戏曲、民间舞蹈;动态资源指变化发展的或可表现出活动神态的艺术资源[9],如动态图片、动态网页;不便于再精细划分的资源为其它类。

5.2数据采集层

数据采集层依据文化资源层的资源分类方法,制定各类资源的数字化采集与处理标准规范,分别确定资源采集目标、采集要素与采集流程,利用各种传感器、照相机、图像捕捉卡、扫描仪、条形码等现代化采集技术与设备,将文化资源转换为计算机可识别、处理的数字信号,并借助于M2M网络、互联网、移动宽带网、2G/3G/4G等网络将采集到的资源数据自动传输、暂时保存到计算机系统。

5.3数据处理层

图2 元数据建设体系

数据处理层主要对资源采集层采集到的元数据进行建设与整合。首先对跨机构资源数据进行综合分析,根据数据的内容属性、外在特征、管理属性、用户检索需求确定元数据规范化建设标准与建设体系(如图2所示)。元数据描述需要制定统一的元数据结构及映射规则,在保留不同资源共性内容的基础上,凸显不同资源和服务的个性化内容,以便实现元数据的转换与映射。基于元数据建设方案及映射规则进行元数据FRBR化再组织,构建文化资源的核心元数据集,利用元数据分析器、过滤器、生成器抽取核心元数据(如图3所示),采用数字资源唯一标识符技术对各类文化资源进行标识,将资源转换成可读、可检索的标准化关联数据,以实现数字信息的语义关联和知识重组[10]。

图3 核心元数据的抽取

5.4数据存储保护层

按照传统的工作模式和技术手段,要实现跨机构数字文化资源的存储与长期保存,要求每个机构都要建设一套资源存储系统,势必造成资源、资金的浪费,且基础条件欠缺的机构实施难度大等问题。跨机构的文化资源数据存储保护层旨在集多家机构的存储设备满足分布式文化资源的数据存储能力和存储性能需求,以实现存储的灵活扩展并应对更多资源数据的存储挑战,并利用灾难备份、实名统一认证、资源传播版权控制等一系列技术手段实现资源的长期保存与版权保护。

分布式存储技术采用可扩展的Hadoop数据库架构,通过网络利用多台存储服务器分担存储负荷,提高分布式存储系统的可靠性、可扩展性与存取效率;针对文化资源的非直观性、易逝性、易损性特点,在分布式存储基础上,构建跨机构的云仓储架构,将存储服务和存储资源统一放到云上,形成数字文化资源的联合保管与服务集成;灾难备份采用数据级灾难备份技术,通过建设数据校验模块,实现数字文化资源的异地数据备份,以备灾难发生后,仍然能够最大程度保持服务的连续性,减少非计划内的宕机时间。

读者实名认证技术自动通过全国公民身份证号码查询服务中心系统验证读者身份信息,通过读者权限控制实现资源版权保护。资源传播途径是最为关键的盗版媒介,资源传播是版权控制的重点。资源传播控制涉及到资源建设生命周期的各个阶段,资源传播链条包括数字版权管理中心、许可证管理中心、盗版追溯中心、内容拥有者、内容分发商、授权用户以及提供数据支撑的资源数据库,跨机构文化资源的传播控制必须建立一个全方位、立体化的体系(如图4所示)。通过综合使用各种技术手段,在对文化资源数据库中的原始资源进行封包结构化、统一资源接口标准与资源安全存储的基础上,提供在线、离线、第三方的版权控制和管理。

图4 资源传播控制链条

5.5数据展示服务层

经过集成、整合并有版权保护的跨机构数字文化资源,借助于集软件、硬件于一体的集群式检索系统(如图5所示),在公共基础网络上建立专有数据通道实现信息传递与服务的动态调度,通过不同的媒介形态、覆盖全媒体的多智能终端设备,以图、文、声、像等资源传播方式全方位展示给广大受众,并实时搜集受众的交互反馈信息,动态优化完善数字文化资源的服务。

图5 集群式检索系统

6 结语

基于信息生命周期理论的跨机构文化资源数字化建设,通过数字化采集、加工组织、存储、长期保存、版权保护、展示等现代化信息技术手段,消除了机构间资源数据分散造成的信息孤立、利用困难等问题,促进了文化资源的传播与利用,创新了文化资源建设与服务的可持续良性发展模式,为跨平台、多形态文化资源的数字化建设及共建共享工作提供了参考依据。

(来稿时间:2015年9月)

参考文献:

1.毕强,陈晓美,印均平.数字资源建设与管理[M].北京:科学出版社,2010:37

2.冯明毅.基于信息生命周期理论的图书馆信息资源管理模式构建[J].图书馆建设,2013(7):49-52

3.索传军,王涛,付光宇.国内外信息生命周期管理研究综述[J].图书馆杂志,2007, 27(7):14-20

4.王静,郭太敏,王敏, 等.基于生命周期理论的区域科技信息服务协同风险管理研究[J].图书馆,2014(4):62-63,82

5.赵伯兴.复合图书馆条件下馆藏生命周期成本的研究[J].图书馆,2004(5):19-22

6. Protection and Information Lifecycle Management[M]. Prentice Hall Ptr,2005

7.索传军.基于信息生命周期的数字馆藏管理研究[J].大学图书馆学报,2005(1):26-29

8.中华人民共和国文化部.国家科技支撑计划项目建议书[R].文化资源数字化关键技术及应用示范,2011

9.动态[EB/OL].[2015-01-26]. http://baike.baidu.com

10.国家图书馆.文化资源的数字化关键技术研究报告[R],2015

Digital Construction of Cultural Resources for Different Units Based on Life Cycle

Liu Xianglan1,2
( 1.National Library of China; 2.Shandong University of Science and Technology )

〔Abstract〕Digital construction of cultural resources is an important part of the construction of modern public cultural service system, New digital technology is the new engine to promote the construction of cultural resources, to improve innovation ability and communication ability of cultural resources. Based on the life cycle theory, using new digital technology, such as acquisition, processing, storage, organization and copyright protection, clusters of high concurrency retrieval and dynamic scheduling, intelligent digital display , cultural resources of different cultural agency can be collected and integrated, to realize centralized management, unified retrieval and joint exhibition of cultural resources, to provide technical means and reference for the digital construction of heterogeneous forms resources.

〔Keywords〕Cultural resourcesLife cycleDigital construction

〔作者简介〕刘香兰(1977-),女,国家图书馆在站博士后,山东科技大学图书馆馆员,研究方向:数字图书馆、文化资源数字化技术、数据挖掘。

猜你喜欢

生命周期机构数字化
全生命周期下呼吸机质量控制
家纺业亟待数字化赋能
从生命周期视角看并购保险
高中数学“一对一”数字化学习实践探索
民用飞机全生命周期KPI的研究与应用
高中数学“一对一”数字化学习实践探索
企业生命周期及其管理
一周机构净增(减)仓股前20名
数字化制胜
一周机构净增(减)仓股前20名