大数据环境下岭南文化数字资源整合研究
2023-05-24付兵
付兵
摘 要:在分析国内外文化数字资源整合研究现状的基础上,探索将信息集群理论、信息生态理论、整体政府理论和新公共服务理论运用到岭南文化数字资源整合中。结合国内外文化数字资源整合的实践经验,提出大数据环境下岭南文化数字资源整合模式由整合目标、整合主体、整合对象、技术标准等要素构成,构建了基础设施层、系统平台层和用户界面层组成的岭南文化数字资源整合服务平台。
关键词:大数据环境 岭南文化 数字资源 资源整合
中图分类号 G250.73 文献标识码 A 文章编号:
Research on the Integration of Lingnan Cultural Digital Resources in Big Data Environment
FU Bing
(Library of Lingnan Normal University, Zhanjiang, Guangdong Province, 524048 China)
Abstract: Based on the analysis of the research status of the integration of cultural digital resources at home and abroad, this paper explores the application of information cluster theory, information ecology theory, holistic government theory and new public service theory to the integration of Lingnan cultural digital resources. Combined with the practical experience of the integration of cultural digital resources at home and abroad, this paper proposes that the Lingnan cultural digital resource integration model under big data environment is composed of integrated goals, integrated bodies, integrated objects, technical standards and other elements, and builds the Lingnan cultural digital resource integration service platform consisting of the infrastructure layer, system platform layer and user interface layer.
Key Words: Big data environment; Lingnan culture; Digital resource; Resource integration
2011年,文化部、財政部共同出台了《关于进一步加强公共数字文化建设的指导意见》,2017年文化部印发了《“十三五”时期公共数字文化建设规划》,这些政策文件在制度设计、资源整合、服务机制建设等诸多方面要求加强公共数字文化建设力度,以满足人民群众不断增长的精神文化需求。
岭南文化是指中国岭南地区的文化,包含了广东、广西、海南等地区的文化。岭南文化是我国优秀文化的重要组成部分,是中华民族历史悠久的区域文化之一,数千年来形成了浩瀚的文化资源。但不少岭南文化在历经了岁月的磨蚀、不当地保存与使用、经济全球化浪潮的冲击等多种威胁后,正处于受损甚至湮灭等种种危机之中[1]。大数据环境下,数据的来源渠道多种多样,包括文献信息资源、物联网数据、社交网络数据、移动互联网数据等。岭南文化数字资源分布在不同的网站和数据库中,数据的结构、组织、存储、管理等方式各不相同,长期处于异构分散与杂乱无序的状态,如何利用数据挖掘、云计算、大数据等现代信息技术更加高效全面地整合岭南文化数字资源,为用户提供个性化的信息服务,更好地保护和利用岭南文化,是本研究的主要内容。
1 国内外研究现状
1.1 国外研究现状
国外对文化数字资源整合的理论研究与实践探索始于20世纪90年代,文化数字资源整合从最初的资源共建、合作共享进化到知识共享[2],开展了涉及全球、洲际和国家的数字资源整合项目。例如美国国会图书馆1990年开展的“美国记忆”项目,联合国教科文组织1992年启动的“世界记忆”项目,日本民族学博物馆与IBM东京研究所于1994年实施的“全球数字化博物馆计划”等[3],这些项目都是国外文化数字资源整合的早期实践。21世纪以来,世界各国文化机构合作开展的数字资源整合建设与利用项目逐渐增多,如由美国国会图书馆领导、多个国家图书馆和博物馆联合参与建设的“世界数字图书馆”(World Digital Library, WDL)[4];由英国、法国等国家合作开发,旨在整合图书馆、博物馆以及其他文化机构数字馆藏资源的“欧洲多语言文化遗产库”(Multilingual Inventory of Cultural Heritage in Europe, Michael)[5];美国博物馆与图书馆服务协会联合开展的数字化项目“美国数字公共图书馆”(Digital Public Library of America, DP-LA)[6];英国国家图书馆、博物馆和档案馆实施的“聚宝盆项目”(Cornucopia)[7]等,都是为了满足社会公众对文化资源的需求,充分利用最新的信息技术手段,探索文化数字资源整合建设与共享,构建面向公众的文化数字资源整合服务平台的积极实践。国外文化数字资源整合呈现出不断寻求新的合作机构,扩大可用资源范围,文化数字资源整合方式多样化,充分利用现代信息技术拓展资源整合平台的功能。
1.2 国内研究现状
21世纪以来,我国陆续启动了一些文化数字资源整合项目,如由文化部和财政部联合组织开展了全国文化信息资源共享工程、数字图书馆推广工程和公共电子阅览室建设计划,并取得了积极的进展,为我国的文化数字资源建设奠定了良好的基础。伴随着上述三大工程的开展,2002年青岛市率先提出“城市记忆工程”,在其示范作用下,北京、武汉、上海、广州等50多个城市也相继推出了“城市记忆工程”项目[8]。
岭南地区已建设了一些的文化数字资源项目,以广东省为例,目前已有广东文化网、广东数字文化网等专门的文化网站,以及广东旅游网等与岭南文化相关的网站,另外还有新华网、南方网等门户网站中与岭南文化相关的专栏、频道。这些数字化项目和网站为宣传和传承岭南文化起到了一定的作用,但不同项目和网站之间存在着数字鸿沟和技术壁垒,多源异构的数字资源难以互通与共享,用户要全面了解岭南文化就必须访问多个不同的网站、面对不同要求的网络环境,文化数字资源整合服务的水平亟待进一步提升。
国内外已有相关研究主要关注公共文化数字资源整合的实践基础、实践现状、技术标准、整合服务活动中面临的问题及对策等方面。立足我国文化多元化的国情,区域文化差异巨大,针对区域文化数字资源整合的研究更是凤毛麟角。岭南文化作为我国重要的区域文化之一,在大数据环境下,如何将海量、异构、分布式存在、种类多样的岭南文化数字资源进行整合,正是本研究的主要内容。
2 岭南文化数字资源整合的理论基础
岭南文化数字资源的整合需要政府部门及图书馆、博物馆、档案馆、文化馆、美术馆等文化服务机构的共同参与,需要奠定坚实的理论基础用以指导和规划整合工作。本研究探索将信息集群理论、信息生态理论、整体政府理论和新公共服务理论应用到岭南文化数字资源整合中。
2.1 信息集群理论
信息集群是将大量的信息服务机构按照一定的模式聚集在特定的虚拟区域内,并对各个信息服务机构中相对分散、独立的信息资源按统一的规则进行加工和整合,为信息用户提供统一的操作界面,实现信息资源的一站式检索、个性化服务,从而实现信息资源共建共享[9]。在数字资源整合活动中可利用信息集群理论所强调的集群成员之间相互协调与合作,将各种文化服务机构中相对独立、分散无序的文化数字资源进行整合,有利于实现文化数字资源的共建共享,降低服务成本,提高服务水平。
2.2 信息生态理论
该理论是将生态学的相关理论与方法应用到信息管理之中而形成的一个交叉学科的理论。信息生态是信息人在信息环境中的生存和活动状态。信息生态理论注重信息人与信息环境之间的关系,提出信息生态位应合理分化,该理论与文化数字资源整合服务具有高度的契合性,对文化数字资源整合服务具有良好的理论与实践指导意义[10]。
2.3 整体政府理论
整体政府理论是英国学者佩里·希克斯(P. Hicks)于1997年出版《整体政府》一书中提出的。该理论以公民的现实需求为导向,以现代信息技术为手段,以整合、协调与目标责任为工作机制,跨越组织机构功能的边界,从政策、制度、服务、监督4个方面,对政府治理的层级、功能、各部门之间的关系及信息系统等进行协调与有机整合,从而不断在分散、局部、破碎走向集中、整体、整合,为公众提供无缝对接、一站式的整体性政府公共服务[11]。整体政府理论能够有效地解决部门间的职能交叉服务,主张跨组织机构间的协同运作,在文化数字资源整合过程中,各类文化机构的资源整合平台应是一個整体,只有彼此之间的管理跨越组织机构,才能保障文化机构之间的跨功能协作,实现整体平衡[12]。
2.4 新公共服务理论
新公共服务理论以公民为服务对象、以追求公共利益为目标、强调服务的理念、明确责任的复杂性与重要性以及提倡新型的管理模式,与文化数字资源整合服务具有一定的关联性,该理论在文化数字资源整合、传统服务理念变革、信息服务体系与法规完善等方面对数字资源整合服务具有一定的借鉴意义。文化数字资源整合的目的是为了更好的为用户提供信息服务,满足用户信息需求,运用新公共服务理论,可以使得文化数字资源整合服务水平达到最优化,从而提高用户获取信息的感知体验和资源质量[13]。
3 大数据环境下岭南文化数字资源整合模式
岭南文化数字资源整合模式是由整合目标、整合主体、整合对象、技术标准等要素构成的有机统一体,是为实现资源整合目标而对整合过程中的各要素、各环节和运行方式的部署与设计。各要素之间的内在关系如图1所示。
3.1 整合目标
大数据环境下岭南文化数字资源的整合目标是尽最大可能地整合存储于图书馆、博物馆、档案馆、文化馆、美术馆、非物质文化遗产保护中心等各类型公共文化机构所藏的岭南文化数字资源,并运用现代信息技术自动采集、组织加工、分类展示这些数字资源,同时在网络平台上为用户提供跨库检索、分类浏览、AR展示、音视频点播等一站式信息服务,以满足社会公众对岭南文化数字资源的需求以及长期高效地保存资源丰富的岭南文化遗产。
3.2 整合主体
整合主体是整个数字资源整合工作的实施者,也就是由谁来组织开展整合。岭南文化数字资源的整合主体主要包括岭南地区各省市区县文化与旅游、档案等政府部门,图书馆、博物馆、档案馆、美术馆、文化馆等文化机构及信息技术公司等。在整合活动中需要这些来自不同领域、相互独立的主体协同工作,以保证整合工作的顺利开展以及整合目标的最终实现。政府部门的主要作用是组织领导、统领全局,负责制定数字资源整合的相关政策制度,管理和指导其他整合主体积极开展整合实践,并提供项目经费支持;公共文化机构是整合工作的主要实施者,其职能主要是提供已有数字资源并持续对所藏资源进行数字化、制定数字资源整合技术标准、建设并维护资源整合平台;信息技术公司主要提供网络、数字化、数据库、平台搭建等信息技术支持[14]。
3.3 整合对象
整合对象以整合目标为依据,及需要整合的岭南文化数字资源,是整合工作的核心内容。按资源的文献类型来分,整合对象主要包括图书、期刊、报纸、光盘、磁盘、档案、文物、艺术作品、手稿、非物质文化遗产等;按资源的形式来分,整合对象主要包括文本、图像、音频、视频等多媒体资源。整合对象主要分散存储于图书馆、博物馆、档案馆、文化馆、美术馆等公共文化机构。
3.4 技术标准
技术标准是在数字资源整合活动过程中需要协调统一的信息技术所制订的标准和规范,科学统一的技术标准是整合主体实现将数字资源顺利整合的关键。岭南文化数字资源整合的技术标准涉及数字资源自动采集、组织加工、动态存储、跨库检索、数据传输等各个环节[15]。国际和我国已制定了元数据标准,由于不同类型的文献资源可能有不同的元数据标准,因而现有的元数据标准很难直接用来统一描述不同类型的文献资源。可借鉴WDL、Michael、Europeana等国外知名的文化数字资源整合项目的实践经验,结合岭南文化数字资源整合的具体需求,在都柏林核心元素集(Dublin Core Element Set, DC)的基础上进行修订和拓展,构建岭南文化数字资源整合的元数据标准。
4 大数据环境下岭南文化数字资源整合服务平台构建
大数据环境下岭南文化数字资源整合服务平台基于分层服务框架设计,采集加工整理各种岭南文化数字资源,通过大数据整合技术、数据挖掘技术揭示数字资源的内涵与相互关系,运用个性化推荐技术为用户提供主动推送服务。该整合服务平台的总体框架由基础设施层、系统平台层、软件应用层构成(如图2所示)。基础设施层运用虚拟化技术为平台提供海量动态的存储空间、高效实时的计算性能、高速稳定的网络传输能力及安全可靠的保护能力,进而以此为基础建立虚拟化的岭南文化数字资源库,为搭建整合服务平台奠定坚实的基础。系统平台层根据岭南文化数字资源整合过程,针对不同来源、格式、描述方式的数字资源,采用统一的元数据标准进行描述,并按主题聚类,形成若干个岭南文化数字资源子库。软件应用层为满足不同用户的信息需求,建立数字资源个性化推荐模型,为用户提供精准的信息服务。用户可以通过PC、平板电脑、智能手机等智能终端设备全天候实时访问服务平台。
4.1 基础设施层设计
多源异构的数字资源岭南文化数字资源整合服务平台的基础,图书馆、博物馆、档案馆等文化服务机构将其所藏的岭南文化数字资源上传到平台服务器中,以实现资源的融合汇聚。该层应用虚拟化技术,实现对岭南文化数字资源采集、加工、存储、虚拟化的统一管理。基础设施层所形成的岭南文化数字资源库,为系统平台层和应用软件层的构建提供资源保障。基础设施层包含数据采集、存储、虚拟化、数字资源管理引擎及岭南文化数字资源库。数据采集是通过人工提交和软件自动抓取的方式整合文化机构所藏的岭南文化数字资源;数据存储运用分布式网络存取技术、服务器集群技术等,搭建服务平台的存储体系,并采用多副本容错等措施以保障数据的安全性与可靠性;岭南文化数字资源库是在数字资源管理引擎的统一管理下,经过虚拟化计算、存储、网络、安全以及容灾等技术,在虚拟空间内所形成的,以实现岭南文化数字资源的融合汇聚[16]。
4.2 系统平台层
从各种文化机构采集而构建的岭南文化数字资源库,其数字资源总量庞大、文献类型繁多,大多数都是孤立存在的,而且资源内容重复、交叉或冗余等情况异常严重。系统平台层主要对多源异构的数字资源进行组织加工、整合与管理,利用统一的元数据标准,对所采集的数字资源进行描述,建立起各個数字资源之间的关联,消除冗余信息,使数字资源按主题聚类,以方便提供岭南文化数字资源的宣传、展示、浏览、检索等信息服务。
4.3 用户界面层
用户界面层是用户浏览、检索、获取岭南文化数字资源的窗口,可分为基本信息展示与个性化推荐两个部分。基本信息展示以数字资源专题、分类导航、点击排行、宣传活动等形式直观的在页面上展示以供用户浏览获取。个性化推荐服务是根据用户注册提供的基本信息与浏览行为等数据,预测用户可能会感兴趣的信息,并生成数字资源推荐结果,据此有针对性的为用户推送相应的资源与服务,以满足不同用户的个性化需求,进而提高用户平台使用体验。
5 结语
大数据环境下,信息呈现爆炸式地快速增长,数字资源的整合是一项持续而系统的工程。通过建设岭南文化数字资源整合服务平台,将分散的、多源异构的岭南文化数字资源进行整合,能够便于资源的集中高效管理和用户全面、快速获取资源,有利于岭南文化的长久保护与完整传承,进而增强文化自信与区域竞争力。
参考文献
[1]梁广寒.岭南记忆:搭建岭南文化遗产整合平台[J].文化遗产,2011(4):85-89.
[2]王萍,陈为东,黄新平.国内数字文化资源整合研究进展[J].图书情报工作,2016,60(12):6-13.
[3]肖希明.“国外公共数字文化服务资源整合研究”专题引言[J].图书与情报,2015(1):1.
[4]世界数字图书馆[DB/OL].[2022-07-10].https://www.wdl.org/.
[5]欧洲多语言文化遗产库[DB/OL].[2022-07-10].http://www.michael-culture.eu/.
[6]美国数字公共图书馆[DB/OL].[2022-07-10].https://dp.la/.
[7]英国聚宝盆项目[DB/OL].[2022-07-10].http://www.cornucopia.org.uk/.
[8]趙生辉,朱学芳.“城市记忆工程2.0”理论与实践初探[J].图书情报知识,2014(5):30-38.
[9]肖希明,李硕.信息集群理论和公共数字文化资源整合[J].图书馆,2015(1):1-4,11.
[10]肖希明,唐义.信息生态理论与公共数字文化资源整合[J].图书馆建设,2014(3): 1-4,16.
[11]吴德星.以整体政府观深化机构和行政体制改革[J].人民论坛,2018(1):49-51.
[12]赵红颖.图书档案资源数字化融合服务实现研究[D].长春:吉林大学,2015.
[13]肖希明,曾粤亮.新公共服务理论与公共数字文化服务资源整合[J].图书馆建设,2015(8):38-43.
[14]唐义,肖希明,周力虹.我国公共数字文化资源整合模式构建研究[J].图书馆杂志,2016,35(7):12-25.
[15]沈玉兰,袁名敦.标准化是建设好我国数字图书馆的重要保证[J].现代图书情报技术,2002(2):6-7.
[16]张树臣,陈伟,高长元.大数据环境下公共数字文化服务云平台构建研究[J].情报科学,2021,39(4):112-118.