APP下载

大数据时代智慧博物馆建设路径及其对应策略①

2021-04-12马玉静

自然科学博物馆研究 2021年4期
关键词:藏品文物博物馆

马玉静

博物馆承载历史记忆,传承文化基因。2007年,国际博物馆协会对博物馆的定义是“一个为社会及其发展服务的、向公众开放的非营利性常设机构,为教育、研究、欣赏的目的征集、保护、研究、传播并展出人类及人类环境的物质及非物质遗产”。在2019年9月东京召开的国际博协大会上,提交审议的博物馆新定义为“博物馆是用来进行关于过去和未来的思辨对话的空间,具有民主性、包容性与多元性。博物馆承认并解决当前的冲突和挑战,为社会保管艺术品和标本,为子孙后代保存多样的记忆,保障所有人享有平等的权利和平等获取遗产的权利”。虽然这一定义并未表决通过,但却引发了深入的思考。

随着社会的进步和信息技术的发展,博物馆的功能定位、展陈方式、文物保护、教育传播等运营模式均发生了很大变化。截至2019年底,我国登记备案的博物馆达5535家,可移动文物逾1.08亿件套。同时,人民群众生活水平不断提高,精神文化需求快速增长,仅2019年博物馆参观人数就达到12.27亿人次,这对博物馆的管理和服务提出了更高的要求。随着博物馆资源整合、开放、共享的逐步推进,传统的以部门为单位,单打独斗的业务模式已无法适应新时代对博物馆的要求。博物馆应根据新的业务需求,重塑业务格局,从分散建设、独立应用向集成化发展。智慧博物馆是在融合博物馆信息化建设和数字博物馆建设成果基础上,利用最新信息网络技术而形成的博物馆运维新模式,其重点是解决最新信息网络技术下“人-物-空间”数据融合共享与智慧应用问题[1]。

近年来,国内外博物馆都在利用信息技术提升保护、管理和服务水平。2012年4月,IBM宣布与巴黎卢浮宫博物馆合作,建设欧洲第一个智慧博物馆,通过IBM Maximo资产管理软件,简化博物馆设备维护流程;2014年9月,纽约大都会艺术博物馆上线THE MET智能移动应用,为观众提供丰富多彩的参观和体验内容;2015年,史密森尼自然历史博物馆研发新数字化应用系统,通过社交媒体和增强现实技术,为观众提供智能导览和沉浸式体验;2015年,美国克利夫兰艺术博物馆利用面部/动作识别技术提高了展品与观众的互动性[2]。相较于国外博物馆,我国博物馆智慧化建设起步略晚。2013年陈刚在《中国博物馆》期刊发表《智慧博物馆——数字博物馆发展新趋势》,首次提出“智慧博物馆”概念;2015年国家文物局在苏州博物馆、广东省博物馆、金沙遗址博物馆等几家博物馆进行智慧博物馆试点建设。总体来说,博物馆智慧化建设经历了统一规范、整合信息资源、破除信息孤岛的过程,在智慧管理、智慧保护、智慧服务等领域均有了较大的提升。

伴随着物联网、云计算、大数据、人工智能、虚拟现实、5G等新一代信息技术的发展,数字化、网络化、智慧化已成为博物馆发展的大趋势。互联网的宽带化和移动互联网及物联网的技术与应用源源不断产生数据,摩尔定律所支撑的计算能力几乎是以十年千倍的速度提升。而大数据与智慧化是相伴而生的,大数据所具有的海量、高速、多样性、低价值密度、真实性等特征,通过海量、多源异构的数据资源抽取、治理及新的处理分析模式,具有更强的决策力、洞察发现力和流程优化能力,从而做出预测和判断,推动博物馆管理、服务、保护等方面由粗放式向精细化发展,形成以全面透彻感知、泛在互联、智慧融合应用为主要特征的智慧博物馆新形态。

一、 大数据时代的智慧博物馆建设功能定位

20世纪中后期,博物馆逐步从“以物为中心”转向“以人为中心”,同时博物馆功能从传统的“收藏、研究、展陈”向“教育、研究、收藏”转变,更加凸显了教育的重要作用。王宏钧先生认为,“博物馆教育是在藏品和科学研究的基础上展开的。一个博物馆存在的价值就在于有效的使藏品及其研究成果为社会公众服务”[3]。博物馆收藏是基础,研究为展览和教育服务,陈列展览作为教育的载体,三者相辅相成,在大数据时代关系更为密切,数据的高效组织成为智慧博物馆发展的基石和制约因素。

从收藏角度来说,文物是博物馆的物质基础,是不可再生资源,文物的收藏保管是博物馆工作的重中之重。文物本体的安全保管涉及环境监测、安防消防、账物统一、定位追踪等内容。在信息技术飞速发展的基础上,利用物联网技术,通过实时的温湿度、光照、菌落等数据采集,建立文物预防性保护的大数据模型,当数据超过阈值即自动报警处理;无线射频识别技术(RFID)是物联网技术的核心之一,射频识别的电子标签等信息传感设备是实现物联网的核心中介设备,将文物藏品和RFID电子标签安全绑定,从而实现对文物本体的位置动态感知。馆藏文物利用管理是博物馆整体工作中极其重要的一环,是博物馆的一项重要基础性工作,其中文物的征集、鉴定、登编、备案和建档是基础工作中的核心。长期以来这项工作一直开展得不够理想,基础资料不完善是我国博物馆的通病,对研究、展陈、教育业务的支撑有限。因此,通过建立文物征集、保管、研究、展陈、教育、宣传等多维度、全生命周期的数据管理,可实现藏品科学保管、出入库流程跟踪、定位识别查找、预防性保护等核心管理环节的有效规范实时动态应用,形成藏品信息可查询、流程可追溯、安全可保障的文物生命周期全流程智慧管理新模式。

从研究角度来说,目前国内大多数博物馆的科研工作往往都是研究人员凭借个人兴趣和工作条件进行,随意性较大,基本上是封闭式的,缺乏交流和沟通,既不能形成合力,更无法对工作形成有效的科研支撑。博物馆研究的特征是拥有宝贵的实物资源,以物说史、以物释史、以物证史是博物馆的基本职责[4]。博物馆藏品既有表现自身特点的外在特征,又有表现同类物、同文化物的作用,还可表达特定的社会文化现象或历史过程[5]。因此,对藏品的研究一方面要运用视觉、感官准确描述藏品的质料、体量、纹饰等;另一方面要运用历史文化等背景知识,结合历史学、考古学等文献资源对博物馆文物进行历史、科技、艺术等多方面价值的研究。随着近年来各类人文文献资料的数字化,各类专题数据库、语料数据库建设,以及数字人文在人文科学研究领域的蓬勃发展[6],博物馆研究也需要从数字化、结构化、关联化、语义化到智慧化,通过数据驱动的方式对博物馆文化遗产数字资源采集、标注、关联、解构和重构,如对实物图像进行适度标注,把图像内部的知识点和背景知识关联起来,甚至与图书馆、档案馆等数据库建立关联,展示出实物和史料隐含的关系,为研究者提供一个观察某历史时期具体事件发生的环境,呈现出相关史料之间的时空联系[7],弥补藏品数据方面的不足。

从教育角度来说,陈列展览作为博物馆教育的重要载体,呈现内容从物的展示到信息阐释,博物馆展览不应当仅仅向观众提供孤立的器物,而应该以物为载体向观众讲述具有叙事性的故事[8],这需要有大量的数据做支撑。近年来利用5G 、VR/AR、多媒体等数字技术开发馆藏资源,在对文物价值深入挖掘与科学诠释的基础上,通过数字信息的重构组合,打造线下交互式、沉浸式展览体验,实现文化与科技的融合发展,让文物展示从静态转为动态,从简单的图文展示转为多维度的信息推送。同时,发展“互联网+展陈”新模式,打造数字化展示示范项目,通过数字化采集、图像呈现、信息共享、按需传播、智慧服务等云展览共性、关键技术研究与应用,使博物馆实物展场的教育逐步向线上教育纵深拓展。其次,微信导览、智慧导览等方式代替了人工讲解,内容方面融合文字、音视频、AR/VR等内容,调动观众多感官沉浸式体验,使古老的文物焕发新时代的活力,让观众感受更便捷更有趣更有文化内涵的体验。

二、 大数据时代的智慧博物馆建设路径

博物馆拥有海量、多源异构的数据资源,从数据类型来说涵盖结构化数据、非结构化数据、以及半结构化数据,其中结构化数据多来源于系统数据库,如藏品著录指标项信息、观众基本信息等;非结构化数据以文件存储的方式,如藏品二维影像、三维模型、音视频以及PDF文档等;半结构化数据多来源于互联网,以xml文件的形式存在,如博物馆舆情数据等。数据内容涵盖核心业务、行政管理、运维保障等,其中核心业务涉及藏品数据、展览数据、研究数据、传播数据、社会教育数据、文创数据、观众数据等;行政管理数据涉及人员数据、财务数据、资产数据、工作数据等;运维保障数据涉及设备数据、楼宇数据、安防数据、后勤物业数据等。

随着技术的不断发展,基于博物馆私有云平台以及可分布式计算的大数据平台等基础环境的支撑保障,海量、多源异构数据的采集、存储、处理已经不是问题,如果采用大数据的采集处理模式,对各业务环节的数据进行汇聚、管理、存储所有的全量数据,以面向业务主题的指标体系进行数据组织,通过数据的深度挖掘和分析,丰富数据维度,打破数据孤岛,形成博物馆数据资产目录,进而深度挖掘数据价值,实现业务与数据的深度融合,为业务优化提供数据支撑服务。本文主要以藏品、观众的数据组织为例,阐述大数据时代智慧博物馆建设路径。

(一) 以藏品数据为核心的知识库构建

藏品是博物馆研究的物质基础,与藏品相关的数据涉及考古发掘记录、研究报告、影像信息、鉴定信息、保管信息、修复保护信息、展出信息,以及相关古籍文献、历史地图、照片、拓片等,这些数据以各种形式沉淀在业务系统里。北京大学文博学院宋向光教授提到:“博物馆征集、收藏、保护、研究、陈列、传播等各项基本业务内容尽管各不相同,各种基本业务的成果都是某种形态的知识,并作为其它业务的知识性输入和知识构建”[9]。以藏品为例,自藏品征集入馆开始,藏品的流传经过、专家鉴定意见等成为藏品档案重要数据,为后续的知识构建工作奠定真实、准确、可靠的基础资料;在藏品收藏的过程中,关于时代、类别、级别、质地、外形尺寸等藏品本体信息的著录管理,是对藏品知识的完善、规范,便于后期的查找利用及知识关联;藏品保护是知识构建的重要手段,通过对藏品质地、结构、制作工艺、装饰、埋藏或流传环境的检测分析,甚至是藏品的修复技艺等修复档案,进一步丰富和深化对藏品实体及相关自然、社会、文化、技术条件的认识;藏品研究围绕藏品的物质属性展开,结合有关史料,藏品相关的历史、社会及经济环境,藏品在时间及空间上的变化等藏品信息的梳理与挖掘,形成知识性的研究成果;藏品陈列是知识构建的直观化呈现,原本孤立的一件件藏品,经过研究将碎片化的知识超越时空关联起来,并赋予时代的价值观及认同;博物馆传播的是经过精心策划的知识,借助场馆及融媒体平台等多种不同的媒介形式,并在传播互动中鼓励公众参与博物馆知识构建。

目前,各家博物馆在信息化过程中,藏品的本体数据、文献研究数据、修复保护数据、展出利用数据、影像资源数据等分布在不同的系统中,系统中的数据管理自成体系,导致数据在系统内有效,系统间的关联关系完全割裂。数据的割裂一定程度上影响和制约了博物馆业务工作,无法通过数字化、关联化、语义化等数据分析及挖掘形成高质量的数据,博物馆作为知识宝库的价值也未能充分体现。因此,亟需将海量、多源、异构的文物领域数据,包括藏品本体、环境、历史文献、考古资料、研究成果、网络数据等,利用自然语言处理、大数据分析、文献计量学等组织起来,使数据语义化并相互关联起来,形成能够支撑文物和博物馆各项业务需求的知识表达和知识呈现体系。

一方面通过博物馆内部跨系统数据采集、融合、治理、分析,形成藏品考古、征集、管理、修复保护、研究、展出利用等全生命周期的数据,形成完整的藏品数据档案;另一方面通过文物知识图谱技术关联各类文献库、人物资料库、历史事件库等史料数据库,实现资源的组织、存储、分析和利用,通过元素提取,语义资源、文献资源、图片资源等类知识资源的采集、加工、标引等,整理出文物相关专题的时间、地点、人物、事件、作品等线索,通过适当的数字分析工具来剖析它们之间的关联,提供基于历史时空的事件、文物、文献、社会关系等知识脉络展现和探索研究的创新服务。

文物知识图谱需要建立文物知识表达的数据模型,知识图谱元数据模型主要有: DC[10],SKOS[11],CIDOC-CRM[12], EDM[13]等,其中国外应用较多的为CIDOC-CRM模型。CIDOC-CRM是国际文献工作委员会的概念参考模型,提供了一个通用并且可扩展的语义框架,该框架可以映射任何文化遗产信息,涵盖博物馆、图书馆、档案馆等,以促进对文化遗产信息的共享共识,为文化遗产信息资源提供其所涉及的隐性概念、显性概念及其关系的语义定义和结构形式化描述。CIDOC-CRM主要目的在于落实各种异构文化遗产信息源之间的信息交换和集成,收集那些为博物馆典藏增添文化涵义和价值的历史、地理和理论性背景资料,通过概念与关系的匹配,完整记录文化遗产的各种信息,以便将各种零碎分散的地方性信息源处理成一致的全局资源。

(二) 以观众数据为核心的用户画像构建

博物馆作为非正式的学习环境,具有非强制性特征,观众选择是否来博物馆,完全取决于个人喜好。公众来博物馆关注的是“我能从博物馆获得什么”,休闲娱乐、自我充实、社交活动、艺术熏陶、教育学习等往往被看作是参观博物馆的动机。“21世纪博物馆面临的最大挑战就是必须认识到博物馆是为公众服务,而其未来的成功则有赖于发现并满足公众的需要”[14]。随着大数据、云计算、移动互联网时代的到来,通过收集观众数据,分析观众的行为及可视化数据分析结果,呈现出观众的社会属性、教育背景、参观行为、消费行为、客户来源地等数据,可以进一步了解到个体进行博物馆参观的兴趣所在、关注热点、来博物馆的动机等等,为观众构建用户画像。

博物馆观众数据分为用户基本属性数据、用户参观行为数据、用户社交网络数据,以及其他数据等。其中用户基本属性数据,包括唯一身份ID、姓名、性别、年龄、籍贯、教育程度、专业、职业类型、邮箱等,可以通过预约服务系统、网站等注册信息采集,主要是观众来博物馆前的预约行为,这部分通常是结构化数据,直接从博物馆自建系统数据库抽取即可,相对比较好采集,并且便于形成用户标签。

用户参观行为数据涵盖参观路线、导览习惯、停留时间、关注展品、消费记录等,这部分数据来源于定位系统、导览系统、文创产品销售系统等,数据类型涵盖结构化数据和半结构化数据,主要通过数据库抽取,及操作日志埋点的方式进行提取。

用户社交媒体数据涵盖包括浏览、点赞、分享、评论、讨论、互动等,数据来源于网站和微博、微信等其他社交媒体系统,这部分属半结构化和非结构化数据,且数据量庞大,同时是用户画像的主要数据,如页面浏览、点击、下载等用户行为数据主要存储于用户Web 日志中,需要通过网络爬虫和日志挖掘技术进行提取,并将采集后的数据进行清洗、转换、规约、集成等预处理,形成有效的用户画像数据。

针对观众数据分散在不同的系统,通过对各业务系统数据库表进行业务分析,在保留各业务系统独立数据的同时,对存在业务共性的基础信息表进行采集、融合操作,针对结构化数据库采用ETL数据抽取方式,针对非结构化数据或者半结构化数据采用API接口的方式进行数据采集,并对采集融合的数据进行标准化处理,依据各层数据的表和字段、业务含义建立逻辑模型、物理模型等。结合用户的需求对观众进行标签分类,对已构建的各类标签进行权重分配、计算和比较,将具有独特标签的用户划分为一个集,依据模型计算对应的指标值,最终从年龄、地域、职业、兴趣爱好、参观时长、参观次数、参观行为等内容初步构建观众画像,使博物馆深刻理解观众需求,实时洞察观众喜好,为博物馆展览、教育等各项工作决策和评估提供参考依据,帮助博物馆快速精准地找到特定观众群体,以个性化的服务满足观众需求,实现博物馆服务由粗放式向精细化转型。

大数据时代的智慧博物馆建设,通过系统间数据的融合互通,借助大数据的采集模式、采集速度、基于云计算的数据处理分析,使得人、物、数据之间呈现出动态多元协同关系,使得展品状态、展厅人流、场馆设备运行等的状况可以被动态感知,从而实现预警及应急处理。为确保文物安全,避免观众在展厅内聚集,利用WiFi、RFID、蓝牙、地磁、陀螺仪、加速度、气压多源融合室内定位技术,与安防报警、视频相融合,对场馆人流量进行实时监控。基于观众导览数据、展厅热力数据、人流量数据结合博物馆各展厅设计容量进行动态分析,整合全馆展厅客流量资源,在海量业务数据积累的基础上开展数据分析和挖掘,计算各展厅拥挤程度,分析出预警方案及引流方案,提出开放空间使用优化建议,对业务和管理的保障支撑更有力。

三、 思考与展望

随着全球信息技术革命突飞猛进,智慧化已成为博物馆发展的最新趋势。尽管各博物馆在不同的领域进行了智慧博物馆建设的探索尝试,但尚未形成系统、完善、开放的智慧博物馆建设标准体系。笔者一直参与国家博物馆“智慧国博”建设,在工作实践中不断总结思考,下面谈几点体会,以求抛砖引玉。

(一) 顶层规划设计,各要素数据化

首先,智慧博物馆建设是一把手工程。馆领导要充分重视,根据博物馆定位和功能,做好顶层设计和整体规划。其次,智慧博物馆建设是一项系统工程。应坚持“需求驱动,业务引领,技术服务”的原则,新技术的应用和选择要服务于需求,始终以博物馆需求为导向,从文物保护、陈列展览、观众服务及内部管理等方面全方位智慧化提升。再次,也是最重要的一点,智慧博物馆建设应注重将“人、物、空间”等各要素全面数据化,涵盖文本、图像、图表、音视频、三维模型、全景漫游、空间轨迹等多种数据类型,而且这种数据采集是全方位、动态、实时的,来源于多个应用系统,在建设过程中应遵守统一的平台技术、接口标准,注重系统之间的业务集成、数据集成、服务集成。最后,建设思路应将原来以业务流程为核心的信息系统建设,转型以数据为核心的系统体系建设,这是一个“数据为王”的时代,文物信息化工作要坚持在基础数据上下功夫,尽可能采集和丰富文物信息,做好基础档案,做大数据资源,而不是在各种系统建设上反复投入,避免重复建设。

(二) 制定数据标准,形成管理规范

博物馆在以往多年的数字化和信息化过程中,已经积累了一定的数据基础,但是很少有博物馆从整体宏观的角度梳理已有的数据资源目录。智慧博物馆建设,首先,要进行全面的数据调研,摸清现有的数据资源目录,以及数据的完备性、一致性、更新频率等数据质量问题。其次,博物馆应该根据业务发展需求,建立数据标准,实现现有数据和新增数据的规范化管理,通过建立体系化、标准化的数据采集、存储、交换、应用流程,逐步实现博物馆数据的全面资产化,使数据资产管理贯穿数据“采、存、管、用”等整个生命周期全过程,并逐渐通过运营手段完善数据管理制度和规范,保障数据资产的高效输出和循环落地机制,形成数据资产管理闭环。通过一个持续和动态的全生命周期管理过程,使数据能够为“智慧博物馆”建设提供源源不断的动力。再次,通过标准体系的建设,使得博物馆内部、博物馆之间可以进行数据的交互,彼此共享建设成果。

(三) 建立管理平台,数据互联互通

根据博物馆目前应用系统和数据的现状,结合实际需求,利用云平台、大数据、Hadoop体系架构等技术,建设一个支撑多源异构数据采集与汇聚、存储与组织、分析与挖掘、治理与管控、展示与应用等技术的支撑平台。智慧博物馆建设是一项非常复杂的工程,大数据管理平台的建设也非一时之功。首先,可以通过核心业务的示范性应用带动大数据管理平台的建设。针对业务数据如藏品知识库、观众主题库等,通过建立数据中台将数据进行统一和集中的管理,横向打通各个业务系统的壁垒,实现数据资源的互联互通。其次,搭建基础的智慧博物馆“云平台”,有关云平台支撑硬件采购要量体裁衣。因为硬件的成本在不断下降,没必要在一开始就投入大量经费,遵守“适度超前,弹性扩充”的原则,只要架构设计合理,后期进行硬件的扩充是非常容易的。

(四) 数据共享开放,确保数据安全

应逐步推动建设跨部门、跨区域、跨行业“物理分散、逻辑互联、全国一体、交互共享”的云平台。首先,在智慧博物馆建设过程中,应加强交流互通,共享平台架构、系统接口、数据开放共享标准、安全规范等内容,保障和促进智慧博物馆有序、健康、可持续发展。其次,鉴于我国博物馆发展理念,文博行业数据的开放不能一蹴而就,应该分级分类分权限,确保数据的安全。再次,大数据时代用户隐私数据的安全是一个重要问题,需要从等级保护、安全设备等多个方面进行考虑。

(五) 资源跨域链接,数据融合创新

博物馆实现数据-信息-知识-智慧的转变,需要借鉴互联网共建共治、众包等理念。对于一家博物馆来说,即使将海量、多源、异构的文博领域数据,通过自然语言处理、大数据分析技术等组织起来,也很难形成能够支撑文物和博物馆各项业务需求的知识表达和呈现体系。因此,应通过标准化的接口与行业机构,包括国内外博物馆、图书馆、档案馆、文物研究机构等相互关联,在更大范围内实现知识的跨域链接,构建文物知识图谱体系,以数据服务的方式把完整、多维、准确、具有权威性的数据开放共享,推动知识图谱、数字人文领域的研究等,更好地实现博物馆教育和研究功能。

大数据时代,我们亲身经历信息技术为社会带来的变革,这是一个数据无处不在、网络无处不在、计算无处不在,软件定义一切的时代。博物馆亦不能置身事外,智慧博物馆建设是必然选择。智慧博物馆作为一个以核心业务需求为导向,创新科技发展的有机体,必将随着技术的发展,不断迭代演进,为博物馆可持续发展提供源源不断的创造力。

猜你喜欢

藏品文物博物馆
文物的栖息之地
抱朴斋藏品
李杰森藏品
谭礼藏品
博物馆
文物的逝去
文物超有料
罗妍妍藏品欣赏
露天博物馆
文物掉包案