APP下载

重大公共事件的档案资源开发与利用:以可视化为例

2020-12-28刘贞伶刘雨贺

兰台世界 2020年9期
关键词:档案资源可视化

刘贞伶 刘雨贺

摘 要 重大公共事件中形成了大量具有保存价值的档案资料,这些档案资料既有助于防控工作的高效开展,也对以后的工作查考、历史研究、经验借鉴等方面具有重要的价值。档案部门需要及时对档案资源进行开发和利用,而可视化在这个过程中扮演了重要的角色。通过分析国外重大公共事件中可视化技术在档案领域的开发与利用,立足于我国档案资源可视化应用的现状,指出档案管理流程中存在的问题。并从三个方向提出了应对举措:提升可视化技术应用意识、拓宽可视化技术应用范围和强化档案内容层深度加工,以期为后疫情时代下的档案资源可视化提出建设方案,也为我国的档案工作提供方向。

关键词 档案资源 重大公共事件 可视化

档案是信息的权威来源[1],一种具有独特价值的信息资源[2],因此,在社会面临重大公共事件所带来的危机时,人们首先会查找过往积累的档案资源以从中寻找应对办法;同时,也会将应对当前事件过程中的社会活动记录下来形成档案,为未来的重大公共事件备以查考。然而,在进入大数据时代的今日,以传统方式对此类档案资源进行开发利用,如编研为文字成果或在实体档案馆数据库中提供检索等常规方法,已愈发不能满足人们对档案的利用要求。如何对重大公共事件的档案资源进行有效开发与利用则是迫切需要解决的问题。19世纪出现的数据图形可视化方法为解决这一痛点提供了思路。

一、国外对重大公共事件档案资源的开发与利用

1.可视化技术协助档案资源的内容再开发。无论从形成时间还是体量层面看,依托文字呈现内容的档案资源都是历史的主流。但文字在帮助人们高效记忆的同时,也因其高度抽象性使档案文本不再直观[3]。而重大公共事件牵涉人员众多,所形成的档案资源也体量巨大,文字的抽象成为分析现象背后问题的首要难点。可视化正是解决这一难题的捷径。

1854年,英国伦敦宽街爆发霍乱疫情。医生约翰·斯诺遍览患者病案后,怀疑疫情爆发源于该地被污染的公共水泵。为证明结论,他在一张该街区地图上标明水泵位置,又结合收集的患者病案及住址,在地圖上以黑色填涂了每一病历的所在地,这就是留名可视化技术史的“伦敦霍乱地图”。最终通过这张图他发现,越是靠近水泵,死亡病例越是密集,说明霍乱疫情的爆发与被污染的水源存在极大关联。约翰·斯诺以此图为依据向教区当局建言,使得第二天当局采取换水泵手柄措施。这一事件也被视为流行病学调查的起点,在疫情防控的历史上占据了重要位置[4],而将病案加以可视化以探究传播源头的研究方法在其中发挥的作用不可小觑。以数据地图的可视化方法呈现档案资源的情况并不少见,如此次新冠肺炎疫情中各大媒体均有绘制疫情地图,利用深浅不同的颜色体现各地区感染人数的多少,这一方法有效避免了文字不直观的负面影响,既使非专业人士一目了然,快速把握总体情况,也帮助专业人士探究文字、数字背后隐含的规律,从而化解突发事件危机。

同样是利用可视化技术二次开发档案资源,美国9·11国家纪念博物馆提出了另一种呈现思路。该馆是为悼念并铭记在“9·11”恐怖袭击这一突发事件中的遇难者而设立的纪念性质博物馆。馆内展品不仅有大量当事人实物档案,还有幸存者、遇难者家人、消防员、双子塔工程师等多角度的口述历史档案。为充分发挥其价值,博物馆综合多种可视化手段为参观者还原2001年9月11日当天的灾难现场。例如,馆方在整合多方口述档案及新闻报道的基础上,借助可视化技术制作了可互动的时间线[5]。参观者可以按时序浏览9·11当日与袭击行为相关的所有事件,从早上5:45劫机者通过安检到晚上10:30救援人员仍在现场搜救为止,所有重要节点都以图文的形式分布在时间线两侧,而且可以点开某个时间点查看详情,便于观者从多方报道中理清恐怖袭击的前因后果。同时,馆方仍持续收集11日之后该突发公共安全事件档案,跨度从事发第二天大批志愿者来到现场支援一直到2014年5月15日博物馆第一批客人来访为止,同样以图文并茂的形式沿时间线呈现了事件的后续处理情况。以时间线的可视化方法再开发档案资源,不仅可以帮助初次听闻的用户快速掌握突发事件起因及结果,并且便于人们事后梳理整体发展脉络,为进一步剖析事发根源提供高度序化的档案材料。

2.可视化技术提供档案资源的全时空利用。档案展览是档案对外利用的重要实现途径之一。即通过展览,为公众了解历史上的重大公共事件提供直观的途径。目前国外档案馆、博物馆等文化事业机构采用的展览方式可以分为线下与线上两类,线下即最常见的“实体布展+到馆参观”方式,线上则主要是专题网站与虚拟展馆两种。后者相较于前者,从选题选材到正式开放的筹办时间较短,并且可以为全球提供24小时的开放利用服务,消除了时空上的限制,这一优势在线下展馆无法开门营业的特殊时期愈加凸显了价值。

美国国家档案馆目前开设有“1906年旧金山的地震与大火”(The 1906 San Francisco earthquake and fire)和“致命病毒:1918大流感”(The deadly virus:The influenza epidemic of 1918)这两个以突发公共事件为题材的线上展览,参观者可随时随地在对应的专题网站上查阅图像档案及文字说明[6]。这种形式并非美国国家档案馆独有。公共调研中心、石英财经网、美联社三方联合出品的专题网页“死于飓风玛丽亚”(Hurricane Marias Dead)是可视化网站的典型应用实例[7]。该网站是为报道2017年飓风玛丽亚在美国造成的伤亡情况搭建的,呈现内容全部源自前期采访所形成的口述档案及新闻报道数据库。在行文上使用了时间线叙事,融入了多种交互模式,用户在移动鼠标的过程中便可浏览完整篇报道。内容呈现上以条形图、比例面积图等可视化图形配以文字说明,阅读体验新颖而直观。

同为线上展览方式之一的虚拟展馆也不乏应用。上文已介绍过的9·11国家纪念博物馆为不能到现场参观的人准备了可互动的游览视频[8]。视频中以三名参观者为导引,观看者视角随三人而动。视频在重要展品出现时设置停顿点,讲解员会即时进行说明,在遇到岔路的时候还会给出两个方向的选项,可以由观看者自己选择去哪边游览。但为保证参观体验的完整性,不论如何选择,最终都会在引导下走完全馆,实现与线下观展水平相差无几的在线“云参观”。

以可交互网站及视频的形式提供档案资源利用,最显著的优点就是不受时间地点的限制,全球对主题有兴趣的用户都可以立即获得利用服务。而搭建专题网站与建立虚拟展馆的服务方式则各有千秋。专题网站是经过专业人员收集、查阅、分析并汇总大量档案资料,在此基础上得到的体系化的档案编研成果,旨在为用户提供系统全面且简明易懂的利用服务;而虚拟展馆是对线下实体展馆、实体档案进行的完全线上复原,目的是还原线下参观体验,使用户更有沉浸感。综合而言,两种方式都降低了档案利用门槛,扩大了用户覆盖面,做到全天候为全球提供利用服务,提升了档案资源的利用效率。

总而言之,档案资源在提供开放利用的阶段内,个人与组织都可以采用各种方式对它进行多次开发与利用,而且在此期间对档案资源的开发利用越多,其价值越能得到实现[9]。因而在使用传统开发利用手段时,不妨加入可视化技术进行二次甚至于多次开发,从而提供更为全面、周到的利用服务。

二、国内对重大公共事件档案资源的开发与利用

在新冠肺炎疫情期间,各省市档案馆陆续开展了档案收集整理工作,明确了征集范围、方式和时间等,向社会征集新冠肺炎疫情有关的资料。档案馆通过开展对归档材料的收集工作和对档案的规范整理与安全保管,确保了档案资源的真实、完整、可用。在收集了这些资料后,大量档案面临着开发与利用的问题,尤其是在新冠肺炎疫情下的档案资料开发和利用的难度增加。而经过实践发现,可视化领域与档案的开发利用是可兼容的,具有极强的待挖掘潜力与广泛的应用前景。

1.结合可视化技术开发档案产品。重大公共事件下的档案产品开发离不开媒体部门的参与。江苏省档案馆与扬子晚报/紫牛新闻联合推出开放式全媒体在线档案产品《战疫·苏史记》,公众可以通过APP客户端或者网页进行在线阅读。该产品分为“纪”“表”“传”“志”四个模块,展现了江苏省在抗击疫情过程中的重大事件时间线、疫情数据变化等情况[10]。此外,纪录片中也充分利用了档案的历史记录功能,例如,《山河无恙——影像中国的疫情档案》中结合了甲肝、血吸虫病、鼠疫、流感、非典等重大公共卫生防疫相关的历史档案,为公众进行卫生防疫的解读;《见证》将载入史册的42000多张国家影像档案呈现给公众,引起公众的强烈共鸣;《5·12汶川特大地震亲历者大型口述史》将57组亲历者口述档案贯穿于影片,让公众聆听历史,铭记历史。

2.结合可视化技术创新档案服务。一方面,线上档案展览的方式打破了时间和空间的限制,将馆藏资源进行可视化呈现。清华大学通过线上档案展览的方式,举办了“窗口2020——疫情时期图像档案展”,公众可以通过网站、微博、直播APP等方式参与云展览的开幕式直播。该展览分为“空间的窗口”“相识的界面”“探寻的通道”“展示和表达的舞台”四类主题,展示了疫情期间的真实影像,充分发挥了档案的社会记忆功能,为公众提供了便捷、高效的服务[11]。另一方面,随着互联网技术和智能终端不断发展,电子健康档案可视化服务也不断发展。电子健康档案是个人在健康活动中形成的电子化历史记录,通过可视化的方式对电子健康档案进行多维度的分析与展示,可以为突发公共事件的应急指挥提供科学的决策依据。例如,南京市疾控中心与北京大数医达合作,将疾病与监测预警系统与医院的电子健康档案相连,同时对电子病历档案和疾控中心历史档案进行分析,给出了疾控决策的参考数据[12]。

三、重大公共事件下的档案资源可视化开发利用方案

1.提升可视化技术应用意识。做好档案资源可视化方法的开发利用,少不了开发利用观念上的转变与意识上的重视,并且这样的意识不应该局限于开发与利用两个环节,而是覆盖到档案工作的每一步骤。比如,作为源头的收集工作。档案收集是各档案部门、组织工作的首要环节,这一工作的质量直接关系到后续开发、利用的完成质量。在互联网远未普及的年代,文书档案尤其是公文档案已是收集档案中的大头[13]。即使是大跨步迈入信息时代乃至于大数据时代的今天,档案收集门类仍显单一,收集途径也并不丰富,多为档案部门被动接收[14]。随着观念上“国家档案观”向“社会档案观”转型[15],档案来源结构上公共档案的中心地位受到冲击[16],两方面影响叠加下的档案收集工作也吸纳了更多来自人民的记忆与声音。但不论档案资源主体如何变化,仍以大量文字材料作为内容主体及呈现方式。然而,在来源更广、形式多样、数据暴增的当下,这样的收集重点已不再适应环境,如果仍坚持以文字材料为主体的收集模式及利用呈现方式,将会逐渐造成用户利用的极大困难。

在疫情期间,全国各地多个综合性档案馆均意识到,在收集来源上要面向“社会各界”,载体上涵盖声像档案与网页档案,多种多样[17]。这是收集方向极其正确的一大步,但仅强调对其他形成者的声像档案的收集,仍然是一种被动的工作方法。并且,重视声像档案资源并不等同于注重对可视内容的收集,在对含有可视化内容的档案资源收集上仍是忽略的。另外,在收集成果的呈现上仍保持着以文字为主体的习惯,并未采用可视化方法对档案内容进行发掘。

在普通人面对大量数据难以及时吸纳其中有效信息的时代背景下,可视化内容因其直观的特点,相较于纯文本内容更易抓住重点并加以理解,因此也更具收集、整理、开发与利用价值。而疫情期间值得我们特别重视的、结合可视化技术的档案资源也为数不少。比如,收集过程中注意捕捉社会各界人士绘制的疫情发展趋势图、新冠患者的病症主题词图、出现症状与就诊时间差的频次图等图表,不仅有利于全面记录人民参与的抗疫过程,更有利于未来应对类似突发事件时的快速利用。同时,档案部门及组织也可以化被动为主动,借助可视化手法加速对档案的开发。比如,对于刚完成收集的大量疫情档案,就可以使用可视化方法及时统计并公开各类相关档案的收集情况。以某省各市关于疫情部署的文件为例,档案部门既可以绘制文件增速折线图以体现部署效率,也可以针对派出医护人员奔赴一线的公文进一步开发,绘制出各地征调医护人员的数量条形图及支援地点的地区分布图,使本地民众获得更多参与感、使命感。此类可视化应用在技术水平上要求并不高,使用Excel及一些線上可视化工具即可快速完成绘制,增多了档案开发方式的同时也提升了档案利用效率。而这一切都首先需要档案部门、组织对可视化方法及其价值的重视。

2.拓宽可视化技术应用范围。纵览以往的档案资源可视化开发成果,我们不难发现,绝大部分实践都发生在实体档案领域。比如,利用虚拟现实技术,通过互联网平台搭建一所虚拟展馆及其三维互动展览室,大小装潢都与线下的实体档案馆相同。随着鼠标移动步入各展览室,与线下参观档案馆编研成果展无异,实现真正的“云参观”“云利用”。还有基于物联网技术的实物档案智能管理系统的可视化。这一可视化技术通过给实物档案贴上电子标签,将档案与互联网连接起来,主要实现的是实物或实物档案定位与跟踪功能,更进一步还有保管环境自动感知并调节、摘要信息自动存储功能等[18]。这种方式不可谓不好,但是可视化的技术仅限于虚拟现实技术或者物联网技术,可视化的对象仅局限于实体档案,在一定程度上同样限制了普通民众对档案馆及档案工作的理解。

对于这一问题,我们需要突破对可视化技术应用对象的固有认知,拓宽档案领域的可视化技术应用范围。可视化技术除常见的制作可视化图像与视频之外,还有可互动的网站搭建、虚拟现实与增强现实技术。这些技术都可以与数字档案进行融合再造。

以新冠肺炎疫情期间的档案工作为例。一方面,在疫情期间,档案馆从社会各界的形成者处收集来多形式、多载体的档案资源,为适应数字化需要会将其全部录入内部档案管理系统。如果不利用可视化技术进行加工的话,用户利用这些档案将与以往没有任何不同,都是来到线下档案馆进行查档,用计算机登录检索系统一条条记录或者一张张图片点击进行查看。另一方面,由于疫情原因,当下各地档案馆多是闭馆状态,仅能提供电话咨询服务。仅个别建有开放档案数据库、线上阅览编研成果的档案馆还可提供与平日相同或相近水平的档案利用服务。也就是说,形式多样的疫情档案不能及时对公众开放提供利用服务,即使立刻编研,成果也不能快速推出。同时,过往的开放档案、编研成果也不能全为公众所用。对于普通用户来说,总体上利用难度大大增加。但若加上可视化技术的配合,利用情况将会截然不同。虚拟现实和增强现实技术暂且不说,可以与三维可视化技术结合,对数字档案进行三维影像制作,开设线上展室,实现“云参观”。对于新接收的疫情档案,可以参考前文提到的国外诸机构做法,为其建立单独(子)数据库,并利用该数据库进行互动型网站搭建。比如,挑选疫情档案中的榜样事迹,以人物为主线进行梳理,呈现模范故事。用户进入网站界面后向下滑动,人物故事以时间线逐步展开,或者通过点击鼠标出现问题框,如“某月某日,当时你正在干什么”“接到赴武汉消息时,你有什么想法”等问答方式一句句给出信息,以与人物对话的方式还原事件经过,在提升用户利用兴趣的同时,也降低了利用难度。网站建设水平不高的档案馆可以选择仅开放数据库,但需辅以多种可视化图表来整合大量数据,或利用可视化技术制作类似知识地图的导航图,方便用户在没有工作人员的帮助下也能快速获取所需信息。

3.强化档案内容层深度加工。可视化对象的局限可以说是档案资源利用方面发生的问题,而可视化接合面狭窄则是出现在档案资源开发环节的盲点。无论是政府还是企业中的档案部门,对可视化技术的理解往往是对统计数据的可视化,认为将繁杂的数据变成简洁明了的柱状图、折线图、饼图,乃至于更“高级”的泡泡图、主题词图就是可视化的全部内涵,所以常常将可视化技术与政府部门或企业内部使用的档案管理系统结合,把平日档案工作中收集著录的档案主题做成主题聚类图谱[19],整理统计的利用数据呈现为各类可视化图表,将档案温湿度环境管控表现为各类可视界面等。除此之外,还有一种结合方向是将实物图片嵌入档案管理系统以方便查阅、利用。

但其实可视化技术可以与档案工作结合的需求点远不止如此。对可视化技术的应用可以突破“用于档案内部管理系统本身”的概念限制,更深入一步到达档案内容层面,对内容直接进行可视化。当下各档案部门对档案内容的处理多停留在数字化阶段,即通过人工录入或计算机自动标引方式对档案文本或图像进行识别和著录。但结合文本可视化技术,档案资源中可以深入发掘的内容空间还有很大。比如,占综合性档案馆馆藏大头的文书档案,不仅可以借助文本可视化中的语义识别和语义关联技术,将同一主题但来自不同单位的公文聚合,做出可视的关联网络,在此基础上,还可以参考叙事性文本语义结构化表示方法[20],对公文内容进行标注和分析,从而联系起因果关系与时序前后关系。前者打破归档时采用的分类法对检索的限制,也降低了因主题标注错误而无法检索的风险,后者可以减轻大量文本阅读的压力,提升利用效率。这种方法等同于随需求实时建立专题档案组合,不改变归档时的档号和实际存放位置,并且无需用户逐字逐句阅读即可明了档案间的语义及时序关系,极大地方便了对同一主题有大规模利用需求的用户。

在新冠肺炎疫情期间,这一套方法同样可以用于分析来源于社交媒体的大量档案资源。国内外档案馆对于社交媒体档案资源基本都采取的是“捕获—归档”方法[21],但由于隐私权保护、所有权难以界定等悬而未决的实践难题,至今鲜少见到关于此类档案的进一步利用,一般而言是与普通图片档案相同的处理方法。但此类档案作为舆情分析中的信息来源之一,尤其是有关重大事件的社交媒体档案值得进一步深挖。档案馆可以尽量在不触碰公共与私人权利边界的前提下,利用捕获的文本信息结合语义识别及语义分析方法,生成事件信息实体关联网络图、人物关系图、主题词图等,了解用户间信息传播链和信息获取偏好,深度探索用户需求,即潜在用户有哪些,这些用户更希望获取哪一方面的档案。通过此种可视化方法,不仅丰富了编研成果,而且为疫情期间利用服务的发展方向指明了重点。

新冠肺炎疫情为我国生产生活各个方面都带来了巨大的冲击与挑战,对档案工作而言同样如此。在这一特殊时期,档案资源的开发、利用形式都发生了巨大的变化。因此,档案工作的方式方法也亟待变革,需要加强结合可视化方法。强化档案的收集、整理、开发利用等环节的可视化应用,不仅使疫情档案的归档更加全面,而且增多了档案开发手段,优化了档案利用服务,提升服务效率。充分认识可视化技术在重大公共事件背景下檔案工作中应用的潜力与前景,将有助于档案工作进一步适应当下环境,从而巩固并提升档案工作对保存社会记忆、促进社会发展的贡献。

参考文献

[1]档案共同宣言[J].兰台世界,2010(23):66.

[2]冯惠玲.档案记忆观、资源观与“中国记忆”数字资源建设[J].档案学通讯,2012(3):4-8.

[3]杨光,奕窕.记录媒介演进与档案历史叙事的变迁[J].档案学通讯,2019(4):19-27.

[4]Johnson, Steven. The Ghost Map: The Story of London's Most Terrifying Epidemic - and How it Changed Science, Cities and the Modern World[M].New York City:Riverhead Books,2006:195-196.

[5]9/11 Memorial & Museum.9/11 Interactive Timelines[EB/OL]. [2020-04-30].https://timeline.911memorial.org/#FrontPage.

[6]National Archives. Online Exhibits[EB/OL]. [2020-04-30].https://www.archives.gov/exhibits/exhibits-list.html.

[7]Tori Smith. Hurricane Maria's Dead[EB/OL]. [2020-04-30].http://hurricanemariasdead.com.

[8]9/11 Memorial & Museum.Interactive Museum Experience[EB/OL].[2020-04-30]. https://www.911memorial.org/visit/about-your

-visit/learn-and-explore-home/interactive-museum-experience.

[9]王旭东.论档案文化资源的开发利用[D].云南大学,2013.

[10]战疫·苏史记[EB/OL]. [2020-04-29].https://read.yangtse.com/home/sushiji29/indexn.

[11]清华大学艺术博物馆[EB/OL].[2020-04-29].http://www.artmuseum.tsinghua.edu.cn/cpsj/zlxx/szzt/.

[12] 陈鹏.让大数据为疫情预警——大数据在疾控应用中的方方面面 | 科技战疫[EB/OL].[2020-04-30].https://vcbeat.top/ZTdmZD

NhZmFkODJmOTZlMjQ2MGE2YzUzM2NmZjdjMmE=.

[13]曹湛芳.档案收集工作的问题、意义与制度探索[J].学术论坛,2012,35(12):82-84.

[14]赵彦昌,苏亚云.21世纪以来档案收集研究述评——基于8家档案学类核心期刊的数据统计[J].山西档案,2017(5):43-49.

[15]张斌,徐拥军.档案事业:从“国家模式”到“社会模式”[J].中国档案,2008(9):8-10.

[16]加小双.档案资源社会化 档案资源结构的历史性变化[M].杭州:浙江大学出版社,2019.

[17]夏振华,赵真.加强新冠肺炎疫情防控档案收集工作的思考[J].浙江档案,2020(2):15-17.

[18]陶水龙.大数据视野下档案信息化建设的新思考[J].档案学研究,2017(3):93-99.

[19]杨茜雅.中国联通电子档案数据挖掘与智能利用的研究[J].档案学研究,2018(6):105-109.

[20]宋宁远,王晓光.基于情节本体的叙事性文本语义结构化表示方法研究[J].中国图书馆学报,2020,46(2):96-113.

[21]凌桂萍,耿志杰.國外政务社交媒体文件归档中的档案部门角色及启示[J].浙江档案,2020(3):25-27.

猜你喜欢

档案资源可视化
数据可视化设计在美妆类APP中的应用
画图:数学思维可视化的有效工具
思维可视化
基于GeoGebra的高中物理可视化教学研究
复变函数级数展开的可视化实验教学
复变函数级数展开的可视化实验教学
复变函数共形映射的可视化实验教学
复变函数共形映射的可视化实验教学
高校校史馆建设中档案馆藏资源的作用与开发利用
浅谈档案资源的功能与合理利用