重大突发公共事件数字文献保存和服务策略*——东日本大地震档案建设启示
2021-09-13李晓彤
温 泉 李晓彤
(中国国家图书馆 北京 10081)
1 背景
重大突发公共事件往往会严重威胁人民群众的生命安全,给经济社会的发展形成巨大冲击。伴随事件的发展,各种公开信息、文件档案、影像资料、新闻资讯等资料不断积累,构成社会发展变迁的历史记录,承载着公众的共同记忆,做好我国重大突发公共事件数字文献保存与服务也是公共图书馆应有之义。我国公共图书馆也开展了一些专题文献保存和服务项目,如2003年非典型肺炎疫情、2008年汶川大地震、2020年新型冠状病毒肺炎疫情等重大突发公共事件等专题文献征集建设,但是也存在征集工作缺乏统筹、资源内容特色不突出、缺乏长期有效的资源服务等问题。2011年日本东北部太平洋海域发生强烈地震并引发巨大海啸,给日本社会带来重大影响。同年11月,日本总务省联合国立国会图书馆(以下简称“国会馆”)牵头启动“东日本大地震档案”项目建设,收集整理了地震相关的文献档案,将不同机构保存和建设的地震文献资源进行整合揭示,至今依然不断扩充资源内容,为公众提供了系统完善的地震文献资料。这一项目的建设经验能给我国公共图书馆开展相关数字文献建设带来一些启发。
2 东日本大地震数字档案建设情况
2.1 建设背景
2011年3月11日,日本东北部发生9.0级大地震。为了更好地推动灾后重建与复兴,日本内阁当年5月提出《复兴构想7原则》,原则第一条明确提出“将大地震的记录永久保存,用以为广大学术工作者提供科学分析的依据,同时将地震留下的经验教训传递给下一代”[1]。7月,东日本大地震复兴对策本部发布的《东日本大地震复兴基本方针》进一步明确要建立地震、海啸、原子能灾害等记录和教训的收集、保存、公开体制,推进地区情报、书籍、影像等资料的数字化,构建资料保存和利用平台[2]。在系列政策的支持下,日本总务省联合国会馆启动了东日本大地震数字档案基础构建项目,并建成东日本大地震数字档案门户网站。
图1 东日本大地震数字档案基础构建项目实施路线图
2.2 东日本大地震数字档案基础构建项目
2011年11月,日本总务省联合国会馆启动东日本大地震数字档案基础构建项目,主要任务包括制定东日本大地震相关记录、文献数字化资源的收集、保存、公开规则,同时将分散在互联网上的相关数字文献进行整合,建立可以一元化检索、利用的门户网站[3]。
(1)开展实证试点研究。日本总务省选取了青森、岩手、宫城、福岛4个重点受灾地区已建设的5个地震资源项目开展“实证调查”,进行构建数字档案库的试点研究,研究成果为开展更大范围的震灾数字档案建设提供实验和论证,同时所建设资源的元数据在东日本大地震数字档案中整合揭示。通过这五个实证研究项目,总务省制定了《与震灾关联的数字档案的构筑实用指南》,指导全国开展档案建设工作。
(2)建设东日本大地震数字档案门户网站。总务省联合国会馆逐步搭建用于收集、保存并提供资源服务的门户网站。期间,由国会馆制定了数字档案收集、组织、保存、服务的策略,建立了资源收集的协商机制。2013年3月国会馆东日本大地震档案门户网站开通服务,并由国会馆牵头开展常态化资源收集、保存、揭示工作,并持续扩充资源内容。
2.3 数字档案内容
国会馆制定的《东日本大地震档案建设项目的基本方针》明确了档案材料的主题和形式,具体内容如表1所示。
表1 国会馆东日本大地震档案资源收集主题与形式[4]
2.4 数字档案的收集
东日本大地震复兴对策本部发布《东日本大地震复兴基本方针》后,实际上各类社会机构已经分头开展了地震资料的收集和保存。针对各类机构分头收集、资源分散保存的情况,国会馆一方面开展自主收集,另一方面协助其他机构开展收集,并开展元数据的整合揭示。
(1)自主开展档案资源的收集。国会馆一方面依托出版物缴送制度、在线资料收集制度等全面收集相关资源,一方面积极接受来自社会各机构、团体、个人捐赠或授权的资源。对于难以保存或特别重要的数字资源,国会馆全面收集对象数据和元数据;对于纸质资源开展数字化保存,并积极获取资源的复制权、修改权。
(2)协助其他机构开展档案保存。国会馆提出了三种收集保存方案:国会馆进行收集保存、机构自主收集保存、其他归档机构收集保存。当遇到机构解散、其他归档机构运营困难等问题时,则会转由国会馆负责后续工作。
(3)对其他机构保存的档案资源,开展元数据的对接和收集。如果其他机构已经构建资源检索系统、元数据信息系统,国会馆首先采用系统对接的方式,实现资源揭示;如果相关机构没有相关系统,则将资源的元数据进行归集保存,实现资源揭示。
2.5 数字档案的组织、保存与提供
收集档案资源的同时,国会馆进行了资源组织、保存工作,并在数字档案门户网站上提供访问。
在资源组织方面,国会馆对本馆收集的资源进行常规组织管理,对其他组织保存的资源,原则上尊重原收藏机构制作的元数据,同时补充制作日期、地点、制作人员、权利相关者等信息。如果其他组织保存的资源没有制作元数据,则将收藏单位、制作时间、内容概要、创建过程作为数据项进行元数据著录。
在资源保存方面,国会馆对数字资源在信息系统中登记注册,进行备份存储,开展长期保存。对于纸质资源,国会馆整理了资料目录,并进行数字化转制,同时根据实际情况选择适合的空间进行保存[5]。
在资源提供方面,东日本大地震数字档案以数字形式为主,特殊情况下提供相应的实体资源。基于资源的权限情况和保护个人隐私的考虑,国会馆规划了互联网公开访问、馆内局域网访问、申请获取等多种服务方式,分层分级地进行资源揭示。
项目建成的数字档案门户网站提供了一站式的检索平台,支持主题词检索、分类检索、全文检索等功能,利用地图、时间轴等可视化方式展示资源②,实现了内容的深层揭示。近年来,门户网站陆续补充了日本其他地震档案资源,包括2004年新泄中越地震、2016年熊本地震等内容,2014年4月至2021年3月期间,门户网站可检索到的资源增加了186万余条数据③[6]。截至2021年3月,东日本大地震数字档案数据门户网站已对97个不同来源的资源库或档案资料集进行了整合揭示,共收录日本地震相关文献元数据约448.6万条,其中文本资料155.5万余条,照片98.9万余条,Web网站13.7万余个,音视频1.9万余个,其他类型数据178.4万余条。
2.6 东日本大地震数字档案建设特点
(1)有力的政策统筹。日本出台了一系列面对地震灾害的复兴法案和政策,从内阁提出《复兴构想7原则》,到颁布《东日本大地震复兴基本法》,成立东日本大地震复兴对策本部,并发布《东日本大地震复兴基本方针》,相关的政策完备具体,有效引导并保障社会各界开展档案保存。其次,地震数字档案的建设由总务省联合国会馆开展,有较强的统筹协调能力,有专业的资源保存组织能力。
(2)整合社会各界资源。在有力的政策统筹下,日本社会各类机构广泛参与、共同建设东日本大地震数字档案。从《东日本大地震数字档案收集实施计划》可以看到,建设初期就已经对全国各个机构所建设的资源纳入保存和服务体系进行规划,实际建设中也正是靠国家机关、图书馆、大学、研究机构、媒体、民间企业及非营利组织和志愿团体等多个机构完成了对东日本大地震各项资源的梳理和保存[7]。项目最终的建设成果也为社会各类机构所共同利用。
(3)持续开展建设。国会馆将东日本大地震数字档案库视为一项长期建设。2013年投入使用至今,依然在不断推动项目发展。一是不断征集保存档案资源,每年3月会定期发布公告,通过合作的视频、图片、专题网站面向社会公众进行资源征集[8]。二是持续扩大社会合作,在门户网站投入使用后,七年间与30余个数字档案项目或机构达成新的合作协议。三是注重档案利用和研讨,围绕档案资源充分利用、档案建设经验总结等内容,开展东日本大震灾档案研讨会、“东日本大地震相关书籍、照片整理与保存讲习会”等学术研讨及宣传。
3 我国重大突发公共事件数字文献保存与服务的现状与问题
3.1 保存与服务现状
近二十年来我国经历了多次重大突发公共事件,我国公共图书馆开展的相关数字文献建设主要集中在2003年非典型肺炎、2008年汶川大地震和2020年新型冠状病毒肺炎三个主题。
(1)2003年抗击非典型肺炎。2003年共有8个图书馆开设过抗击非典相关专题页面,其中较为成熟的是国家图书馆依托全国文化信息资源共享工程制作的“抗击非典,珍爱健康”专题,其中既有抗击非典最新研究成果、防治政策法规、非典型肺炎专家信息、预防知识,也整合了国家图书馆馆藏的历史国内外重大疫情及防治资料。其他图书馆的专题内容以非典相关政策法规、医学知识等内容为主,上海图书馆、天津图书馆、浙江图书馆还提供了抗击非典电子图书。总体来说,非典时期图书馆的文献搜集与服务内容比较简单,孙继林对当时国内图书馆抗SARS网页的建设情况进行了跟踪,认为大部分专题网页都是简单的网络采集编辑,没有挖掘自己的馆藏[9]。目前,这些专题页面均已停止服务或无法访问。
(2)2008年汶川大地震。国家图书馆和中国图书馆学会开展了相关文献资源的建设。其中,国家图书馆网络资源采集项目收录了汶川大地震专题,收集了来自多个媒体的13个汶川大地震专题网站,通过馆内局域网提供服务。中国图书馆学会从地震发生次日起即开始在其官方网页发布“重要媒体对5·12大地震及灾后重建的专题报道”[10],但目前页面无法追溯。此外,2008年公共图书馆界出现了对专题文献搜集的讨论,侯彤在《汶川地震专题文献资料的搜集工作》中呼吁四川省图书馆应将汶川大地震产生的海量文献进行搜集、整理、保存,以便今后更好地研究、借鉴、利用[11]。
(3)2020年抗击新型冠状病毒肺炎。通过对省级以上公共图书馆的调研发现,全国共有22家图书馆面向社会公开征集疫情相关文献,所收集的文献内容形式丰富,包括正式出版物、政府公开信息、内部资料、视频、照片、录音、手稿、书画墨迹等。80%的图书馆提出将所征集文献纳入馆藏,少数图书馆规划了专题数据库建设和服务,其中南京图书馆提出“进行数据库加工后纳入地方文献管理”,贵州省图书馆提出“建立贵州省抗击新冠肺炎疫情专题特藏”,湖北省图书馆提出“建成抗疫专题数据库”。随着征集工作的开展,河北省图书馆、广西壮族自治区图书馆、重庆图书馆等已经上线展示所征集的资源,但还未形成专题资源库。另一方面,一些图书馆挖掘现有馆藏文献,同时整合商购数据库的抗疫资源,对各类文献有序组织,形成了文献专题服务,如国家图书馆抗击新型冠状病毒肺炎疫情资源专题、浙江图书馆的“书香抗疫”资源专题。
3.2 存在的问题
我国公共图书馆对于重大突发公共事件的文献保存与服务意识不断加强,建设持续探索,但仍缺乏长期性、系统性的规划,一些具备历史价值的专题文献逐渐流失、服务停止,主要存在三个方面的原因。
一是业内相互独立,业界外合作偏少。一直以来,我国重大突发公共事件的文献征集与保存由各馆独立开展,所征集资源的范围、内容、类别有所不同,对资源的数字化加工及服务的策略也各不相同,存在缺乏统筹、服务分散的问题。同时,国家档案局、国家文物局制定了本行业相关的档案和见证物保存政策[12-13],但跨行业的社会合作还未能开展。
二是重视文献征集,忽视资源组织和揭示。有些图书馆把征集作为宣传展示活动,远离了图书馆的核心职责,有的图书馆征集内容没有组织加工,在网页上简单展示,资源极易流失,缺乏图书馆应有的文献组织。
三是文献保存和服务持续时间短。很少有图书馆将此类文献建设作为特色文献建设的长期工作,实际上,因没有持续开展文献收集和组织、图书馆数字资源平台升级等原因,导致资源内容质量不高、资源服务停止现象屡见不鲜。
4 我国重大突发公共事件数字文献保存和服务策略
通过前文分析,我国公共图书馆开展重大突发公共事件数字文献建设,既要借鉴东日本大地震数字档案建设的可取之处,也要根据我国具体情况选择合适的策略。
(1)行业统筹分工。从东日本大地震数字档案建设可以看出,全国层面出台重大突发公共事件文献保存的政策会极大推动工作的开展。如果文化和旅游部或者更高层面出台数字文献资料保存政策,会有力推动工作的开展。其次,明确数字文献保存的牵头机构及其责任,有利于推动数字文献保存。按照影响范围,重大突发公共事件可以分为区域性、全国性、国际性,对于影响全国的重大突发公共事件,可以由国家图书馆牵头开展相关工作;如果是区域性突发公共事件,可由省级图书馆牵头开展相关工作,涉及多个省份的也可由相关省级图书馆联合开展工作。
(2)确定选题内容。公共图书馆开展重大公共事件文献建设,首先要慎重选题,一是要考虑选题能够有效服务于本地社会发展和经济建设[14],二是要考虑自身文献建设重点和所服务对象的需求[15],结合本馆实际情况开展。结合我国实际情况,自然灾害类、公共卫生事件类重大突发公共事件较为适合作为文献建设选题,相关文献的建设对当地社会发展有多重意义,公共图书馆应提高对此类文献建设的认识。
(3)持续开展收集。公共图书馆文献收集应遵循“针对性、整体性、系统性、真实性、专业性”的基本原则开展。收集的内容一定要突出图书馆的文献特色和信息服务特色。内容形态上,开展文献的收集首先以数字内容为主,同时兼顾实体资源,对实体文献进行数字化加工和保存,无法加工转制的实体资源可以通过著录元数据实现数字化检索和揭示,丰富文献建设的内容。收集方式上,可通过文献入藏、网络资源采集、接受捐赠、面向社会的专题征集等多种方式收集。收集策略上,可以采取“先急后缓、先主后次、先易后难”的策略,以避免相关文献的流失。此外,重大突发公共事件的爆发期、高潮期、缓解期、消退期,不同阶段都会产生数字文献资源,公共图书馆应长期持续进行收集,并开展对关联事件文献的扩展收集。
(4)加强社会合作。图书馆以外的社会机构也很重视突发公共事件资料的保存,包括各级党组织和政府、档案馆、博物馆、应对突发公共事件的行业机构、各类社会团体和民间组织等。一方面图书馆应面向不同的机构主动开展合作,条件允许的情况下复制其建设和保存的数字文献,或者以开放检索接口、元数据归集的方式实现其数字文献的整合揭示。另一方面,对社会其他机构开展的文献保存,图书馆应发挥资源组织、文献组织的专业优势,协助制定数字文献的保存、加工、著录等通用策略或建设指南,协助开展数字文献保存。
(5)做好资源组织与服务。重大突发公共事件文献建设的两个重要环节是收集与组织,收集决定了资源的规模和内容,组织影响资源揭示及服务的效果[14]。公共图书馆自建文献资源有着分散存储、去中心化的趋势,其他机构建设的数字文献存在无法复制保存的可能性,因此应通过制定资源组织规则,按照一定的元数据标准,整合汇集不同来源的数字文献,通过门户网站的形式,向社会公众提供文献资源的在线查询和获取。同时,图书馆应充分利用技术手段,形成与图书馆其他馆藏资源的关联揭示,通过关联揭示让文献资源及服务增值,突出图书馆文献特色。
(6)注重版权保护。开展重大突发公共事件数字文献建设要尊重并保护著作权,避免法律风险。图书馆面向社会征集的资源,包括个人和机构制作或保存的文献资源,都要明确文献的权利状态。在征集过程中应当积极争取文献复制权、改编权、信息网络传播权,同时签订版权转让协议。在此基础上,根据不同资源的权利限制,制定不同的访问策略,提供互联网公开、馆内局域网服务。
5 结语
重大突发公共事件所产生的文献资源具备较强的文献价值、史料价值、社会价值,相关的文献保存能够记录历史经验,有助于事后重建和应急预防,能够开展学术研究和社会教育。我国图书馆界应重视重大突发自然灾害类、公共卫生类事件的文献建设,并将其作为一项长期文献建设开展,通过内部统筹和社会合作,建成图书馆的特色馆藏,开展长期的数字化服务。
注释:
① 引用:河和美惠国立国会図書館における東日本大震災アーカイブの取組み (特集 災害と図書館)。
② 2016年新版门户上线,取消了地图、时间轴资源展示。
③ 2021年3月数据由作者在东日本大地震数字档案门户检索得出,共计448.6万余条;2014年4月数据自马成芬, 侯玮青的《日本国立国会图书馆东日本大地震数字档案评介》中“截止到2014年4月2日,可检索到的数据近262万条”。