对英国国家档案馆数字出版“一战”士兵日记的思考
2015-05-30杨霞
杨霞
摘要:本文介绍了英国国家档案馆数字出版“一战”士兵日记的基本情况,分析了该项目实施中所呈现的公众参与档案资源开发、基于数字出版的档案众包开发模式、数字化传播建构民众的集体记忆等特点,并提出建立档案工作公众参与制度、将档案网站建成交互式档案开发服务平台、加大馆藏档案数字产品开发力度等建议,以提高我国档案馆档案公共服务能力。
关键词:士兵日记数字出版公众参与档案众包
作为英国政府纪念第一次世界大战100周年活动的一部分,2014年英国国家档案馆开始数字出版“一战”英国士兵的战地日记(以下简称“士兵日记”项目)。这是档案资源开发的一种新模式,它以开放、共享、民主、协同、创新理念为引领,以档案网站为平台提供档案资源,值得我们深入研究。
一、“士兵日记”项目简介
2014年7月28日是第一次世界大战爆发100周年纪念日,英、法、德等国举行展览、学术研讨、缅怀集会等系列活动纪念并反思战争带来的教训。其中,英国国家档案馆推出的“士兵日记”项目是一个创新的众包项目,参与者通过阅读数字化的“一战”士兵撰写的日记,并标注每一页的重要信息来参与这一项目。它吸引了大量公众去阅读士兵日记故事、感受士兵的战地生活。目前已有100万志愿者响应并参与到该项目中。现已完成1/5的士兵日记数字化扫描、著录及网上公布的工作。[1]
“士兵日记”项目是英国国家档案馆(The National Archives)与英国帝国战争博物馆(Imperial War Muse? ums)、著名的众包企业Zooniverse公司合作推出的档案开发项目。英国国家档案馆收藏有每份战争日记以及数以百万计的其他公共记录,并负责维护和向公众开放。英国帝国战争博物馆成立于1917年,记录了英国和英联邦在现代战争中的故事、过程和结果。二者都保有大量的士兵的战地日记。此次联合开展士兵日记项目,将呈现隐藏在每篇日记中的信息,为“一战”的故事提供更加真实的证据。Zooniverse成立于2007年,是世界上最大和最受欢迎的公众驱动研究平台,成千上万的志愿者聚集在一起,旨在通过志愿者的努力和个人能力帮助科学家和研究人员从事大量数据处理工作。为保证项目运行的质量,英国国家档案馆、英国帝国战争博物馆、Zooniverse共同组成了“第一次世界大战百年数字计划学术咨询小组”,由军事、档案、历史、系统开发、网站设计等领域的专家组成,负责指导解答志愿者参与战争日记数字化与标引过程中的各种问题。
士兵日记项目覆盖了150万页的战地日记,英国国家档案馆在2011年开始将士兵日记数字化,2014年开始将这些已经完成数字化的战地日记分批放到网站供公众检索、下载。与此同时,该项目通过网站平台(http:// www.operationwardiary.org/)推出众包任务,借助公众力量阅读日记,捕获日记中的细节、人物、场所、活动等数据,并添加到日记目录的描述中,方便人们查找利用这些在“一战”前线发生的真实故事,梳理出隐藏于日记里的那些鲜为人知的历史事实,更好地揭示并铭记“一战”中每一个生命的故事。据英国国家档案馆介绍,要将所有日记全部完成数字化并上网公布估计需要五年时间,到2019年全世界的人们都可以通过网络看到并获取这些日记。[2]
二、“士兵日记”项目开发的特点
(一)公众参与档案资源的开发
士兵日记项目是公众参与理念在档案工作中的应用与实践。公众参与是一种现代新兴的民主形式,是指政府之外的个人或社会组织通过一系列正式或非正式途径直接参与到权力机关立法或政府公共决策中,它包括公众在立法或公共政策形成和实施过程中直接施加影响的各种行为的总和。[3]此次士兵日记项目采取公众参与档案资源开发的举措,彰显了英国档案管理与服务的新理念:公众不是档案服务的被动接受者,而是档案工作的积极行动者。
档案资源开发一般包括对档案信息的发掘、采集、加工、存储、传输等一系列工作。此次士兵日记项目开发工作主要集中在揭示日记内容形式的检索性信息的采集与加工。参与项目的公众不需要任何专业背景和专业知识,英国国家档案馆提供10分钟的培训短片,指引参与者按步骤完成提取信息和贴标签的任务。公众只要阅读学习培训指南,就可以通过电脑在方便的时间地点上网,进入士兵日记项目众包平台选择对象文本,然后进行阅读核对日记、提取关键数据、创建详细索引、日记页面分类、提交标签成果等工作。
公众参与士兵日记项目开发实现了档案馆与公众的双赢。从档案馆来看,不仅吸引了更多公众关注,使大量志愿者走进档案馆并参与档案馆相关业务工作,而且缓解了人力不足造成的档案资源开发压力,建立了与公众的良性协作机制。其实,英国的“档案志愿者”(为档案事业无偿贡献时间和精力的群体的统称)参与档案馆档案资源开发的相关活动已开展了20余年。[4]此次参与“一战”士兵日记开发项目的响应者众多,体现了英国对档案志愿服务的社会认同,拉近了档案馆与公众的距离。从公众来看,翻阅、分析、整理、标引档案能亲身触摸厚重的“一战”历史,了解到更真切的“一战”历史细节,领略到战争的惨烈与残酷,感受到士兵们面临死亡的焦虑与恐惧,从而更能引发人们对那段历史的深入认识、解读和反思。
(二)采取基于数字出版的档案众包开发模式
众包,是指一个公司或机构把过去由员工执行的工作任务,以开放的形式外包给非特定的(通常是大型的)大众网络的做法。[5]士兵日记项目众包,即从网络招募一群知识多元、数量庞大、工作方式开放灵活的网络用户,来参与数字化档案的阅读、提炼关键信息、添加标签等相关工作。这是利用数字技术进行档案内容的编辑加工,并通过网络传播数字档案内容产品的一种新型编辑出版方式。[6]
士兵日记项目的众包开发过程并不复杂。公众可以按照以下步骤展开工作:第一,注册一个Zooniverse账号,填写用户名、密码、邮箱、真实姓名、承诺,成为注册志愿者。第二,登录网站查看档案馆发布的士兵日记的内容,并选定自己感兴趣的篇目。第三,提取有价值的信息,即将日记内容页面划分成封面页、标题页、命令、信号、地图、叙述报告等不同类型(根据网页顶部菜单的样例来判断),认真阅读并提取日记中的关键信息,以揭示每篇日记每一页所包含的主要信息,诸如日期和时间,地点,叙述性的文字(如人物、级别、名字、姓氏、军队编号、部队及指挥官、日记作者、参加者或临时部队参加者,说明日记中人物被提及的原因等关涉人物和活动的信息),日记中涉及的地图、报告等其他文件。第四,对这些标引的关键数据信息进行编辑加工,或者为日记中出现的人物与活动创建一个详细的索引,或者再添加一些评论,然后点击“完成”后提交即可。
士兵日记项目的众包模式是一种档案资源开发的新方式。它改变了长期以来馆藏档案标引著录工作全部由档案人员来完成的传统做法。150余万份士兵日记,如果仅仅依靠档案人员来阅读标引、手工编目整理,无疑需要耗费巨大人力、物力。而基于数字出版的档案众包,则可以招募众多档案志愿者协同、高效工作。在此基础上,进一步组织开发网页文件、全文数据库、目录检索库、电子书等不同类型的档案文献数字出版物,满足档案利用者的个性化需求,提供适时精准的档案服务。
(三)士兵日记的数字化传播建构公众的集体记忆
英国士兵的战争日记是以士兵个人视角对战争的观察,记录了他们所见、所感的战争场景。毫无疑问,这些日记是士兵们关于战争的个人记忆。其纸质文本珍藏在国家档案馆里,如果它们今天不被英国公众所看到、所分享、所记忆,其本质上仍然是富有鲜明个性的、零碎的个人记忆。
目前,英国国家档案馆实施的士兵日记项目,将这些100年前士兵的个人记忆转变成今天英国公众的集体记忆。借助于现代信息技术对士兵日记进行数字化,然后开展标引著录整序、数字化编纂出版、数字化公开传播及共享服务等工作,通过档案人员、档案志愿者、文献引用者、各种作品的创作者等不断开发与利用而得以广泛传播,从而使这些个人记忆具有了公众性。事实上,英国国家档案馆通过士兵日记的数字化开发、利用与传播,不仅吸引了英国的历史研究者和其他学术研究人员更便利地利用这些官方记录,而且使大量英国的普通公众和喜欢探究“一战”欧洲战场战况的人们去了解那段历史细节,再现了英国社会关于“一战”的丰富而鲜活的共同记忆。
三、启示
(一)建立公众参与制度来提高档案资源开发效率
根据《中共中央关于全面深化改革若干重大问题的决定》中关于“适合由社会组织提供的公共服务和解决的事项交由社会组织承担”“支持和发展志愿服务组织”的精神,2014年全国档案局长馆长会议上时任国家档案局局长杨冬权明确指出今后档案工作要积极引入社会力量,尤其要“着眼新的档案工作合作者,及时吸收、利用他们参与档案工作,让更多人参与、支持档案工作”,要“利用网络组织档案工作志愿者进行开放档案的编目、关键词著录、编研等工作,延伸档案工作手臂,壮大档案队伍”。而建立档案工作公众参与制度,正是进一步深化档案工作改革的有力举措。
当前有限的档案人员与海量馆藏档案间的矛盾是造成大量档案未被开放与开发的主要原因。截至2013年,我国综合档案馆馆藏档案为44759.1万卷(万件),其中已开放档案8490.0万卷(万件),[7]已开放档案数量仅占馆藏档案总量的19%;2013年我国综合档案馆是3325个,专职档案人员18106人,[8]以现有档案人员去完成上述馆藏档案的开发,其压力是不言而喻的。档案资源的公众参与制度,可以激发公众参与档案工作的热情,利用公众的知识能力优势,来解决我国当前档案部门人力与能力不足带来的档案开放不够、资源开发滞后等相关问题。同时,需要各级国家档案馆有意识地培养公众的档案意识,增强档案人员的社会服务意识,加强档案服务产品开发,避免出现供需不对接、服务无人问津等问题。
(二)将档案网站建成交互式档案开发服务平台
调查显示:我国省级档案网站的数字档案资源开发不足,未能有效整合本省各区域档案馆藏,缺乏对档案资源深层次的组织与开发,在线展览与深度服务还存在缺陷。在线目录信息与全文信息占全部馆藏的比例较小。在线数据库检索系统的性能不稳定,大多数未提供检索帮助与引导服务,有的检索帮助与指南不能向用户提供切实有效的帮助。[9]我们在调查中也发现,档案网站多停留于工作信息的展示,缺乏实时交互的档案公共服务栏目。因此,各级国家档案馆的档案网站应建成档案公共服务的“窗口”。不仅公布办事项目的名称、依据、程序和要求,提供表格下载、业务咨询和办理指南,还应努力实现“一点受理、抄告相关、并联审批、限时反馈”“前台一口受理、后台协同办理”的“一站式”在线服务模式。[10]同时,进一步增强网站的交互性。这是提供在线服务的重要特点之一。国外一些档案网站办得比较有特色,如荷兰阿姆斯特丹档案馆、美国国家档案馆、苏格兰国家文件署等纷纷将其网站打造成档案开发与服务的综合平台,既能制造利润、生产知识和共享经验,又能提升档案馆自身的档案开发与服务的能力。[11]
(三)数字出版馆藏档案数字产品来提高档案公共服务能力
当前我国一些档案网站成为睡眠网站,其根本原因是缺乏馆藏档案全文数据库、文献目录数据库、档案文献电子书、音视频文献编研成果以及其他专题性档案服务产品的强有力支撑。总体上来看,各档案馆数字档案产品的开发工作虽在行动,但其主动性不强、开发能力不足、传播意识还比较单薄,难以适应当前利用者(正在快速网民化)在线利用数字档案的需求。
为了更好地满足公众需求,各级国家档案馆应当加大档案信息数字化编纂出版的力度,在线提供更多档案数字产品。如将现有已开放档案分批鉴定放到网上,组织力量自主选题开发基于社会需求的档案汇编产品,以合作、外包、众包等形式开发更加丰富的档案数字产品等等。不过,无论哪一种档案数字产品,归根结底都要服务于档案利用者。正如中国人民大学冯惠玲教授指出的:“档案资源建设应该注重满足公众的需求和可获取性。档案工作者是档案资源的积极建设者,对于资源质量、价值和易用性承担重要责任。”[12]也就是说,放到互联网上的档案资源应当是可供公众在线共享、在线获取的,这是各级国家档案馆的应尽职责,也是其服务能力的具体体现。
注释及参考文献:
[1]英国“一战”士兵日记上网[EB/OL]. [2015-08-09].http://m.bbc.co.uk/ukchina/trad/entertainment/2014/ 01/140114_ent_ww1_diaries.
[2]Operation War Diary[EB/OL]. [2015- 08- 09]. https://www.gov.uk/government/news/first-world-wardiaries-go-online-to-mark-centenary.
[3]王周户.公众参与的理论与实践[M].北京:法律出版社,2011:345.
[4]闫静.英国“档案志愿者”与美国“公民档案工作者”的思考[J].中国档案,2013(9):54-55.
[5](美)杰夫·豪.群体力量驱动商业未来[M].北京:中信出版社,2011:175.
[6]2010年8月16日《新闻出版总署关于加快我国数字出版产业发展的若干意见》[EB/OL]. [2015-08-09]. http://www.gov.cn/gongbao/content/2011/content_ 1778072.htm.
[7][8]国家统计局网站.中国统计年鉴(2014)——国家综合档案馆基本情况[EB/OL]. [2015-08-09].http:// www.stats.gov.cn/tjsj/ndsj/2014/indexch.htm.
[9]李晓、蒋冠.国内省级档案网站数字档案资源服务现状分析[J].档案学通讯,2013(6):71-75.
[10]国务院办公厅关于加强政府网站建设与管理工作的意见[EB/OL]. [2015- 08- 09].http://www.gov.cn/ gongbao/content/2007/content_521577.htm.
[11]谈伟.国外“档案众包”实践及引发的思考[J].四川档案,2014(2):51-52.
[12]冯惠玲.档案记忆观、资源观与“中国记忆”数字资源建设[J].档案学通讯,2012(3):4-8.