开放融合与参与共赢:美国国家档案与文件署的档案众包实践及其启示①
2023-01-17丁越
丁 越
(山东大学历史文化学院,山东济南, 250100)
众包是“一个公司或机构把过去由员工执行的工作任务,以自由自愿的形式外包给非特定的大众网络的做法”[1]。随着数字时代和互联网时代的到来,众包所具有的优势愈发凸显,越来越多的档案馆或相关机构投入到档案众包的实践中来,其中,2010年美国国家档案与文件署(The National Archives and Records Administration,以下简称NARA)率先提出了“公民档案工作者”(Citizen Archivists)的概念,启动档案众包实践并迅速形成示范效应。我国目前也出现了档案众包或具有众包色彩的零星实践。
目前国内学者对“公民档案工作者”项目的探讨较多,研究涉及运行模式[2]、公众参与[3]、社会记忆[4]、社交媒体利用[5]等方面,但是从“档案众包”视角来探讨“公民档案工作者”项目的研究较少。“公民档案工作者”项目只是NARA进行的档案众包工作的典型代表,其他众包及具有典型众包色彩的项目同样值得关注,它们共同构成了NARA档案众包的生态。本文将从档案众包视角对NARA代表性档案众包项目进行系统梳理和分析,探讨项目背景、类型、内容、成效及其特点,并在分析我国档案众包工作实际情况的基础上,提出可资借鉴的经验。
1 NARA档案众包项目的类型和内容分析
Citizen Archivists 是指非专业档案人员但是参与到档案工作中的公众。[6]自2016年以来,NARA鼓励公民参与档案上传、转录、标记和扫描等工作。通过对相关文献、NARA官方网站及相关报道的调研,笔者将NARA所开展的档案众包以及具有典型众包色彩的项目,按照不同平台将档案众包的类型和内容介绍如下:
1.1 自建平台众包
(1)公民档案仪表盘
为了使档案更易于访问和搜索,NARA自建众包平台公民档案仪表盘(Citizen Archivist Dashboard),公众可以进行档案的标引(Tag)、转录(Transcribe)、编辑(Edit Articles)、上传与分享(Upload and Share)。仪表盘主页提供的任务分为三种类型:首先是专题类,专题下包含与主题相关的信函、手册、会议记录和人口普查报告等,文件以图片的形式提供,用户可以进行标记、注释或者转录,同时也可以看到其他用户在该任务下的贡献;其次是特殊专题类,如标记印第安事务局照片;最后是单独精选档案,这些档案主题分散,按照难度被分为初级、中级、高级三个等级,公众可以根据自己的兴趣和水平来进行挑选。
(2)创新中心
NARA向公众开放创新中心,该中心配备了专门的扫描实验室,公众可以扫描馆藏档案并免费获得其数字副本,最后已扫描的档案经选择后被上传到国家档案目录中,其他公众可以随时免费查看和获取。[7]创新中心鼓励公众参与的扫描工作分为两种类型:一种是扫描自己手中有的档案,另一种是参与扫描数字化档案馆拥有的馆藏资源。创新中心的创建不仅优化了馆藏、减轻了数字化压力,而且便于公众获取与使用。
(3)档案维基
档案维基即NARA利用维基平台进行的档案众包项目,其中具有代表性的是Our Archives Wiki项目,该项目旨在构建一个在线空间,供研究人员、教育工作者、家谱学家和档案馆工作人员分享有关国家档案馆档案及其研究的信息和知识。[8]公众利用Our Archives Wiki可以针对馆藏档案中的相关历史题材创建新的网页或编辑现有的网页,补充档案在线目录中的描述信息,发布转录的文档,将其作为一个工作簿,存储档案研究过程中发现的有用信息,与其他类似主题的研究者分享研究信息,参与有关NARA档案的讨论。
1.2 专业平台众包——Zooniverse
Zooniverse是一个著名的公民科学众包平台,组织者可以将项目放在Zooniverse平台上,让公众帮忙收集材料、分析文件、转译资料等。Zooniverse不会提供报酬,公众出于自身的兴趣参与工作,从工作中获取知识或者巨大的满足感。[9]目前NARA利用Zooniverse进行的众包项目包括“美国士兵”“非裔美国内战士兵”以及“旧天气——二战(首次航行)”专题项目。以“美国士兵”项目为例,该项目要求公众转录第二次世界大战期间参加战斗的美国士兵的65000多份手写反思文稿,共吸引了7179名志愿者加入。
1.3 社交媒体众包
NARA从2009年开始正式布局社交媒体的应用。其制定的社交媒体战略,在后续近10年的实践中形成了多元的社交媒体应用体系。[10]NARA将众多社交媒体应用于档案的收集和存储,如Amara、Flickr、Giphy等(其平台功能及众包任务介绍见表1)。
表1 社交媒体平台及其众包任务
2 NARA档案众包项目的成效与特点
2.1 项目成效
Citizen Archivist项目自开展以来取得了巨大的成效,获得了很高的公民参与度。“公民贡献者增强记录”的数量可以反映公民参与度,从NARA官方网站统计数据[11]可以看出,2017年至今,公民贡献者增强的记录每年都在增加,且每年都超过年初的预计数(具体统计数据见表2)。
表2 公民贡献者增强记录(单位:万条)
自项目实施以来,公民贡献了数百万个标签、元数据、转录、视频字幕和数字图像。为了庆祝2015年阳光周,NARA发起了转录挑战,在一周内,公众就转录了2500个页面,并为国家档案目录中的档案添加了10000个标签。NARA还同维基百科开展合作,其馆藏档案已被纳入上千篇维基百科文章,每年获得超十亿次页面浏览量。2012年,公民档案员仪表盘被哈佛大学肯尼迪政府学院民主治理与创新中心评为政府25大创新项目之一。[12]
2.2 项目特点
(1)多平台融合
NARA众包项目综合利用不同平台,开展形式各异的众包项目。众包平台可分为自建平台、专业众包平台及社交媒体平台,NARA对三种众包平台都进行了充分的利用,不仅依靠NARA官网建设了公民档案仪表盘等自建众包平台,还将一部分转录工作移至Zooniverse专业众包平台,充分利用专业众包平台的影响力和专业服务开展众包。同时,社交媒体(如Flickr、Giphy、Foursquare等)的应用不仅丰富了众包项目形式,收集了更多类型的档案信息,还形成了一定的宣传力度,增加了项目的吸引力。
(2)社交媒体特色突出
NARA十分重视社交媒体的利用,在官网主页专门开通了“社交媒体和数字参与”模块用于统计和介绍NARA使用的社交媒体平台。2010年,NARA发布了第一版社交媒体战略,提出为公民档案工作者提供良好的机会和平台;2017年再次发布社交媒体战略(2017—2020),明确提出使用众包来实现档案馆使命,积极利用社交媒体使公众参与进来,鼓励公众将其技能和经验贡献给众包工作。[13]目前NARA的社交媒体战略已更新至2021—2025财年版本,且在新冠肺炎疫情期间还将继续加强社交媒体的使用。
(3)良好的项目持续性
从表2可以看出,NARA众包保持了良好的持续性,不仅维持了上一年的参与数,并且实现了逐年的增加。为了准确地评估项目的持续进行情况,NARA十分注重数据的统计分析,例如统计贡献者增强记录数、Web访问量、用户参与次数等具体数据,根据评估结果来制定下一步的战略,来维持良好的项目持续性。同时,为了增加社交媒体众包的吸引力,NARA会在社交媒体中发布一些别处无法找到的档案信息,并且注重应用社交媒体各个环节中产生的数据,并进行专业的量化分析。[14]
(4)以开放利用为导向
作为《开放政府计划》的重要组成部分,NARA进行档案众包的最终目的就是实现公众对于档案的有效利用,为此,NARA建立了一系列资源平台。最主要的是国家档案目录平台,该平台系统收录了国家档案馆所有档案资源,用户可以通过关键字搜索所需的档案。此外,NARA对于社交媒体众包获取的档案资料也进行了整合,以Giphy平台为例,Giphy平台上的每一个动图都包含了一个链接,可以连接到NARA的在线目录,便于用户搜索使用。同时,一些专题项目也在完成后形成了独立的资源平台,如公民档案仪表盘的美洲原住民照片标记任务在完成后,建立了印第安事务局“寻找援助的照片”网页来帮助用户查看此记录组中的数字化照片;Zooniverse平台的“美国士兵”项目也推出了专门的“二战中的美国士兵”网站进行成果公开。
3 我国档案众包存在的问题分析
我国目前也进行了一些档案众包或具有众包色彩的实践,具有代表性的项目如盛宣怀档案抄录项目、“我的北京记忆”项目、家庭档案网站项目等。针对以上项目,笔者通过文献分析、网络查阅和问卷访谈等方式进行调研,发现我国档案众包实践存在如下问题。
3.1 档案机构众包关注不足
我国较为典型的档案众包项目大多是由图书馆或高校主办,盛宣怀档案抄录项目及家谱知识服务项目主办方为上海图书馆,我的北京记忆主办方为中国人民大学,仅有家庭档案网站项目主办方为沈阳市档案局,且家庭档案网站项目主要停留在家庭档案征集上,没有涉及馆藏档案资源的开发利用。[15]档案机构在我国档案众包领域的参与度存在明显不足。我国虽然提出“规范并支持社会力量参与档案事务”,但由于并没有对档案众包提出明确规定,导致档案机构受限于传统理念、泄密风险等原因而在档案众包面前止步不前。
3.2 项目宣传力度较小
档案众包在我国正处于起步阶段,公众对于档案众包的了解较少,因此要促进公众参与就必须加强宣传,提高吸引力,然而我国档案众包的宣传在项目前期和项目进行阶段都存在明显不足。首先项目前期缺乏与相关单位必要的合作,以盛怀宣档案抄录项目为例,目前仅可见南京大学相关网站简单刊登了与盛宣怀档案抄录项目合作的信息,在上海图书馆网站、微信公众号等平台均未检索到其他相关报道。其次在项目进行中,目前只有“我的北京记忆”项目具有社交媒体分享功能,其他项目均不具备该功能。对比NARA的社交媒体战略,NARA与Facebook、Twitter、Instagram等社交媒体合作,每一份在线档案都可以进行社交媒体分享以提升知名度和影响力,我国档案众包在利用社交媒体来加强宣传方面的力度较弱。
3.3 缺乏用户参与黏性
第一,众包项目的主题吸引力不足。如“我的北京记忆”的主题受众仅限于北京当地人,与NARA的“美国发展历史”“往届总统故事”等主题相比,我国档案众包的主题在吸引力和受众范围上存在一定不足。
第二,激励不足。Brabham通过问卷调查和访谈发现,激励用户参与众包的主要动机有成就感、学习技能和物质奖励。[16]档案众包大多不提供物质奖励,应当注重满足用户的成就感和学习需要。以盛宣怀档案抄录项目为例,项目给予用户的精神奖励只有积分荣誉和排名,激励程度低;同时,我国档案众包并没有提供用户学习交流的社区,用户之间没有形成互动。根据张轩慧、赵宇翔等基于盛宣怀档案抄录案例进行的扎根分析结果[17],社交价值是公众参与的重要动因。然而目前我国尚未有档案众包项目提供成熟的用户社区,用户交流学习的需要难以得到很好的满足。
3.4 资源开放较差
档案馆或相关机构利用众包优化档案资源建设,目的在于使档案资源便于访问、检索,以提高公众对馆藏资源的利用效率,但目前国内档案众包在资源开放获取方面水平参差不齐。以盛宣怀档案抄录项目为例,上海图书馆建立了开放数据平台,开放数据平台提供独立的盛宣怀档案知识库,但与NARA公民贡献者的贡献记录可以自动链接资源目录相比,盛宣怀项目则暂无此功能,其众包平台与知识库的数据相对独立,抄录结果直接呈现在众包平台中。[18]目前“我的北京记忆”以及“家庭档案网”等网站已经无法访问,公众需要找到平台依托的机构,从机构网站中查找数据库访问资源,影响了档案众包资源开放获取的效果。
4 NARA档案众包项目实践对我国的启示
针对我国档案众包实践存在的问题,借鉴NARA的经验,我国档案众包实践可以从机构建设、平台选择、项目维持、资源开放等方面加以改进优化。
4.1 强化机构建设,完善法律法规
第一,要想提高我国档案众包的质量,作为发起者的档案机构应提高自身进行档案众包的能力和积极性。相关档案机构可积极学习国外相关成功的档案众包经验,结合我国国情加以内化;不断转变传统观念,积极利用互联网时代的开放性、便捷性特点创新档案资源建设的路径;还应加强人才培训、技术支持、信息安全保障等,为我国施行更高层次的档案众包奠定基础。第二,我国档案机构还应加大资源开放力度,在法律法规许可的范围内选择更具吸引力的专题档案进行众包试点,提高档案众包成功率。同时为了明确档案开放范围,消除档案机构对泄密风险的疑虑,档案主管部门应尽快出台相关规章制度对档案众包进行科学引导和规范,使档案机构开展众包有章可循。
4.2 加强平台融合,发挥社交媒体潜力
档案众包应融合各平台优势,取长补短。自建平台往往依托档案部门的官方网站,容易构建信任,但不容易吸引外部参与者;专业平台能够提供更加到位的项目管理服务,但不利于开展形式灵活的众包项目。社交媒体则弥补了前两种平台灵活性的不足,档案部门可以在充分利用自建平台、专业平台的基础上,积极采用多种社交媒体开展各种形式的众包项目。我国目前还没有形成较有影响力的同档案开发利用相关的专业众包平台,档案众包大多依赖自建平台开展,但近年来社交媒体发展十分迅速,微信、微博等社交媒体早已广泛渗透进公众的生活。Kate Themier 等学者提出,档案馆2.0建设需要充分发挥社交媒体的作用,在国家数字档案资源整合与服务中,档案工作者应以用户为中心,使用技术分享收藏,与用户互动以及提升效率。[19]我国档案众包可以借鉴NARA社交媒体策略,充分利用社交媒体平台,与微信、微博等具有影响力的社交媒体建立合作关系,使档案众包更多进入公众的视野。
4.3 以公众为核心,提升项目参与度
用户参与是档案众包的核心,维持项目参与既要留住原有用户,也要不断吸引新用户参与。一方面,项目方需要提供用户感兴趣的众包任务,如NARA提供公众参与转录、标记的大多是有关“美国发展历史”“往届总统故事”“妇女史”“航天史”等档案,其可以吸引很多希望学习历史知识的公众参与进来;同时还要给予用户奖励和认可,以满足用户自我实现的需要,如给予志愿者证书、奖品;对于用户的工作成果应当进行贡献者标记;在特殊节日可以组织重要贡献者开展线下活动,不断增强贡献者荣誉感。
另一方面,可以借鉴NARA的历史中心(History Hub)在线平台,该平台设置了讨论区、博客和特色社区板块,将美国历史爱好者、研究人员等聚集在一起探讨、分享专业知识。历史中心是一个用来提问、分享信息、协作工作的社区,用户可以在此提问,也可以交流心得体会。我国档案众包项目也可以通过建立项目论坛网站的形式,形成互动社区,在此用户可以相互解答疑难问题,向有关专家学者请教,建立良好的协作关系和工作氛围,提高项目的持续吸引力和用户参与的积极性。
4.4 优化资源整合与开放获取
开展档案众包的目的,是通过收集、标记、转录、数字化等方式,便利公众对档案资源的检索和利用。资源整合与开放利用不仅有利于档案资源的建设,还有利于提高众包用户的感知价值,保障公民的知情权。让大数据时代最重要的档案数据可以自由流动起来,由封闭的内部资源向公开的社会信息转变,催生创新,从而建立一个前所未有的开放社会与智慧城市。[20]《关于加强和改进新形势下档案工作的意见》明确提出,鼓励和支持社会力量参与档案事业;新《档案法》也提出了档案工作走向开放、走向现代化的目标。我国档案馆一方面应借鉴NARA国家档案目录平台,建立集中的开放档案资源库,将包括通过众包获取和整理的档案资源在内的所有档案资源进行整合,优化搜索引擎,简化检索过程;另一方面可以学习NARA成果公示的专题网站,使公民能够享用档案众包的成果,提升公众的成就感和获得感,吸引更多公众参与到档案众包实践中来。公众在为档案馆的资源建设提供持续动力的同时也获取了有价值的馆藏资源,真正实现参与带来共赢的目标。
5 结 语
NARA对每一个公民说:总有一天,所有的档案都在线可用,你能帮助实现它。为实现这一目标,NARA开展了卓有成效的档案众包实践,实现了档案资源的开放融合与社会公众的参与共赢。在新《档案法》对我国档案开放与开发利用工作提出新要求的背景下,我国档案馆应当积极借鉴NARA档案众包的先进经验,探索改进我国档案众包的开展方式,提升我国档案事业社会参与水平,助力档案治理体系与治理能力现代化。