APP下载

档案众包服务:模式、特征及质量控制策略

2020-12-06苏君华上海大学图书情报档案系南昌大学人文学院历史系

浙江档案 2020年7期
关键词:参与者资源用户

苏君华/上海大学图书情报档案系 姜 璐/南昌大学人文学院历史系

加拿大学者Terry Cook曾提出档案第四范式[1],即档案工作者与社会/社区(既有城市和乡村的真实社会/社区,又有网络空间社会连接的虚拟社会/社区)共建档案,由专业档案员鼓励和指导大众参与建档。随着“协同共建共享”服务理念的逐步确立以及互联网的普及,档案机构与用户、用户与用户之间的联系日益密切,档案用户参与档案信息资源建设俨然成为时代所趋。而以互联网为依托的档案众包模式则应运而生,成为沟通档案机构与用户、用户与用户的桥梁与纽带,使得用户参与档案资源建设成为可能。

1 文献回顾

2006年杰夫·豪(Jeff Howe)首次提出“众包”[2]一词,并对其进行了定义。众包活动自身所具有的互联、共享、共建特征,使得它在档案信息资源建设中的应用与研究越来越得到认同。

1.1 档案众包理论研究

档案众包是以档案机构、社会公众为主体,档案资源为对象,互联网技术为依托而开展的档案资源建设实践。近年来,该领域备受相关学者关注。

第一,从内涵界定来看,国内外学者对档案众包理论的研究均始于21世纪初,研究时间较短,对于档案众包的内涵界定也尚未有统一的说法,但大都从信息资源建设(孙洋洋,2015)、数字档案资源建设参与模式(加小双等,2016)、档案众包实践操作(谢晓萍等,2015)等角度进行阐释。第二,从研究视角来看,大部分学者均是从档案信息资源建设的角度来探讨档案众包的实施框架与路径(聂永浩等,2019)、发展策略(赵宇,2017)、模式研究(董雨等,2019)等,提出档案众包是推动大众参与档案信息资源开发建设的新途径、新模式。第三,从研究范畴来看,主要涉及对档案众包典型案例的分析与介绍和对档案众包某一具体环节的研究两个方面。对于档案众包具体环节的研究主要包括平台建设(姚倩雯,2019)、质量管理与评价(锅艳玲等,2019)以及公众参与激励机制(晏秦,2017)等。综上,档案众包是公众参与档案资源建设、发展档案服务的重要探索。

1.2 档案众包实践分析

众包理念自2006年提出后被广泛运用于各个领域,近十年来在国内外也掀起了一股对档案众包实践探析的热潮,主要有以下两方面。

第一,国外实践研究。国外档案众包实践起步较早,发展也较为成熟,在美国、苏格兰等地都有许多成功案例,如美国的“公民档案工作者”(Citizen Archivist)项目、苏格兰的“档案转录”项目等,不仅吸引了大量社会公众参与,还取得了较好的实践成果,其中美国“公民档案工作者”项目还获得了美国2012年度政府最佳创新实践奖。在这些众包案例中公众参与任务主要为档案转录、添加标签以及OCR校对3种。此外,参与者还可通过转录旧天气、当志愿者、上传和分享档案、编辑维基文章、提出建议等方式参与。第二,国内实践研究。我国档案众包实践起步较晚,2015年国内省级档案馆仅辽宁省档案馆有进行档案众包实践探索。近年来,随着“互联网+”的普及,国内档案众包项目数量有所增加,但仍处于初步发展阶段。通过研究发现,我国档案众包活动主要为档案转录和征集两种,典型案例有上海市图书馆历史文献中心开展的“盛宣怀档案抄录项目”[3]、青岛市档案馆[4]与多家媒体共同启动的档案征集活动、沈阳市档案馆网站“家庭档案”模块[5]等。

2 档案众包服务模式及其特征分析

对国内外档案众包实践案例进行研究,根据档案业务管理活动可将档案众包模式分为“用户收集档案”“用户整理档案”“用户编研档案”“用户鉴定档案”4种。

2.1“用户收集档案”模式

“用户收集档案”指档案部门为丰富某一主题档案馆藏资源而发布相关档案资源征集任务,公众根据项目要求自愿向平台提交个人所拥有档案资源。该模式在构建社会记忆、弥补历史空白等方面有着不可比拟的优势,尤其是在重大突发事件和历史重大事件档案的补充中,这种优势更为突出。但这一优势的发挥须保证收集成果真实准确,为此档案部门在开展此类活动时应加强对其成果质量的监督与控制。

“用户收集档案”模式的档案众包活动通常属于较低层次的档案资源开发项目,具有以下特征:第一,参与主体多元。在“用户收集档案”模式下,档案资源的收集主体不再只有档案专业管理人才这一单一结构,还包括拥有相关主题档案资源的社会公众。如美国“飓风数字记忆银行”项目规定凡13岁以上的社会大众均可在规定模块上传自己的故事、图片和音频参与该项目[6];浙江省“浙江记忆工程”呼吁社会公众主动参与,鼓励其分享档案数据给档案馆[7]。第二,收集对象复杂。新型载体(磁盘、光盘、胶片等)的出现使得档案类型不断丰富。为更加全面地丰富馆藏结构,档案收集对象也需由原来单一的纸质档案转变为纸质档案与新型档案。如国家图书馆启动的中国战“疫”记忆库项目的征集对象除战“疫”手稿、书画墨迹类材料外,还包括照片、数字资源以及版权和口述史料等[8];澳大利亚“发现米尔登霍尔的堪培拉”项目[9]由档案部门与公众共同建立米尔登霍尔照片数据集,目前已收集300余组照片档案。

2.2“用户整理档案”模式

“用户整理档案”指档案部门借助社会公众力量对已有档案资源进行转录、著录、标引等,保证档案信息资源的可读性和可用性。由于该模式众包内容繁琐、持续时间长,档案馆工作人员时间精力有限[10],需借助社会公众力量才能完成。但该模式的成功进行需参与者持续保持积极性,因而档案部门在开展此类项目时应设置有效的用户激励机制来维持参与者的持续积极性,以保证项目顺利完成。

“用户整理档案”模式下的档案众包活动主要是以档案资源优化为目的的劳动密集型项目,具有以下特征:第一,参与主体限定。该模式下的众包活动虽未明确对参与者的个人素养、专业素质进行规定,实则却存在一定程度的要求,这也是其与“用户收集档案”模式的主要区别之一。因此,通常参与者在通过注册申请后还需要接受专业培训或学习才能参与到项目中去,如苏格兰“转录档案”项目、荷兰“众在参与”项目等都明确规定参与者需通过专业培训、学习后方可接触具体项目。第二,整理内容复杂。档案整理工作的内容最常见的有档案转录、档案著录、档案标引、贴标签四项内容,这也是当前“用户整理档案”模式的典型内容,如英国“档案志愿者”项目、新加坡“公民档案员计划”等都有涉及以上内容。除此之外,整理工作有时还会涉及档案地理定位、档案数字化、字幕制作、语言翻译等内容,典型代表有美国爱荷华大学DIY History项目、莫斯科大剧院“发现大剧院历史”项目等。

2.3“用户编研档案”模式

“用户编研档案”主要表现为吸引和鼓励社会公众积极参与档案馆馆藏的编研活动(如编辑维基文章等),为档案资源深层次的开发利用建言献策。该模式中社会公众可通过互动对话的方式就档案编研主题向档案部门提出自己的见解和建议,但这种模式的实现需要依托功能强大的众包平台,因而档案部门在开展此类项目时需加大对平台建设的投入,为参与者提供一个良好的中端交互环境。

“用户编研档案”模式下的众包项目是对档案资源进行更深层次开发的活动,具有以下特征:第一,主体互动性强。在众包项目过程中主要涉及参与者与档案部门这两类主体,在项目进程中他们需要通过持续的互动交流来实现对档案资源信息的表达和接收。如澳大利亚欧兹马戏团档案馆鼓励参与者参与其网上展示视频的讨论[11];英国“档案志愿者”项目中公众可以通过发表意见行使志愿者职能,且无论赞誉、评论或抱怨档案馆均会予以回应,并公布互动、反馈结果[12]。第二,内容主观性强。 用户参与档案编研的途径主要包括发表评论、添加故事、编辑维基百科、添加描述、添加注释等,以上内容成果大部分都属于参与者自身的思维创作资源,带有较强的主观色彩和个人意识。如在澳大利亚“目的地:澳大利亚——分享我们的战后移民故事”项目[13]中,参与者所添加的200余个故事均是参与者的亲身经历或见证的移民故事;在辽宁省档案馆的“社会档案人”[14]中,公众虽是依托已有的馆藏资源对百度百科的档案资源进行编辑,但编辑的方式与语言风格仍具有较强的主观性。

2.4“用户鉴定档案”模式

“用户鉴定档案”模式下众包内容主要为公众对项目档案内容进行识别、纠错以及鉴定真伪,以保证档案信息资源的真实性和完整性。这一模式众包活动可分为鉴别与纠错两种,前者的参与对象以专家为主,后者则以普通公众为主。因此档案部门在开展此类项目时应准确判断项目难度和类型,精准招募项目成员,避免造成不必要的资源和人才浪费。

“用户鉴定档案”模式是公众参与档案众包的较高层次途径,具有以下特征:第一,参与主体不定。这一模式下的参与主体既可以是单独的个体即社会公众与专家各自分别参与,又可以是联合的群体即社会公众与专家共同参与。如苏州市的中国丝绸档案馆为保证所征集丝绸档案的真实、有效,组织成立了由有一定专长的社会公众和档案专家共同组成的征集档案鉴定评估专家组,对丝绸档案的年代、真伪、价值等进行鉴定[15];而英国国家档案馆的用户鉴定小组则就只由专家或技术研究人员构成。第二,支付成本高。主要体现在对档案界人才以及专家团队的雇佣费用高。当涉及对某一专业领域档案资源的真伪鉴定时,普通的项目参与者是无法参与审核的,尤其是当鉴定内容涉及档案专业以外的其他技术领域、历史领域等范围时,档案部门需要专门聘请擅长该领域的专家团队来协助审核,才能保证审核过程的专业性和审核结果的科学性。

3 档案众包服务的质量控制策略

为保证档案众包项目按时保质保量完成,档案机构和相关主体需提高平台准入门槛、完善平台功能、严控成果审核程序并辅以有效的激励机制,对档案众包项目进行全面系统的监管,将质量控制贯穿于众包项目的始终。

3.1 严控平台准入规则,把控参与者行为

第一,高身份认证门槛,从源头处将“恶意”参与者排除在众包系统之外。一般来讲,身份认证内容主要包括参与者的姓名、性别、身份证号、知识水平、空闲时间段、诚信度等。其中参与者的空闲时间段和诚信度是保证众包成果质量的关键因素,对“用户整理档案”模式下的众包项目尤为重要。因此平台需就用户的个人信息向有关征信系统进行核实,只有通过身份、信用审核并拥有较多空闲时间的用户才能成为众包项目成员。但笔者访问国内现有档案众包项目平台,发现当前仅有上海市图书馆历史文献平台要求用户需经实名认证注册才能接受任务,不过没有收集用户个人诚信度、空闲时间等方面的信息,可能导致任务完成度低、审核通过率不高等问题。

第二,丰富素质测评内容,为参与者能力与任务匹配机制提供科学数据。为保证众包成果的质量,通过审核的用户还不能马上参与到具体项目中去,还需进行多方位的素质测评,主要包括对参与者的基本文学知识、档案常识、专业素养和技能进行测评,依据测评结果可将参与者划分为三类:初级参与者、中级参与者、资深参与者,并将这三类参与者分别对应分配到“用户收集档案”“用户整理档案”“用户编研档案”“用户鉴定档案”4种模式下的项目中去,实现从根本上解决众包成果质量良莠不齐问题的目标。在2018年8月英国国家档案馆发布的《英国国家档案馆志愿者手册》与《志愿政策》[16][17]中就明确提出应根据志愿者的能力和背景精准分配任务,以保证任务质量。

3.2 掌握用户参与动机,完善用户激励机制

第一,抓住参与者的内在性动机,设置无偿激励机制。参与者的内在性动机指用户参与众包项目完全是出于对项目内容感兴趣,想从中获取成就感与荣誉感。因此,档案馆可以通过紧抓住参与者的内在性需求,设置积分奖励或个人贡献度排名等方式赋予他们足够的荣誉感与成就感,让他们切实地感受到被满足与被重视,从而获得用户持续积极参与众包活动的内驱力。如美国国家图书馆利用积分、贡献排行榜激励用户积极参与照片分类、评论、标注,仅10天就收到10000多条标注和2000多条评论;芬兰图书馆的报纸数字化、纠错等项目以游戏通关的形式进行。

第二,把握参与者的外在性动机,设置有偿奖励机制。参与者的外在性动机是指用户参与众包项目与项目本身无关而是被一些外在性的激励因素吸引过来的,通常表现为货币报酬或物质奖励等有偿奖励方式。陈翀、罗文馨等在对北京师范大学图书馆书评众包中用户的参与意愿进行问卷调查时发现,奖励对提高用户参与意愿的作用最大[18]。因此,档案部门应根据参与者的外在性需求,在项目的不同环节合理增加相应的物质、经济奖励,以维持参与者的持续活跃性。如苏格兰的“档案转录”项目规定,项目参与者可免费浏览、下载或拷贝原本需要付费的档案图片以作为用户参与的回馈[19],且截至2015年就共有3631个志愿者参与到其中,完成了112100页的文件转录。

3.3 优化平台功能设计,提供中端交互环境

第一,参与者之间可利用该功能进行经验交流和成果互审。该功能可适用于不同模式的用户交流,如“用户整理档案”模式的参与者可借助IM(QQ群、微信群等途径)分享个人总结的档案转录技巧、贴标签的操作要点等;“用户编研档案”模式的不同参与者可就相同主题提出不同的理解和建议,从而碰撞出思维的火花;“用户鉴定档案”模式的参与者可通过该功能实现成果互审,以及时修正明显错误。在英国“档案志愿者”活动中明确提出志愿者可以通过用户论坛进行一问一答式交流来表达自己的心声,并将用户讨论结论以PDF形式公布出来[20]。

第二,档案人员可借助该功能进行线上指导和问题仲裁。当参与者面临编辑百科词条、档案信息添加与分析等专业技能要求较高的“用户编研档案”任务时,档案人员可通过线上交流社区对参与者进行远程指导和答疑。并在参与者之间就某个问题争论不休、难以定夺时,档案人员亦可通过IM功能及时从专业的角度对其进行线上商议定夺,从而为档案众包的质量提供专业保证。如在英国“战地日记(Operation War Diary)”项目中,英国国家档案馆联合英国帝国战争博物馆和众包平台Zooniverse建立了“第一次世界大战百年数字计划学术咨询小组”,在线解答志愿者在档案数字化与标引过程中的问题,以保证项目质量[21]。

3.4 完善成果审核机制,保障众包成果质量

第一,项目成员互审机制。是指依靠项目内成员的力量对已完成的任务进行初步的审核,审核内容包括任务完成的完整度、内容是否有明显的政治偏颇和偏题,是否有明显的差错等。对于“用户收集档案”“用户整理档案”模式下的众包项目,该机制可作为其成果的第一道审核,第一时间将严重偏离主题或政治倾向偏颇较大的内容筛选出去。学者锅艳玲[22]曾将众包成果审核主体分为接包小组成员间审核、接包团体范围成员审核以及专家小组审核三层,其中一二层主要负责对基础性业务和知识的审核。

第二,档案工作者和专家团体审核机制。档案工作者和专家团体审核机制是指将精通档案业务、精通计算机和数据库等相关知识的专业人员,以及不同领域和范围内的专家团体集中起来组成一个审核小组,从专业的角度对用户提交的成果进行质量评估、内容完善以及问题定夺。尤其是对编辑百科词条、档案信息添加与分析等专业技能要求较高且没有标准答案的“用户编研档案”众包成果的审核而言,该机制是必不可少的。上海图书馆“盛宣怀档案著录”中将平台用户分为了游客、发布者、抄录者和专家四类,其中专家经过注册、专业评估后,就可对平台项目进行著录、抄录与审核。

猜你喜欢

参与者资源用户
移动群智感知中基于群组的参与者招募机制
休闲跑步参与者心理和行为相关性的研究进展
基于用户和电路的攻击识别方法
门限秘密分享中高效添加新参与者方案
我给资源分分类
资源回收
做好绿色资源保护和开发
信用卡资深用户
两新党建新媒体用户与全网新媒体用户之间有何差别
海外侨领愿做“金丝带”“参与者”和“连心桥”