APP下载

面向内容质量控制的档案知识生产研究

2020-09-08龙家庆

档案与建设 2020年7期

摘要:用户参与档案知识生产激活了档案资源组织和利用方式,但其中的角色分工尚未明确。文章重点分析UGC、PGC、OGC三种机制的特点及关系,并以UGC为比较中心,发现档案知识生产内容存在谬误纰漏、价值密度较低、涉及法律问责、质量评价混乱等问题。因而遵循“源头把关—过程规范—全程控制”逻辑,提出了内容质量控制策略:重视档案素养教育,实现业余与专业平衡,突出档案知识挖掘,加强前后环节协同。

关键词:档案知识;用户生成内容;内容质量

分类号:G271.6;G273.5

Research on Production of Archival Knowledge Oriented to Quality Control of Content——Comparison based on OGC, PGC and UGC Mechanism

Long Jiaqing

(School of Information Resource Management of Renmin University of China, Beijing, l00872)

Abstract:The users participation in the archival knowledge production activates ways of organizing and utilizing archives resources , but the role division is not yet clear. The article focuses on the analysis of the characteristics and relationships of the three mechanisms, and makes UGC as the center of comparison, then finds that the content of archival knowledge production has some problems, such as, low value density, legal accountability and confusion in quality evaluation. Therefore, following the logic of "Source check-Process review-Full control", the content quality control strategies are put forward: Attach importance to archival literacy education, achieve balance between amateur and professional, highlight the knowledge mining of archives, strengthen collaboration of links.

Keywords:User-Generated Content; Archival Knowledge; Content Quality

随着知识社会快速演变,档案资源的知识资产观愈发强烈,各级档案部门纷纷开展知识生产型服务[1],我国档案事业从“国家模式”走向“社会模式”[2],公民和第三方组织等社会力量也正积极融入档案治理体系,在参与式档案活动中凝聚知识能量。2021年将在阿联酋阿布扎比举办的国际档案大会,以“赋能知识社会”(Empowering Knowledge Societies)为主题[3],致力于号召全球档案工作者共同探讨21世纪知识社会中档案事业所面临的挑战与机遇,其中的子议题“信任与证据”(Trust and Evidence)将重点探讨“用户专家VS职业专家”(User Experts VS the Profession)的内容以及在数字档案资源参与式建设中的实践反思[4],建设环节具体包括前端档案资源收集、中端档案标引著录鉴定和后端知识集成服务。

毋庸置疑,用户参与式建设激活了档案资源开发利用,但其产出成果的内容质量却往往遭遇质疑[5],具体问题有:用户知识结构影响内容质量的广度与深度;主观认知和专业能力影响内容质量的客观性、真实性;片面追求舆论宣传而忽视档案内容生成规律;脱离中国档案实际工作,盲目追随西方语境下的包装形式。因此,在档案知识生产情境中探讨用户和专业人员的协同关系,以及如何保障内容质量是十分必要的。文章采用内容分析和比较研究方法,通过分析不同角色分工的差异,力求找出因用户参与档案知识生产而产生的内容质量问题,进而提出优化策略。

1相关概念阐述

档案知识生产是档案资源开发和知识管理的交叉领域,是由“档案知识”和“知识生产”子概念组配而成,学界尚未形成明确概念。据迈克尔·吉本斯(Michael Gibbons)的知识生产新模式理论可知[6],知识生产不再是科学界精英的內部共同体行为,而是整个社会广泛参与的生产过程,具有应用生产情景和多维度质量控制的特征。因此,档案知识生产也应被置于知识社会场景,并兼顾各生产主体的参与需求,基于已有档案资源基础进行整合、发现、挖掘、聚合。其中生产主体按照“用户—内容—专业”进行分工,分别对应了“用户生成内容”“专业生产内容”“职业生产内容”三类生产机制。

1.1大众视角:用户生成内容(User-Generated Content,UGC)

UGC是发轫于Web2.0环境下的一种新兴网络资源创作与组织模式,即在网络空间创作文字、图片、音频及视频等内容[7]。其作为互联网技术赋能的产物,是变革传统信息传播的重要力量,具有内容个性化、视角多元化、社会关系虚拟化和传播扁平化等特征[8]。对档案领域的作用体现在:丰富档案馆藏内容,参与档案业务流程,延伸档案交互社区,以知识共享模式发表不同见解,实现档案原有信息增值[9]。总体来说,UGC机制下,档案知识生产的内容来源渐趋广泛,档案用户黏性稳步增加,譬如疫情期间,苏格兰档案与文件协会(ARA Scotland)等机构在Twitter平台发起“#Archive 30”话题活动[10],用户通过分享档案工作建议,提供珍贵档案手稿,建构了属于大众的记忆资源和知识文化。

3.2内容价值密度较低

档案知识生产价值在于将原有档案资源转化为可利用的创新知识,如生产者对数字档案内容进行分类、聚合、排序、抽取、过滤、浓缩、提炼和可视化等操作,使其成为可解析的科学知识。但被UGC泛化的知识生产,知识条目体量变大,内容碎片化、同质化现象严重,而真正有价值的知识量占比却不高,价值密度较低。尤其是用户生产的“评价类”内容,即用户在社交媒体上对档案知识生产成果进行的反馈互动,这其中的“凑字打卡”“好评返利”“植入广告”现象不仅影响到捕获内容的整体质量,还额外增加了“信息清洗”的负担,更谈不上知识创造。正如早年P. André团队对Twitter内容价值进行的数据分析,分析可知:用户所生产的内容中25%无价值,36%有价值,39%介于两者之间[16],因此美国也于2019年4月宣布停止原有的Twitter讯息存档政策,将重点放在保存重要讯息上而非追求数据量。

3.3内容涉及法律问责

由于UGC主要工作场域主要是互联网端口,加上网络环境中存在过滤技术识别不到位、网络治理不规范、公民版权意识薄弱等困境,因而容易导致知识产权争议、用户隐私泄露、档案泄密风险等棘手问题,具体有:档案知识生产存在涉密情况,若用户对《档案法》《网络安全法》《保守国家秘密法》不甚了解,就容易发生档案泄密事件,这也是习近平总书记总体国家安全观审视下的首要风险。内容所有权存在争议,由于网络空间信任与共享生态复杂,造成了鼓励用户参与生产和使用涉及版权内容之间的矛盾,这不仅会让档案机构陷入两难处境,也会削弱用户对档案公开利用的认知印象。用户在内容生产中必有“触网留痕”记录,而档案部门却易忽视个人信息使用的范围和方式,包括档案用户数据违规采集、隐私声明冷漠化处理、用户数据授权与传输风险、用户信息利用侵权等[17],这对档案用户隐私均构成极大威胁。

3.4内容质量评价阻碍

对UGC进行全流程追踪评价,是有效提高档案知识内容质量的保障,但目前,内容质量评价框架尚未成熟。一方面,内容质量评价指标的缺失和滞后,不利于识别和纠正内容生产中的问题。在项目验收中,后端展示成果是评价审查的重点,但其前端和过程环节易被忽视,其中包括对用户知识背景、使用工具技术能力、产出知识成本效益、项目操作灵活程度等方面的评估。另一方面,现有评价方案和规范之间衔接度不够,缺少专门评价标准。目前,评价对象包括社交媒体背景、内容主题、内容语义关联、档案资源描述、学术利用标签等多种角度,却未有专门针对用户参与档案内容生产的评价指南。因此在评估用户对内容质量的影响效果时,仍需要参考客观性、体系化、普适性的评价体系。

4面向内容质量控制的档案知识生产策略

针对上述问题,要想实现“人人共建知识社会”的愿景,就必须加强全流程控制,以全面提高档案知识内容的输出质量。笔者以UGC机制为核心,结合OGC和PGC机制的优点,认为应将用户定位于“业余的专业者”。

4.1源头把关,重视档案素养培育

用户参与档案知识生产,不仅能有效弥补PGC人才空缺,也可增加OGC与用户的对话场景,避免档案利用服务成为档案部门自娱自乐的空头标签。内容质量控制的首要任务就是寻找合适的目标用户,从源头上确保预期内容质量,因此,无论是志愿服务抑或兴趣驱使,还是众包加入的用户,必须要求具有一定档案素养和专业认知。国内外已有愈来愈多UGC项目通过启动资质审查、注册筛选、知识测评以确认合格的目标用户,譬如在“麻省记忆路演”项目(Mass. Memories Road Show)中,档案馆规定:只有受过训练的人才能介入,从源头塑造了优质社群档案[18]。同时,档案素养培育不仅要在用户准入之前执行,还要在用户进入生产环节后进行日常开展,将档案素养嵌入公众社会意识,进而实现业务集成与档案素养的持续互动。

4.2内容为王,突出档案知识挖掘

无论执行何种机制,其核心始终是“C”,即关注内容本身。价值有导向,知识有温度,无论数字环境中知识生产方式如何变革,深挖优质内容都占据着不可撼动的地位。首先,要关注内容缺口,即辨识何种档案资源需要加大力度开发,如宏观反映民族文化特点的非遗档案资源,微观书写百姓生活的档案叙事。以“我的北京记忆”网站为例,其开设了北京故事和采风问俗等访问专题,并号召用户添加记忆资源,以承载北京城市变迁的记忆缩影,截至2020年6月,已累计添加1041条文集、8671张图片和415个视频[19]。其次,要精分内容类型,选择适合用户群体的生产内容类型,包括娱乐社交、知识分享、严肃宣传、舆论引导等类型。再次,要按主题内容选择呈现方式,即按照档案知识主题匹配更易被理解的展示手段,包括网站互动、APP订阅、数字档案展览、档案虛拟游戏、档案文创产品等。最后,要借助数字技术工具进行深度加工,在对档案文本进行截词切分、标引注释、人物识别基础上,对结构化内容进行语义关联、词频统计、人物网络分析、学术地图可视化等知识发现。

4.3业务规范,实现业余与专业平衡

随着档案知识内容质量要求提高,其生产过程对用户的专业素质提出了更多条件。未来的生产用户将被定位于“业余的专业者”,这与第二部分提及的“PGC+UGC交集”相似,但不同点在于:未来将更立足于普通用户群体,为其提供业务指南和专业辅助,而非依赖于档案专家群体,即在生产中平衡业余和专业的关系。为实现这点,第一,应引导用户遵从知识生产各环节的业务规范,如加拿大国家图书档案馆Co-Lab项目首页弹窗有1—17步的完成指令,英国国家档案馆“战争日记”存档项目提供10分钟培训视频;第二,参考用户活动属性来进行规范审查,包括该用户是否存在不良征信、注册时间长短、基本资料完成度、完成时间情况等,以此保障内容完整性和真实性;第三,运用激励政策搭建长期合作关系,“业余走向专业”的关键在于增强用户参与度,可开设问答专区和业务交流坊等,使用户增强对档案知识生产的认同感,以主人翁精神参与专业技能训练。

4.4全程控制,加强前后环节协同

档案知识生产是有流程规则的,各子环节质量均会影响整体内容质量。因此展开全程控制是实现“资源→知识”的关键所在,按照流程周期可将其简单划分为三个阶段:

(1)前期控制

调查内容生产需求和用户供给之间的适配情况。要求档案职员提前掌握馆藏档案数量、馆情实施条件、档案知识需求、网络技术要求等,看是否与用户供给,即人员数量、工作时间、知识运用能力、档案主题认知等适配。

(2)中期抽查

对阶段性成果内容进行抽样检查和反馈检验。档案职员可通过自验和他验方式进行内容质量审查,包括对同质性、准确性、可靠性、创新性等方面的控制,以此调整生产进度和调度安排。

(3)后期审核

对照修订版评价指南,在保护用户隐私和严格校验无误后,可将资源存入档案知识库或公布利用,如美國国家档案馆的公民档案管理员项目(Citizen Archivist)[20],鼓励大众参与档案馆各项事务中,其中涉及标引、著录、设计等在线工作,并遵循全程控制以保障历史档案加工成果的准确性。

*本文系2019年国家社科基金项目“数字政府背景下电子文件单轨制管理的数字连续性保障框架研究”(项目编号:19CTQ036)阶段性研究成果。

注释与参考文献

[1]张晓娟,马瑜,左田原,等.知识经济时代的企业档案管理——一种知识资产观[J].档案学通讯,2012(4):76-79.

[2]徐拥军,李孟秋.再论档案事业从“国家模式”走向“社会模式”[J].档案管理,2020(3):5-9.

[3]International Council on Archives. Rescheduling for ICA Abu Dhabi Congress[EB/OL].[2020-05-20].https://www.ica.org/ en/rescheduling-for-ica-abu-dhabi-congress.

[4]张江珊,蔡非凡.档案学语境下的“参与”研究[J].档案学研究,2019(6):19-24.

[5]徐拥军,陈洁,张晨文,等.“用户生成内容”在档案工作中的应用及影响[J].档案学研究,2019(2):13-19.

[6]迈克尔·吉本斯,等.知识生产的新模式——当代社会科学与研究的动力学[M].北京:北京大学出版社,2011:16-22.

[7]赵宇翔,范哲,朱庆华.用户生成内容(UGC)概念解析及研究进展[J].中国图书馆学报,2012(5):68-81.

[8]聂云霞,龙家庆.面向用户需求的档案信息服务“扁平化”模式建构[J].档案与建设,2018(5):4-8.

[9]周林兴,刘星.UGC机制下档案用户虚拟在线社区研究[J].档案学研究,2016(6):33-36.

[10]ARA Scotland.#Archive 30 is launching on Wednesday 1st April[EB/OL].[2020- 05- 25].https://twitter.com/arascot /status/1234488243594366976?s=21.

[11]胡泳,张月朦.互联网内容走向何方?——从UGC、PGC到业余的专业化[J].新闻记者,2016(8):21-25.

[12]人民网.浅析UGC、PGC和OGC[EB/OL][.2020-05-26]. http://yjy.people.com.cn/n/2014/0120/c245079-24169402.html.

[13]宋雪雁,于梦文,王阮.价值共创视角下数字时代档案文献编纂模式研究——基于用户主导的逻辑[J].档案学研究,2019(6):94-101.

[14]Library and Archives Canada.Challenges-Co-Lab[EB/ OL].[2020-05-27].https://co-lab.bac-lac.gc.ca/eng/Challenges.

[15]上海图书馆历史文献众包中心.盛宣怀档案抄录项目[EB/OL].[2020 -06-13].http://zb.library.sh.cn/.

[16]AndréP, Bernsetin M S, Luther K. Who gives a Tweet? Evaluating microblog content value[C]//Proceedings of the ACM 2012 conference on Computer Supported Cooperative Work.Seat- tle:ACM Press,2012:471-474.

[17]周林兴,徐承来,周丽.用户画像视域下档案用户隐私问题研究[J].档案学研究,2020(2):58-64.

[18]Roeschley A,Kim J.“Something that feels like a community”: the role of personal stories in building community- ased participatory archives[J].Archival Science, 2019(1):27-49.

[19]中国人民大学我的北京记忆网站.首页—我的北京记忆[EB/OL].[2020- 06- 13].http://www.mypekingmemory.cn/ 5adae6b0efc52b4608642210/index.html.

[20]Citizen Archivist|National Archives[EB/OL].[2020-05-30].https://www.Arch- ives.gov/citizen-archivist.