用数据叙事
2023-08-19方华谭必勇
方华 谭必勇
关键词:数据叙事;叙事逻辑;档案数据;故事化;数字人文;语境网络;创作
1 引言
党的十八大以来,“讲好中国故事”成为国家政策的关注点。早在2013年8月19日,习近平在全国宣传思想工作会议上就指出“讲好中国故事,传播好中国声音”。[1]随后,《全国档案事业发展“十三五”规划纲要》(2016年4月)提出“主动讲好中国档案故事”[2]、《“十四五”文化发展规划》(2022年8月)明确“增强战略定力、讲好中国故事”。[3]2022年10月16日,习近平在党的二十大会议报告中再提“讲好中国故事、传播好中国声音,展现可信、可爱、可敬的中国形象,推动中华文化更好走向世界”,[4]都为档案工作者利用档案资源讲好档案故事,传递“中国力量”压实了工作责任。
面临加速数字化的档案资源环境,为忠实履行工作责任,解决数据剧增造成语义对接、损失问题。在数字人文、叙事理论的引导下,数据故事化成为解决数据描述和内容深层次开发问题的新思路。档案以其自然性、相互关联性、独特性与客观性等特点成为讲故事的重要语言,[5]其故事化价值也逐渐为档案学界所认知。冯惠玲认为,“数据故事化,不仅可以使数据库和叙事达成‘和解,也可以逐渐弥合数字记忆与数字人文之间的疏离,让数字记忆获得新的发展路径和能量,提升数字记忆的科学性、规范性和功能”。[6]基于相关理论认识,档案数据故事化实践铺陈而开,如2013年启动的“北京记忆”数字资源平台、2018年开展台州古村落数字记忆平台、2022年上线的“世界的记忆——中国传统音乐录音档案”数字平台等,其理论也应逐步深入细化。
但相比国外学者通过某一项目探讨档案数据故事化的教育价值[7]、方法[8]、模式[9]、实施过程[10]等,国内研究稍显单薄,仅在相关文章中发现对档案数据故事化的内涵和框架[11 ]、方法[12]等的简单论述,暂未出现专门研究针对该问题进行探讨,也未形成清晰的研究脉络。在国家加快文化产业数字化布局和提升文化产品服务质量水平的行动背景下,以故事化方式深入挖掘档案数据、在文化市场中讲好档案故事、在学校教育中讲好历史故事、在世界舞台中讲好中国故事的多元需求相较以往更为迫切。加拿大康考迪亚大学口述历史和数字故事中心历经十七年发展具有较大影响力,是研究如何开展数据故事化较为经典的案例。本文从概念入手,以康考迪亞大学口述历史和数字故事中心的口述档案数据故事化实践为例,详细论述“档案数据故事化”开展、推进的创新可行路径,以期为国内“档案数据故事化”实践的开展、档案数据面向用户深层次开发活动的推进提供支持。
2 概念衍化:从“档案故事化”到“档案数据故事化”
“故事”一词,在《辞海》中有:“旧事”、“一种文学体裁”以及“叙事性文学作品中不可或缺的要素,是按时间顺序排列的事件的叙述”[13]三种基本解释,其源于并改变社会互动。公众生活、审美风尚及认知习惯让故事的传播广度和深度具有天然优势,在国家、政党文化建设中受重视。档案故事化是档案叙事的一种具体类型与模式,指将档案素材围绕主题加工成为结构化故事的过程。因借用夸张、隐喻等描述手法,故事在极端案例中被冠以“虚幻”“不可信”的认知标签。为强化叙事理性,处理数据表达与自然语言的错位矛盾,深度发掘数据价值等,学者开始关注数据叙事问题。
“数据故事化”也称“数字故事化”“可视故事化”“以数据讲故事”等,概念、定义的多样化反映出其有待明确的研究现状。“档案数据故事化”是“数据故事化”在档案研究中的衍化概念亦是如此。牛力认为,“档案数据的‘故事化属于知识服务范畴,即将经过多维组织的档案数据梳理成册并映射至多元可视化空间,以主题故事的形式对档案数据中蕴含的记忆进行叙事化表征”,[14]具体描述了档案数据故事化的基本过程,抽象性较弱。笔者认为“档案数据故事化”是根据社会需求,围绕档案数据为核心的资源集合,运用先进技术提供故事类知识服务、产品的思维和动态过程。相比传统实践,档案数据故事化具有以下几方面突出特点:档案数据成为叙事核心与发展动力。其叙事的起点在于数据内容、联系的挖掘,重点在于提升叙事成果的功能,包括信息传递、参与体验、论证问责等,终点在于对接机器和现实世界。数据标准编码形态提升了档案修复的速质;数据的细粒度性使得档案资源收集更加快捷、资源融合更加轻松、传播媒体选择对接更加灵活;数据内容多样性牵引叙事走向分化的同时,数据类型多样性则使叙事决策更加全面精准。
数据技术全面变革叙事。在叙事资源层面上,在数据形态驱动叙事分析走向编码化的基础上,数据互联、分析技术牵引叙事资源不断扩张的同时,数据模型的选择深刻影响叙事的逻辑走向。在呈现参与层面上,关联技术实现叙事结构的立体化演变,可视、交互技术有效推动叙事视角与模式的多样化和呈现效果的复杂化发展。
3 康考迪亚大学口述档案数据叙事实践分析
2006年成立的康考迪亚大学口述历史和数字故事中心[15](Centre for Oral History and Digital Storytelling,以下简称“中心”),利用口述档案数据开展叙事,现已成长为加拿大口述史最为先进的数据叙事中心之一,具有广泛影响力。调研“中心”主要工作,可发现其形成一个较为完整的叙事组织模式,如图1所示。
3.1 建设数据叙事基础
3.1.1 数据获取保存。“中心”通过开发工具逐步缓解数据的获取与保存问题。口述历史数据源具有不确定性,受访者的意愿、文化背景、情绪等,采访者的问题、语态等以及双方互动,均会影响数据质量。对此,“中心”开发张力分析工具(Tension Analysis)、设置情绪清单,通过动作、姿势等评估受访者情绪。[16]为有效存储数据,2005年“中心”成员开始审查数据库构建工具,开发Stories Matter数据库。该数据库于2010年3月实现远程访问。[17]同年,Steven High领导开发的口述历史学家的数字工具箱(OralHistorian's Digital Toolbox)对90多种软件应用进行测试评论,涵盖地图、索引、音视频编辑、AR/VR、定性分析和社交媒体等工具。但随着实践深入,“中心”数据量迅速膨胀,现已有超过2000次的访谈数据亟待保存处理,且相关工具和已有的数字成果、实体设备的维护也越发困难,上述Stories Matte数据库、数字工具箱已无法公开访问。这些都体现出“中心”在档案数据管理方面存在的缺陷。对此,“中心”在政府提供云计算等方面寻求突破口的同时,也呼吁专业档案管理人员的参与。
3.1.2 数据选择过滤。“中心”叙事数据选择主要受研究主题、数据质量、伦理道德的限制。就主题而言,其作品主要关注少数族裔。这既是顺应政策的要求,也是研究多元社会、历史的需要。加拿大是典型的移民国家,政府成立后实施的民族同化、隔离等政策对国家的历史记忆和现实运行造成深远影响。为履行2006年6月总理对本国华人社区的致歉承诺,加拿大遗产部开展历史识别计划(HistoricalRecognition Programs),这也是“中心”创立的主要背景。数据质量是“中心”叙事选择的重要标准,主要体现在数据提供者、数据描述对象等方面。大量因长时段交流形成的独立无实义数据,如停顿、口头禅等,会被“中心”耗时两年开发的可自动识别要点和测定谈话趋势的工具剔除。伦理道德在“中心”受到重视,成为数据过滤的标准。这既是口述访谈的内在要求,也是维护数据权益的必然之举。对此,项目组制定了相应指南、协议,以文本形式明确限制了数据选择、访问、保存和传播的范围方式,提出“知情权同意”(Informed Consent)、“减轻伤害”(the Mitigation of Harm)和“退出权”(the Right ofWithdrawal)原则以指导实践开展,保护双方权益。
3.2 构建数据叙事机制。经过多年探索,“中心”成果丰硕。分析网站代表作品,可归纳出较为完整的叙事机制,如图2所示。
3.2.1 转化融合的切入视角。“中心”主要使用以下五个视角开展叙事:一是关注特定政治群体、社会事件、民族的人文视角,如,作品《河边的一朵小花(A Flower in theRiver)》以卢旺达社会种族灭绝为主题开展研究创作;二是从城市建筑、公共设施切入的地域视角,如,作品《传奇之城:蒙特利尔(The Storied City: Montreal)》以城市为主题;三是遵从宏观历史发展、中观代际传承、微观个人成长时间逻辑的时序视角,如,作品《黄线(The YellowLine)》聚焦意大利裔加拿大群体的窘境,通过采访1950年至1977年间在蒙特利尔长大的六名意大利裔加拿大人和二十年后在意大利社区长大的年轻女孩开展代际故事创作;四是发掘人际、历史、天地纽带的联系视角,如,作品《女性花园项目(The Notman Garden Project)》研究在不同時期居于同一建筑的三代女性行为,探索女性间的关系;五是注重研究素材、流程、方法科学性与多样性的学术视角,如,作品《讲故事(Des Histoires à Raconter)》第二章叙事围绕定性学术研究和图形表示方法开展,在多样化口述内容中追溯魁北克近期土著教育历史的线索。
3.2.2 写实别致的叙事逻辑。数据的全面考察与完整表达保证了作品的真实性。“中心”考察数据不限于访谈内容和处理后的二次信息,更涵盖历史背景信息及对研究方法的分析数据。数据的完整表达指有效还原针对某一主体、现象、主题所体现或凝聚时间、地点、语句、陈述语句等主构件。在基础信息写实的基础上,根据媒介特性采取单线或多线等线索串联故事,如,作品《小巷图集(Ally Atlas)》关注时空信息以地图、主题凝练数据,以老鼠、猎狗、香烟为意象创作六张抽象地图,富含想象力。
组织成员与其问题意识驱动叙事逻辑不断创新。多元团队各异的观点、理论、方法为叙事创新注入活力。例如,媒体艺术家Jesikah Maria Ros“走向大众的目标不在于接触大量人群,而是影响少数政策制定者或特定群体”[19]的观点影响其叙事逻辑。“中心”以“共享权威”(sharingauthority)为核心延伸出的对合作、技术运用等子问题的探究也体现在作品的之中。如,作品《走向大众(goingpublic)》与相关从业者对话针对创作伦理、协作、有效性等问题开展研究。
3.2.3 协同有力的叙事创作。协同工具挖掘展示数据语义。与传统纸本不同,音频或视频传递信息更为复杂,肢体语言、情感、沉默、对话节奏等都可成为叙事核心。为充分挖掘展示数据内容,团队通过多种方式对原始素材进行解析、融合与再演绎,如利用计算访谈分析工具进行注释、索引或补充;构建可令他者话语融入的叙事框架[20];或利用高科技表演空间呈现故事。“中心”在数据挖掘过程中碰到的问题已得到部分解决,如针对标引造成数据语境脱离,在转录卢旺达人数据时聘请该族青年操作,但因数据检索分析造成的主题过度同化、数据处理与口述历史研究精神冲突等疑难仍有待深入。
协调组织对话开展叙事。截至2020年,“中心”已拥有266家分支机构,涉及教育、戏剧、哲学、语言学、翻译、地理、计算机工程等学科。为开展协作,“中心”早在2009年便确立由两名联席董事、董事会(任期两年,由两名联席董事和三名正式成员组成)和全体代表大会组成的治理结构,要求成员在参与六小时培训后,以项目为单位,分组开展参与式研究,如建立互动叙事实验室和研究小组以及成立协调委员会每月召开协调、反思会议等。[21]在有效协同下,“中心”作品包含不同学科的思想、理论与行动成果。如:“活态档案(Living Archives)”项目依靠历史学家、地理学家、社区成员、设计师、开发人员和艺术家与观众共同设计。
联课驱术拓展叙事场景。“中心”叙事不仅通过文本、音频等直接素材传递,更通过教学等互动环节,计算机、实体展览等技术设备、场景实现。“中心”开发的StoriesMatter 数据库早在2011 年3月起自英国哈德斯菲尔德大学至各高校课堂中,与戏剧、传播、历史、政治学等课程结合;开发的工具Celluloid不仅支持注释讨论画面,聆听声音档案并记录教学、创作过程,还可添加时间标记、注释、评论,关联视频来创建新故事,并与实行相同操作的用户对话。[22]3.2.4 丰富深入的感官互动。重视作品的多样呈现。“中心”作品形式多样,包括戏剧、在线数字故事、艺术装置、广播节目、动画电影、展览等,擅长利用媒介联通受众感官。视觉上,AtlasCine地图工具支持个性化的地点、主题、日期检索,排列,导航与交互。[23]听觉上,步行音频(Audio Walks)面向具体场景,采用语音方式回顾故事,作品《鸟类过境(Bird crossing borders)》结合了音视频、水、玻璃、木材、颜料和乳胶等材料制作声音装置;触觉上,作品《行走水中(Walk in the Water)》通过触摸感应地图呈现故事。
重視作品的互动感。“中心”善于利用对话开展交流,如,作品《胜地遨游播客(Place Dive podcast)》邀请艺术家、设计师、研究人员录制播客,讲述加拿大城市结构中一个冷门空间。或通过间接创作实现群体对话,如,作品《失落的故事(Lost stories)》联通个人故事和艺术创作,以公众故事为素材借艺术家之手使其成为艺术作品或教育材料,并长于利用媒质引发情感交汇,如在展览中设置分享记忆经验区域或让听众将耳朵贴在毛织物上,创造私密的聆听空间,引导观众与采访者产生共鸣。
4 康考迪亚大学口述历史和数字故事中心的实践启示
大数据时代,国家意志和文化的故事化传播需要、文本的数据化转变、承载媒介的数字化发展推动了传统叙事内容、方法等与数据思维、技术等的强烈对撞,数据叙事为突破档案“有编无研”、数据“有收无用”的开发瓶颈提供了方法支持。康考迪亚大学口述历史和数字故事中心的持续向好发展显现其蓬勃的活力与光明的前景,也为档案学界业界独立或参与开展数据叙事提供诸多思考。
4.1 观念层面:转变数据叙事思维,重塑创作实践逻辑。全面认识数据叙事。开展档案数据叙事要求档案工作者全面看待叙事的作用和价值。通过档案再现历史是档案基本价值的理想实现方式,而不仅仅是作为载体、数据、信息乃至知识形式的简单存在,这类面向人的叙事就是档案“故事化”的主要内涵。[24]在工作上,吸收“中心”数据管理教训,重视做好档案整理、著录等一系列数据基础工作,保持数据的一致性、完整性与可用性。在方法上,积极融入学科方法,承继鉴辨校勘等档案传统编修理论方法,突出档案资源的独特性、证据性;在叙事上,发挥数据叙事想象力,善于突破原有的档案整理组织结构和“英雄群体”思维,发现资源中发掘蕴含的多重角度、分支脉络以及模糊的历史群体,于叙事要素、过程、细节与角度的分解整合中发掘真实故事。
正确认识数据叙事的最终目标和变化趋势。故事是一种天然的记忆容器,而叙事化天然就是一个选择性的过程,不宜被纳入所采取的叙事结构的数据,就会“在传递过程中被过滤出去”。[25]“中心”叙事实践从“传统”的数字文本向身体实践不断延伸,朝着与“人”交互目标进发。相较于传统叙事,数据叙事在实现该目标的道路上途经的相关因素更为复杂,需要档案工作者更加关注数据与数据、媒介、设备的关联,重视数字游戏、VR沉浸设备中的网状叙事结构,视听觉互动中的想象叙事手法以及社交媒体中的参与式叙事路径等对档案数据叙事实践逻辑的发展推动力。以实现身体数据链接、文本思想共鸣为目标,重视技术等带来的叙事变革,不断挖掘档案数据资源是档案数据叙事的必要观点。
4.2 创作层面:以技术洞察创作需求,以数据融入语境网络。元话题的再思考与再探索。“中心”发展紧靠国家战略目标和研究计划,具有旺盛的生命力。在当前我国“讲好中国故事”的政策指引下,数字社会快速发展的现实趋势亦赋予了档案数据叙事以广阔发展空间。积极以国家战略为指引开展可持续研究,以新时代新成就国家记忆工程建设为依托,实现理念、方法、体系、传播的多重转向。具体至创作环节,可粗设主类,如研究型,讨论深刻社会、长远发展、学科融合话题等;推广型,创作与面向社会宣传、文创结合的趣味故事;教育型,关注情感共鸣认同建构,设计爱国、党史、学科教育内容。并根据类型,利用技术分析用户画像、数据语义、传播环境等,选取适合的创作视角、起点、逻辑、表达,沿着“数据选取——技术分析——数据调整——故事创作——故事呈现”等流程开展。在实践中拓宽主题、深化内容,打造数据时代档案经典作品。
微粒度数据的再融入与再创造。“中心”聘请卢旺达青年转录该族口述档案的做法为实践打开思路。尝试与叙事对象或后代、学者、社区工作者等主体,与学科项目等复合组织,与全国利用平台等数据系统开展合作,推动数据融入语言、文本、学科、文化、组织以及数据系统语境,是实现微粒度数据再生产的有效方法;显化原有文本、实物、行动间的意义,编织整体故事网络,创造学习、体验、想象与情感的共振空间,是实现数据叙事视角有层次、内容有温度的重要方式;尝试以围绕客观场景的故事单元,围绕客观事件的故事化线,围绕客观历史时期的故事模块为基点、路径,逐步呈现涵盖多元空间、时间、主体的社会,是以微粒度数据描绘大世界的必由之路。
4.3 组织层面:以优质作品为引领,以卓越人才为支撑。发挥佳作的牵引作用。以作品为依托,吸引资金。各类数据、工具、理论、方法、成果不断积累与广泛运用,可为组织申请各类资助提供强大支持。以作品为桥梁,吸纳人才。尝试在作品选题等环节中,寻找学科交叉兴趣点和社会结合点,提升组织建设的多元化水平。例如,“中心”尝试融合视觉艺术、摄影、表演、数字媒体、文学研究、音频和行为艺术等领域人才,讨论医疗护理等话题;以作品为参照,促进组织完善。尝试分析作品在创作、呈现等过程的困难以提升组织建设的精准度,如,“中心”在建设过程中逐渐识别项目数字化成果的长期保存问题的存在,通过积极吸纳相应领域人才、咨询可行建设方案,有针对性强化基础性技术的不足。
关注培育重点人才。首先,关注领军人才的启蒙与培养。“中心”历任主席历史学家Steven High,社会活动家Catherine Richardson,地理学家Sébastien Caquard皆为各自领域的杰出学者,受兴趣驱使参与并引导组织建立发展。Steven High在机构初创时便任加拿大口述历史研究主席,现任加拿大历史协会主席(2021—2023),具有较大的影响力与号召力。其次,培育具有数据素养的档案人才。引“中心”数据管理漏洞为鉴,档案数据叙事实践更需呼吁档案工作者参与并利用知识技能弥补既有的数据缺漏,利用理论方法助力提升组织叙事水平。再次,重视整合跨学科人才力量。“中心”以高校为中心吸引多学科人才,启示可发挥高校的优秀教师、学生的力量直接建立跨校、区域、学科的组织;或以建立国际组织分支机构为起点发展为独立组织;又或以教学为核心初建产学研协同组织再向外拓展。最后,在此基础上,积极利用数据、基础设施、专项资金等使用权建立利益交叉的组织;通过设置分权、履责、决策、执行、组织活动等治理规则建立具有纪律性和凝聚力的组织;通过设立准入、薪资、评估、退出等机制建立具有生命力的组织。
4.4 工具层面:逐阶使用技术工具,摸索运用政策工具。把握数据管理工具使用的阶段性。“中心”已有的工具开发经历和难题,启示档案叙事工具开发需分步开展。在重视基础工具的流畅稳定性与通用软件的可用适配性的基础上,关注专门工具适配性和体系性以及相应跨学科创作工具的创造性与突破性,从工具层面引导档案数据故事化朝着多样化、深入化、创新化发展。此外,需特别关注工具设备体系的协调与维护,以及工具混用造成的失焦、失距、伦理问题,不断探索工具与人文的界限。
关注政策工具的研究使用。“中心”积极利用政府资助政策与项目解决资金和合作等问题,如2005年至2019年仅Steven high个人通过项目申报获得1596500美元的资助,启示研究开展需重视利用政策工具,包括项目资助、政策意见、宣传媒体、活动平台等,如国家社会科学基金项目2022年度课题指南中“数字人文视域下口述历史档案资源开发研究”“面向数字人文的红色文献共建共享与内容挖掘研究”等选题为档案数据叙事开展提供助益。《关于构建数据基础制度更好发挥数据要素作用的意见》(2022年6月)提出“推进公共数据、企业数据、个人数据分类分级确权授权使用,建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制”则为推进解决数据使用等限制提供稳定可靠的政策支持。