基于故事模型的“数据+故事”融合转化机制
2023-07-20张晨孙智中靳庆文
张晨 孙智中 靳庆文
关键词:数据;故事;融合转化机制;数据故事化;数据故事模型;传统故事模型
DOI:10.3969/j.issn.1008 -0821.2023.07.003
[中图分类号]G203 [文献标识码]A [文章编号]1008-0821(2023) 07-0023-12
故事是一种经久不衰的文学体裁,在传递人类的思想、知识、经验、情感、观念等方面发挥了巨大的价值。传统的故事往往依赖于作者的想象力,将一系列事件采用一定的艺术手法以线性或者非线性的顺序组合起来,制作出情感丰富的故事。而数据则侧重于客观和理性,数据故事通常与具体的业务目标相关联。数据故事化涉及数据和故事两大主体,可归纳为“数据+故事→数据故事”的实现过程,Duarte N也提出“故事为数据提供了框架”,数据融合入故事产生了数据故事。但这并非是数据与故事的直接连接,而是将数据融入故事中以生成新一类故事作品,由于其具备数据性且旨在解释数据分析的结果,数据故事应该被划分在數据产品的范畴。
在对故事的研究中,已有许多梳理故事情节及讲述故事内容的经典模型,这些模型也可被用于指导数据故事的生成过程。要想把客观的数据和有感情的故事融合到一起制作出高质量的数据故事,需要对传统故事的基本模型以及数据故事化模型有深入了解。本研究梳理了数据故事化的模型与结构,识别出当前数据故事化模型研究的主要问题在于忽视了“故事性”。
鉴于此,本研究从数据故事的模型视角人手,引入传统的故事模型以解析其故事性内涵,并将其引入数据故事化活动探究其实现效用,在此基础上结合“数据性”与“故事性”提出“数据+故事”的融合转化机制,讨论了数据故事从资源提取到内容转换再到产品应用过程中,数据和故事这两大主体融合并转化为有价值的数据故事产品的内在机理。最后借鉴Tableau典型数据故事化案例,详细阐释了“数据+故事”的融合转化机制的实现模式。
1相关研究
模型是用于描述或呈现事物、系统或者过程的一般规则或框架的一种表示。Outa F El等明确指出,数据故事化的模型或结构研究应该得到进一步的推动,从而帮助理解、标准化、重用和共享数据叙述。要将数据转化成面向特定需求的数据故事产品则重点在于与故事的整合,在从数据到数据故事的转换中,模型起到了支撑桥梁的作用,需要有一个数据故事化全流程的模型来指导这种转化过程。
1.1现有的数据故事化相关模型研究
近年来关于数据故事化模型主题已有了一些相关研究成果。本研究选取较早提出的有代表性的数据故事化相关模型,并将其归纳为数据故事要素模型、数据故事叙述模型和数据故事影响力模型3类,笔者根据模型内涵进行了精炼并绘制模型图以做进一步拓展讨论,如表1所示。其中,数据故事要素模型讨论了数据故事化的整体结构,有助于对数据故事化的定位及组成部分形成基本的认识;与叙事相比,故事叙述更侧重于叙述过程中的技巧与方法,故事叙述模型总结了发挥故事价值的有效叙述方式;数据故事影响力模型则表明了为使数据故事能够更好发挥效果的关键。
在这些经典模型的基础上,后续有研究者针对数据故事的特点提出了专门的模型,如朝乐门等基于三要素模型,补充了数据故事的创作者和受众两个重要部分,其中创作者需要承担编写和呈现数据故事的两项任务,创作者既是故事的作者,也是故事的讲述者;受众是数据故事的传达对象,也是需求提出者和价值实现者。Duangphummet A等聚焦于可视故事化这一数据故事化子领域,讨论了两种可视化数据故事叙述模型,分别是直接叙述和交互式探索。侯雪林等则从活动理论视角出发,探索了疫情数据故事化创建过程模式。周霞等从数据新闻的应用视角,构建了数据故事化实践路径的理论模型。也有研究者发现,虽然故事与数据故事是相互区分的两个概念,但数据故事模型可以从传统故事模型中衍生。如Yang L等基于Freytag金字塔经典故事模型,构建了数据故事框架。陈昱彤等在SW模式的基础上建立了数据叙事运行模型。
1.2数据故事化模型构建的关键问题及需求识别
数据故事是在数据故事化模型理论指导的基础上生成的产品。数据故事化作为数据分析结果的有效呈现方式,数据故事具有数据性、故事性、技术性、体验性及价值性的特征。经过调研可初步看出,数据故事化的相关模型围绕要素、叙述和影响力三大任务展开,上述典型数据故事要素模型强调了故事来源的数据性和辅助决策的价值性;叙述模型利用交互手段体现了其技术性和体验性;影响力模型关注与受众的情绪连接从而进一步展现了其体验性。综上所述,现有数据故事化模型研究存在的问题是,对数据故事的故事性关注不足。即使后续研究者采取基于传统故事模型结合数据故事化的特点的方式构建模型,但这些模型的核心要素也未体现“故事”的特点。数据故事化模型的构建若无法体现故事性特征,则受此模型指导生成的产品不足以被称为故事。因此,当前面临的一个迫切需求是将“故事”体现在数据故事化模型中,结合数据故事化来源的“数据”,将二者融合并转化为可应用的数据故事产品。
从这一需求出发,本研究在提取传统故事模型的故事要素的同时,结合数据故事化目标,分析传统故事模型的故事性如何应用于数据故事化活动,落脚在深入探究基于故事模型的“数据+故事”融合转化为“数据故事”的内在机制。
2传统故事模型在数据故事化中的效用分析
文学故事是传统的故事类型,数据故事虽然与文学故事不同,但其本质仍然是一种故事,其核心要素和叙述模式需要在遵循传统故事的基础上进行数据化的调整。因此,融合传统故事模型到数据故事化中是构建专门的数据故事化模型的前提。
2.1传统故事模型调研
对传统故事的相关理论模型与结构进行分类与整理之后将其分为4类,如表2所示。精炼模型内容并绘制模型图,并做进一步拓展讨论。故事要素模型是对故事所需内容的提炼与总结;叙事模式提供了将故事向受众叙述过程中的逻辑与规则;故事影响力模型与结构从心理与情感角度分析了受众在听故事中的情感反应。
2.1.1故事要素模型
SWIH作為一套传播模式最早由LasswellD在1932年提出,后被用作分析方法而广受认知。但在此之前,SWIH也是一种经典的故事结构,包含了1个故事或单个故事情节应该包括6个要素:内容(What)、原因(Why)、时间(When)、地点(Where)、人物(Who)和方式(How),如图1所示。例如,Kipling R[18]在1902年的《Just So Stories》中已经明确提到SWIH。五元素模型虽然没有被明确提出,但受普遍认可的一个观点是故事有5个基本但重要的元素:人物、场景、情节、冲突和解决方案,这些基本要素使故事得以顺利展开。
可见,人物是故事的首要要素,故事作者应该用足够的信息来介绍故事中的人物,让读者能够认识每个人的特征,且每个故事都应该有一个主角,主角决定了情节的发展方向,通常由主角来解决故事的中心问题。人物所发生的行为及采取的行动形成了故事的事件,也是故事的具体内容体现,从不同的划分视角体现为时间、地点、内容、原因、方式、场景、情节、冲突和解决方案等。具体来说,SWIH中的时间和地点描述了在一定的时间和空间里发生的一系列事件,时间切换和空间转移使事件发生改变;原因是指在故事中有必要解释重要事件发生的原因、冲突的导火索、故事的开头和结尾之间的因果关系;内容则呈现了故事的冲突、面临难题、目的、主题等。在五元素模型中,场景指的是故事发生的背景或环境;冲突和解决方案是故事中最重要的两类事件,体现了人物遇到困难和困难解决;情节则是故事事件的排列方式,旨在使受众能够理解作者的意图并跟随故事事件的进展而继续阅读下去。因此,人物和事件是故事的核心要素,故事围绕着人物们以及所遇到的难题展开,人物在试图解决问题的过程中发生了事件。
2.1.2叙事模式
19世纪的德国小说家Freytag曾提出“Freytag的金字塔”,明确了戏剧结构的组成部分,认为故事必须包括引言、上升期、高潮、下降期和结局5个部分,形成了故事的情节走向,其中故事的导火索是一个煽动事件,它引发了后续事件的连锁反应。在Vonnegut K的“男孩遇到女孩”故事模型中,男孩发现了一些美好的事情,然后一些不好的事情发生了(例如,女孩和男孩打架),但随后他又得到了美好的事情。Vonnegut K利用在二维坐标轴上展示故事结构的方式,在水平轴上显示故事时间(开始到结束),在垂直轴上显示故事轨迹(不幸到幸运)。叙述流程结构表示在故事中,主角经历了一系列事件,每一个事件都使他更接近或远离他的目标,常见的叙事流程结构由事件和转折点排列而成,组成故事情节。
叙事模式体现了故事情节的组织方式以及故事事件的排列方式。无论哪种叙事模式都表现出多次转折,体现了故事情节的波动性,表明故事要有开头、中间和结尾,并在其中穿插带有悬念或巨大反差的故事事件。
2.1.3故事影响力模型与结构
希腊哲学家Aristotle在其论著《修辞学》中提出,当把论点应用于3个截然不同但又不可分割的维度时其更具说服力,分别是可信度(Ethos)、理性(Logos)和情感(Pathos)。美国佛蒙特大学的计算机实验室通过进行数据过滤,在1327个故事中使用计算机建模来揭示故事情节,绘制出了6个主要的情感变化轨迹模型:①白手起家(Rags to Riches):持续的情绪上升;②江河日下(Tragedy or Riches to Rags):持续的情绪下降;③跌入洞中(Man in a Hole):情感变化轨迹为先下降后上升;④伊卡洛斯(Icarus):情感轨迹表现为先上升后下降;⑤辛德瑞拉(Cinderella):情感轨迹表现为上升一下降一上升;⑥俄狄浦斯(Oedipus):情感轨迹表现为下降一上升一下降。
故事通过影响受众的情感来传达故事观点,情感变化体现了受众对故事的反应,一个好的故事应当生动、曲折,能够使受众代入故事中的情感体验,从而使受众接受故事观点并采取行动或做出决策。
2.2传统故事模型在数据故事化中的效用
2.2.1人物和事件是故事模型的必备要素
人物要素在任何故事要素模型都不可缺少,在传统的故事中,可以通过详细描述人物角色的身体属性和性格特征来使读者想象故事中的人物,而在数据故事中,数据故事的人物要素与业务相关。故事的主人公可以是一个特定的人,也可以是一个社群或组织,对人物的描述主要通过其面临的问题、采取的行动、希望达成的目标等信息从侧面来反映。多数业务数据都直接或间接地与人相关,如客户、潜在客户、员工、合作伙伴、投资者等,在数据故事中添加人物的角色可使故事和这些人产生共鸣。数据故事中的人物可以代入实际受众,也可以虚构出人物角色来主导故事情节进展。
无论是哪种故事要素模型,数据故事的另一项核心要素可被归纳为事件,故事由一系列事件组成,事件由人物参与,包含了故事的核心内容,传统故事的事件是在设定情境下故事人物为达到目的采取行动,包含时间、地点等可被组织成文学故事的必备要素,而数据故事化的事件则展现了数据及其洞察的改变。
2.2.2情节发展促成故事叙事
情节是支撑起一个故事的基本框架,所有事件的序列遵循故事情节的组织顺序,通过推动情节发展使得故事内容按照预定节奏进行叙事。叙事与叙述是两个不同的概念,叙事强调对故事内容的记录与整理,而叙述强调对故事产品的传递。调研发现,传统故事的叙事模型已经较为完善,而数据故事化领域尚无专门的叙事模型,数据故事要体现其“故事性”需要引入传统的叙事模型。
传统故事的叙事模型虽表现方式不同,但其共同点为:情节的波动推动故事进展以及所有故事都具有开头、中间和结尾。情节的转移与改变通过事件的转折造成了故事内容的推进。数据故事的情节也要体现“拐点”,这种转折处体现了通常是值得关注的数据变化,突出引起重视的关键数据,例如在时间维度上有明显波动的数据,即一个产品的销量在某一时间点急速上升,那么这个时间点及其前后销量数据就是一个关键数据。传统故事的结尾通常较为多样,具有较大的创作空间,而数据故事的结局是对业务问题的回应,作者在结局应当给出整个故事的中心问题的解决方案。
2.2.3故事带给受众的情感有助于发揮故事效用
带有感情色彩的故事是提高人们记忆准确度和持久度的有效方式,也是影响决策的重要因素。根据受众的特点及叙述场景的不同,数据故事的讲述者需要进一步设定具体的叙述时的情感倾向。在数据故事化的过程中,数据科学家要将数据代入到特定的情境中,制作完整的数据故事,并在数据故事中注入充分的情感,推动受众做出决策和采取行动。数据故事的情感设置需要遵循两个核心原则:①尊重数据,在原始数据的基础上设定相应的场景,避免过于夸张导致对数据理解造成偏差的场景;②联系受众,数据故事化的目的在于与受众进行沟通,使受众理解数据并获取数据洞察,因此,数据故事的场景要与受众密切相关,使受众能够从故事中唤起较为强烈的情感反应。
3基于故事模型的“数据+故事”的融合转化机制
由于数据故事的生成具有步骤的约束,不同于文学故事依靠灵感可从故事的任一部分完成创作,数据故事化是指从数据到生成故事再到叙述的全过程。数据故事如果没有吸纳传统的故事模型,则导致没有体现故事的核心内涵。此外,传统故事的叙述模式比较简单,通常是在故事制作完成后由讲述者向受众单向讲述。而数据故事是由计算机制作完成,其作者和叙述者边界模糊,受众自身也可以是数据故事的作者,因此数据故事有其专门的叙述交互模型。本研究结合传统故事模型和数据故事模型提出“数据+故事”的融合转化机制及其资源提取、内容转换和产品应用的数据故事化模式,以分别基于数据故事的要素、故事叙事模式、故事叙述模式和故事的影响力模型对整个数据故事化过程的各个侧面做出理论指导。
3.1“数据+故事”的融合转化模型
根据已有的传统故事模型和数据故事化的实现需求,从资源域、转换域和应用域划分数据要素提取层、故事要素提取层、故事脚本生成层、故事产品转化层和故事产品应用层,综合构建了“数据+故事”的融合转化模型,如图1所示,旨在为数据故事化任务提供更高效和更有效的框架支撑,具体的内在转化机理在本节的后续3个部分深入阐述。
资源域是把数据故事与传统文学故事区分开的关键区域。数据故事来源于数据,并把数据融合到故事中,因此提取二者为数据故事化所需的核心要素需要有故事要素模型的指导与界定。在数据要素提取层,提取出的数据要素涵盖了数据洞察,数据分析结果是数据故事化的直接来源,为实现数据故事化的解释性目的可以引入可解释性机器学习(XAI)的解释结果,并从原始数据中抽取关键特征为数据故事补充情境。在传统的故事要素模型指导下,人物和事件是必备要素,要从数据要素中进一步提取出故事所需的人物要素和事件要素。
在转换域,将数据故事的材料进一步加工和整合以生成数据故事的脚本,并依据脚本转化为最终的故事产品。故事脚本生成层涉及将故事情节以受众所需的叙事逻辑排列,形成的脚本是故事梗概,包含了数据故事所需的基本材料,能够基于此脚本生成故事内容、制作故事产品。脚本传递给故事产品转化层后,对其进行文字或图片填充形成人类可读的故事,并赋予多媒体载体展示给受众。故事叙事模式为故事的转换提供了故事的发展路径,是将故事要素整合起来以形成人为可读产品的桥梁,也是数据故事的“故事性”得以体现的关键。传统的故事叙事模型已经较为成熟,数据故事化的叙事模式建立在传统故事叙事模式的基础上。
在应用域,故事产品得以发挥价值。故事产品应用层表现为数据故事被讲述给相应的受众而使受众获取数据洞察,并作进一步改进与优化,由于数据故事的“数据性”,通常依赖数字化手段进行故事叙述,因此,故事叙述模型体现了这一环节为受众与讲述者的互动模式。
故事影响力模型关系到数据故事最终效果的优劣,因此,其应在数据故事化的全过程发挥作用,指导数据与故事在融合转化过程中的受众情感体验。
3.2面向资源域的数据故事资源提取模式
数据故事的重点在于对数据分析结果的呈现,数据分析通常被划分为描述性分析、诊断性分析、预测性分析、规范性分析,因此,数据故事也可按照此种划分方式被应用于相应的4种分析任务,分析结果是制作数据故事的核心材料。结合原始数据集和数据集的来源等信息,以及XAI的解释结果,整理出数据故事的要素资源库。由于人物和事件是数据故事的必备要素,由数据故事要素模型整合之后,得到的是人物和事件相关联的关系,即人物参与了哪些事件以及事件由哪些人物主导,如图2所示。
3.3面向转化域的数据故事内容转换模式
情节的发展促成故事的发展,数据故事内容的生成需要以一定的叙事逻辑排列故事情节,从数据故事的人物与事件中提取出故事的情节并与故事的叙事模式整合,可组织成为具有情节波动的故事脚本。故事的脚本决定了故事的大纲和走向,包含了故事的每一个片段。传统故事不同的是,计算机自动生成的数据故事是数据故事化的研究目标,因此语义描述框架可作为故事脚本为自动故事化提供原材料。此外,可视故事化作为数据故事化的重要类型,可视化仪表板也是故事脚本的组成部分。在对故事脚本进行自然语言处理、自然语言生成、数据可视化等操作之后才能够生成人类可读的数据故事产品,其可为文本、图片、视频、音频、动画等形式提供给受众,如图3所示。
3.4面向应用域的数据故事产品应用模式
数据故事的讲述者可以是人,也可以是计算机,数据产品生成后由讲述者传递给受众才可以使受众获取数据洞察并发挥数据价值。数据故事的讲述模式根据讲述者与受众的驱动程度不同遵循不同的叙述模型。讲述路径由讲述者向受众讲述后,受众再自行与讲述者互动以获取更多的信息,尤其在计算机为讲述者的模式下,受众的交互是获得数据洞察的重要方式。讲述效果提升依赖受众向讲述者反馈产品体验、产品评价及在已有产品中无法解决的问题,故事的创作者再对数据故事产品改进与优化后由讲述者讲述给受众,如图4所示。
4案例阐释
“地震真的越来越频繁了吗?(Are Big Earth-quakes on the Rise?)”是Tableau推出的一个数据故事案例,其主要回答了受众关于地震是否随时间变得更加普遍的问题,因此,这一案例的业务分析问题限定在“大地震的出现频次是否有显著增加?”,故事内容包括利用故事化的方式使用户理解大地震的产生趋势。本文基于这一案例讨论在故事模型指导下“数据+故事”融合转化生成数据故事的实际应用。
4.1基于五元素模型和SPSN模型的数据故事资源提取
获取地震数据集并进行描述性分析,在工作表中可视化显示地震数据的分布,从数据集、描述性分析结果中提取数据要素和故事要素作为数据故事生成的原材料。五元素模型是聚焦在冲突及解决方案上的基础故事模型,且SPSN模型是从数据故事化的视角对五元素模型的进一步提炼总结,因此,分别利用五元素模型和SPSN模型说明数据故事的要素。
根据五元素模型,地震故事的故事要素可被确定为人物、场景、情节、冲突和解决方案。其中,故事的人物要素的主角是地震和大地震,故事讲述了1982-2013年地震的情况和大地震的发生情况。情境要素是指真实的地震情境,旨在描述地震相关的发生状态和后果。地震数据故事的发展和演化过程围绕大地震的发生频率变化展开,大地震的发生推进了情节进展。同一个数据故事可以包含多种冲突和矛盾,地震故事的冲突点在于历史上曾经发生过9.0级及以上的超级大地震,给人类带来了巨大的危害。与一般解决方案不同的是,数据故事的解决方案可设一定的“留白”,激发目标受众的认知活动,进而将目标受众的认知改变为行动,从而满足受众的业务需求。该故事经过数据分析可使受众获取关于地震发生趋势的数据洞察,并且给受众留下了进一步探索的空间。
该地震数据故事的SPSN框架如表3所示,在SPSN模型中明确了情境、问题、解决方案、下一步行动的叙述要点,后续的故事产品可在这一框架的基础上生成。
4.2基于金字塔结构的数据故事内容转换
Tableau数据故事由文字、图表和仪表板按照一定的情节组織起来进行叙事,其故事脚本以可视化仪表板的形式表现,最终填充自然语言和图表后生成交互式可视化数据故事产品,其载体为交互式图表。
结合Freytag的金字塔结构,认为故事必须包括引言、上升期、高潮、下降期和结局5个部分,数据故事的情节按照此结构组织可以基本界定故事的叙事框架。其中,此故事在引言部分主要介绍地球上每年都有大数量的地震被发现和记录,其中包含了很多的大地震。在上升期引出受众的问题需求,即已有的记录中有了大量的大地震,那么大地震是不是发生得更频繁了?在高潮点说明2004年和2011年分别在印度洋和日本发生了9.0级和9.1级的超级大地震,地震引发了海啸,造成众多人员伤亡。在这一阶段受众对地震的恐慌情绪得到加强,故事发展到了最扣人心弦的阶段,并开始发生转折。下降期受众可以看到虽然大地震的发生次数增加,但上升趋势不明显。在结局位置总结故事,回答在“上升期”提出的问题,利用数据解决受众的问题,使受众从数据中获取洞察并激发更深层次的问题以进行下一步探索。故事产品的结局如图5所示。
4.3基于向下钻取模型的数据故事产品应用
Tableau地震数据故事具有极为自由的交互性,遵循向下钻取模型,受众可在页面中自由筛选时间、数量、经纬度等,还能够自由查看其感兴趣的数据点,受众不仅可以控制故事在暂时停顿时的呈现内容,还可以控制整个故事的叙述节奏。
地震数据故事以Tableau工具为载体,利用可视化技术和文字说明的方式讲述故事,故事页面开放式呈现给受众,受众自己可以与计算机进行交互,从而自行掌控故事的进度以及查看自己感兴趣的内容。具体来说,受众可通过点击下一个和上一个故事点来查看故事进展或回溯故事,拖动筛选器可控制查看数据的范围,点击数据点可在已有的数据故事基础上深入探索数据,拥有较好的自由探索空间。
5总结
数据故事化的核心要义仍然是“故事”,主要原料是“数据”,在模型的基础上生成故事产品。数据故事也是由故事要素结合叙事、叙述和故事影响力组成和讲述,传统故事模型在数据故事化中同样适用。但数据故事化的本质是以非专业人士可理解的方式呈现数据,过于复杂的叙述模式对于受众可能加重其认知负担,因此,数据故事化中的叙事结构采用传统故事的叙事模式。在数据故事的生成过程中,传统故事模型和数据故事模型可结合使用以丰富故事内容。
本研究对传统故事模型和数据故事模型展开梳理,总结出“数据+故事”的融合转化机制及其资源提取、内容转换和产品应用的数据故事化模式,完善了数据故事化理论体系,最后结合传统故事模型与数据故事模型,分析了Tableau的地震数据故事案例,进一步明确了数据与故事的融合转化方式。但具体类型的数据故事模型尚未区分,不同类型的数据故事模型的构建与生成方法有待进一步研究。