疫情可视化设计中的数据分析与表达方法研究
——以“重庆市新型冠状病毒肺炎疫情数据可视化分析”为例
2020-04-21蒋涪陵汪泳
蒋涪陵,汪泳
四川美术学院,重庆401331
面对近年来世界各地频繁发生的突发公共卫生事件(简称突发事件),国内外涌现了大量关于疫情数据的可视化报道。这些报道不仅让读者对疫情数据有更为直观的了解,而且是大数据时代下数据可视化在突发事件中的实践与探索。本文基于可视化设计的方法论,探讨数据可视化在突发事件数据报道中的优势,并以“重庆市新型冠状病毒肺炎疫情数据可视化分析”设计为例,具体地分析了数据可视化从设计方法到结论的过程。
一、信息可视化与数据可视化的定义
信息可视化是基于计算机支持的抽象数据可视化表现手段,能被用来增强认知。早期的信息可视化是通过设计地图或图形来实现的,随后,其研究领域主要集中在人机交互上[1]。信息可视化并非是一种新的视觉表现形式。最为经典的例子是1861 年法国工程师查尔斯·约瑟夫·米纳德(Charles Joseph Minard)绘制的《拿破仑征俄图》,见图1,这张地图描述了拿破仑东征的时间、地点、气温、士兵死亡人数、前进方向等多维度数据,当读者浏览这张地图时,能够身临其境地感受到拿破仑的四十万大军是如何在长途跋涉和严寒之中逐步溃散[2],而不需要面对乏味的文本式数据。它展现了数据可视化对复杂数据信息的传达和叙事能力。
数据可视化是一种将数字、文字等数据转换成图形图像,并在各种媒介中呈现出来,进而实现人机交互处理的理论、方法和技术。在19世纪50年代的克里米亚战争期间,士兵的死亡率不断上升。然而造成死亡的真正原因并不仅是战斗伤亡。英国社会改革家、统计学家弗洛伦斯·南丁格尔(Florence Nightingale)设计的《玫瑰图》,见图2。图中蓝色区域表示由疾病造成的死亡人数;红色区域表示由伤口造成的死亡人数;黑色区域表示由其他原因造成的死亡人数。读者能够一目了然地看出士兵死亡是由于落后的医疗条件造成的。由此可见,数据可视化在传递信息的同时,还能直观地阐述了观点,使读者对事件有更深刻的理解。
图1 《拿破仑征俄图》
图2 《玫瑰图》
从宏观上看,数据可视化是对数字、文字等数据的记录;而信息可视化则是将对人们有意义的信息进行视觉化呈现。前者侧重于结构型、数值型的信息传递;后者则侧重于非结构型、非数值型的信息表现。
二、数据可视化在突发公共卫生事件数据报道中的优势
突发事件因其本身的复杂性和不确定性,受到了广泛关注。在报道突发事件时,传统的文本式数据报道已经不再符合如今读者碎片式的阅读习惯,其传播效果差强人意,数据可视化与突发事件数据报道高度契合,利用数据可视化有助于解决当下突发事件数据报道的困境。
(一)提升数据获取的交互性
无论是图文结合的静态信息,还是影音动画的动态信息,读者往往只能被动地接受信息,无法根据自己的偏好选择信息,更无法实时反馈。而数据可视化依靠互联网等技术和工具,提供了数据与读者双向互动的空间,实现了以读者为中心的数据个性化[3]。在“30 Years of HIV”中,设计者Aurelia Moser针对肯尼亚《民族日报》在1981年至2011年期间关于艾滋病毒的文章进行了分析,并利用交互式圆堆积进行了数据可视化,见图3。其中,2004 年涉及到艾滋病毒的文章最多。读者点击每一个圆圈可以清晰地看到文章所提及的患者、国家、组织等信息。这颠覆了传统型被动接受信息的模式,方便了读者快速阅读,更满足了读者希望主动获取数据的交互性需求。
(二)改善文本数据的阅读体验
在当下碎片式阅读方式盛行的时代,与文本式数据相比,读者更偏爱图形图像化的内容。传统的文本式数据过于乏味和严肃,阅读体验相对较差。运用数据可视化可以让以文本为主的数据变得轻松活泼,使人们从逻辑性文本内容转到具象的图形图像化信息。2014 年,埃博拉病毒肆虐,致死率高达90%,《赫芬顿邮报》针对疫情的扩散,利用地图标注出了病毒宿主——果蝠在非洲地区的领地分布,并在同一张图上,将不同国家受感染的情况进行数据可视化,见图4[4]。这种视觉化信息有利于改善读者的阅读体验。
(三)挖掘数据之间的关联性
传统的文本式数据缺乏针对性,已经不能满足读者对突发事件数据进行全面理解的需求,而数据可视化可以从数据采集、信息架构和视觉转化等多维度视角,深度挖掘数据之间的关联性。在2015 年,MERS病毒席卷韩国,人民网发布的《一张图读懂韩国MERS传播途径》,见图5,通过对患者的感染医院、接触时间、确诊时间进行数据可视化,并用序号标注患者的发病时间及传播顺序[5],在多维度数据之间寻求关联性,为疫情的风险预判提供了重要依据。通过可视化手段,可以帮助读者更清晰地了解突发事件的发展动向,从而揭示出突发事件数据背后的深刻含义。
图3 “30 Years of HIV”
图4 “EBOLA’S DEADLY SPREAD”
图5 《一张图读懂韩国MERS传播途径》
三、疫情可视化设计中的数据分析与表达方法
在对抗新型冠状病毒肺炎这场没有硝烟的战“疫”中,全国上下共同为了战胜疫情而不懈努力。国内外媒体针对疫情数据的实时性,纷纷运用了可视化手段对疫情数据进行报道,为读者带来了最新的疫情通报,因此,本文基于可视化设计的方法论,通过“重庆市新型冠状病毒肺炎疫情数据可视化分析”设计案例,具体地分析了数据可视化从设计方法到结论的过程。
表1 “重庆市新型冠状病毒肺炎疫情数据可视化分析”数据来源一览
(一)疫情数据分析
疫情可视化的核心不在于数据体量,而在于发现这些数据背后的深刻意义。为了能够对疫情数据进行有效管理,在设计案例中,在考虑到疫情数据的实时性、重要性等问题的基础上,提出了疫情数据可视化设计涵盖的三个关键节点,即数据采集、信息架构、视觉转化。
1.数据采集
数据采集是对疫情数据的收集,它首先是对数据理解的过程,然后才是对数据采集的过程,对数据理解得越全面,则数据采集越丰富。通过数据采集,可以对数据进行深入的梳理和分析,其核心是从海量数据中提取有效数据,“重庆市新型冠状病毒肺炎疫情数据可视化分析”数据来源一览见表1。
2.信息架构
信息架构的概念是在20 世纪70 年代由美国建筑师理查德·索尔·沃曼(Richard Saul Wurman)提出的。国内学者周晓英认为,信息架构(IA)是“组织信息和设计信息环境、信息空间或信息体系结构,以满足需求者的信息需求的一门艺术和科学”[6]。信息架构需要对所收集的数据进行结构性的梳理,形成逻辑框架,通过分析各数据之间的关系,区别于已有的疫情数据报道,从筛选出的数据中找到新颖的可视化视角,即表面信息的理解和隐性信息的挖掘。
信息架构在疫情数据可视化的过程中起着承前启后的作用,设计者对数据的理解、归纳和提炼,都与读者对信息的理解有着密切的关系。在大数据时代,读者已经陷入了对大量数据感到麻木的困境[7]。信息架构是使数据形成基本框架并挖掘出深层次意义的过程。
3.视觉转化
视觉转化是指通过视觉化手段将抽象的数据转化为图形图像化语言符号。这不仅是创意性的过程,更是逻辑性的过程[8]。在视觉转化环节中,需要将前期已经分析出的数据结论,通过对色彩、图形、版式等要素的思考进行设计。视觉转化的方式主要有非程序式和程序式。随着计算机技术的发展,已经可以通过编程或开源工具进行可视化表达。针对不同的读者意味着可视化的目标不同,目标取决于设计者想让读者接收和理解什么样的内容,因此这带来了许多不同的视觉形式。视觉转化需要在数据采集、信息架构的同时,找到新颖、独特、契合目标人群的可视化表达方法,以起到设计的有效性。
(二)疫情可视化表达方法
1.利用对比实现数据可视化
在“重庆市新型冠状病毒肺炎疫情数据可视化分析”中,笔者首先使用了对比的方法进行数据可视化,见图6。按发现首例确诊患者的日期为起始日,根据时间线与各区(县)感染顺序的推移,对比了重庆市各区(县)确诊病例的增长图形,并且通过颜色的视觉暗示来区分感染程度。与此同时,在视觉转化过程中,对图形进行了立体效果处理,避免了设计的同质化。从图6 中的变化可以看出,重庆市首例确诊患者出现在巫山县;万州区感染情况最为严重;北碚区和南川区为未受感染地区。
其次,利用面积大小、散点数量、条形长度的对比,分别对确诊病例的比例分布、性别分布及病例类型进行了数据分析(仅针对已公布活动轨迹数据),从图6中可以看出,疫情在渝东北地区较为严重,在渝东南地区相对较轻;确诊病例中,男性占比53.17%,女性占比46.83%;从病例类型来看,输入病例占比36.11%,本地病例占比63.89%。由此可见,当时疫情正处于输入期向扩散期过渡的阶段,这为疫情防控提供了直观的依据。
2.借助桑基图实现数据分析
桑基图(Sankey Diagram)也被称为桑基能量分流图或桑基能量平衡图。它是一种特定类型的流程图,图中延伸分支的宽度对应数据流量的大小,通常应用于能源、材料成分、金融等数据的可视化分析。桑基图最明显的特征是始末端的分支宽度总和相等,即所有主支宽度的总和应与所有分支宽度的总和相等,保持能量的平衡[9]。重庆市确诊病例活动轨迹数据分析(针对已公布活动轨迹数据)见图7,与桑基图的特征符合,左侧和右侧的能量总和是一致的。当左侧疫情感染各区(县)的病例增加时,右侧的性别、年龄、接触史等数据会相应增加,相反则色条数量减少。通过这样的桑基图,能更生动、更形象地分析出疫情在重庆市各区县的区(县)感染状况、男女比例、确诊年龄和接触史等流行病学调查基础内容。这为疫情数据提供了一个有借鉴意义的可视化形式。
3.基于地图的数据可视化
图6 “重庆市新型冠状病毒肺炎疫情数据可视化分析”
图7 “重庆市确诊病例活动轨迹数据分析”
地图是典型的表现疫情空间数据的方法,它能很好地将疫情在各地区的感染状况展现给读者,目前在各大媒体的应用较为广泛[10]。在“重庆市新型冠状病毒肺炎疫情地图”中,利用地图(重庆市地图来源于重庆市规划和自然资源局的“重庆市标准地图服务”)为基础,表现出疫情在重庆市各区(县)的感染情况,并运用色彩饱和度对感染程度进行视觉暗示,颜色越深表示疫情越严重,颜色越浅表示疫情越轻,见图8。
4.弱交互的置入
弱交互不仅意味着一种微型互动方式,更拓展了疫情数据的接收方式和传播观念。读者可以通过点击、搜索、对比等个性化操作,进入疫情数据的深层次结构。在“重庆市新型冠状病毒肺炎疫情地图”中(见图8),读者可以根据自己的需要,点击各区(县),实时查看指定区(县)的感染情况,疫情数据的交互性能让原本的读者变成产品的用户,从而拥有更多个性化的主动权。
图8 “重庆市新型冠状病毒肺炎疫情地图”
四、结语
大数据技术的发展及应用,为突发事件背景下的数据可视化提供了更多的可能性。本文探讨了数据可视化在突发公共卫生事件数据报道中的优势,并通过“重庆市新型冠状病毒肺炎疫情数据可视化分析”设计案例,分析、整理了适用于突发公共卫生事件下疫情可视化设计的数据分析和表达方法,为突发公共事件的设计介入、数据可视化的设计方法提供一定补充。
笔者发现,将数据可视化应用于突发事件,不仅让数据可视化最大程度地发挥它的作用,更重要的是这种视觉化、交互性的设计改善了读者的阅读体验,增加了读者的兴趣和乐趣。数据可视化在突发事件的应用与研究还处于起步阶段,其存在的不足及今后的发展还有待深入思考。