数据可视化的设计逻辑的分析
2023-01-08杨文琦
杨文琦
(中国传媒大学广告学院)
数据可视化是一门边缘性学科,它包含了统计学、设计学、认知心理学等多个领域。将浩瀚如海的数据中包含的信息进行可视化,把数据中所隐含的关系变化呈现出来,能够帮助人们理解事物、传播信息和解决问题,因此,数据可视化这一领域在近几年不断发展。数据的可视化需要经历一个设计的过程,不同的个体或组织在设计过程中的思路和做法不尽相同。本文将不同的数据可视化的设计逻辑归纳总结,为数据可视化分门别类,阐明这些数据可视化的种类之间的差异和联系,给不了解这个领域的人一些基础性的解释。
一、含义
数据(data),是一个计算机术语,表示的是关于事物的事实,体现了事物的性质、状态和该事物与其他事物的相互关系,是一种高度抽象的客观存在。一个孤立的数据没有特定的含义,将其进行特定的表达或者是排列组合才让一个抽象的数字体现出事实。互联网的发展使得人类社会生活中产生的数据,不仅是在量上大大增多,而且在种类上也更加丰富,呈现了高度的复杂性。如果想要利用数据的特性,发掘数据体现事实的功能并为人所用,就需要对其进行视觉化的加工。
可视化(visualization),是一种整合提炼信息的行为。很多事物的信息和含义难以被人们的视觉感官快速接受并理解,人们需要对其进行细致深刻的解读,甚至有相关的研究背景才能领会其含义。而可视化能够帮助人们理解事物,将事物包含的不可轻易获得的信息,转化为通过眼睛和大脑中一些具有普适性的思维逻辑就轻而易举地理解的图像。数据的可视化就是变抽象数据为具象视觉图。帮助人们理解发生在社会生活范围内的种种联系、变化。
数据可视化的过程是一个设计的过程。进行这项工作的个体或组织在面对大量数据时,往往有着自己想传达的内容或想要探究的方向,他们会依照自己的想法和思路,选用自己觉得合适并能达到自己的目的的视觉语言把数据转化为图像。这些思路以及对数据的处理,对视觉语言的选择,体现的就是一种设计逻辑。世界上第一个使用数据可视化来传递信息的人威廉·普莱费尔,在他1786年出版的《商业与政治地图册》中,有一个表现18世纪英国经济状况的数据图表,这是数据可视化最早的案例。到今天,各种表现形式的数据可视化层出不穷,这一领域随着科学技术的发展在不断地向前飞跃,在各行各业都发挥着难以言喻的影响和作用。著名的埃森哲咨询公司于2018年对900多名财务专业人士(包括450多名CFO和会计主管)进行的一项调查发现,81%的受访者认为用数据讲故事是财务专业人士的一项必备技能,这凸显了数据可视化的重要性。
因此,本文把数据可视化的设计逻辑定义为:人们在将数据转化为更明白清晰的图示时遵循的一种他(进行数据可视化的人)认为合理的流程。这个逻辑在不同的人或群体上各不相同,因为他们面对的数据不一样,或者有着不同的技术背景,追求的或是可视化的清楚美观以广泛地传播信息;或是数据的集中处理以达到一种视觉上的呈现方式,也可能是利用可视化帮助自己理解数据。因此,关于数据可视化的设计逻辑有很多种。
二、国内外研究状况
对于数据可视化的设计研究,首先在国外发展应用,并且逐渐火热起来。一些关于数据可视化的入门级别书籍,如美国统计学家Nathan Yau的《鲜活的数据:数据可视化指南》、Mark Smiciklas的《视不可当:信息图与可视化传播》,还有Noah lliinsky和Julie Steele的《数据可视化之美》等等,介绍了数据可视化时,如何对数据进行处理,针对目标应该选择什么可视化工具,选择什么样的视觉语言等一系列在数据可视化过程中可能会遇到的问题。在更深一层,国内外许多关于数据可视化的研究,很多是关于可视化数据的最新算法,也有很多是对数据可视化相关技术的探讨。在数据可视化的现实应用方面,国内外的研究范围都非常广泛,包括医学、商业、高科技相关的和新闻媒体领域甚至是政治领域,都有数据可视化的实现。
根据这些书籍和文献资料,本文将数据可视化的设计逻辑进行分类。因为数据可视化工作是相对开放的,所以设计过程中侧重点有很大的相异性。本文认为,这种重点的不同其实就是设计逻辑的不同。
(一)展示型
数据本身就是一个计算机用语,数据可视化的研究也是在计算机互联网快速发展的情况下繁荣起来的,因此,很多数据可视化的设计逻辑和技术有密切联系。在这种情况下,可视化数据的过程更注重对数据本身的整理,往往经过数据预处理、数据规范化处理、映射和绘制(可视化核心步骤)、显示这么几个步骤。这种类型体现的一种运用相关软件来显示数据意义的流程,很多情况下这些数据可视化的目的是利用数据来找到一些事实,也就是说,在进行可视化之前,人们并不明确这个对数据的可视化处理能帮自己得到什么。例如武汉理工大学艺术与设计学院的学者周航,希望通过对高校网络用户行为的数据可视化来得到学校学生使用网络的特征,进而为学校的网络管理提供依据。
平常生活中我们能够接触的数据可视化,它的目的就是以展示为主。像是柱状图扇形图等等,能够直观地帮助我们把统计得来的数据进行展示。在视觉设计上,主要是通过形状的性质如大小、位置等来体现数据的意义。很多软件都可以实现这种设计目的。普通人使用的办公软件,就可以将体量不大的数据转化为可视图形,包括柱状图,扇形图等等。而专业的可视化图形工具则包括Matplolib、Echarts 等,也可以绘制折线图、柱状图、热力图以及散点图等。这些专业工具不仅可以处理大量数据进行可视化,也可以通过建立模型来预测数据。
在展示家族信息方面,来自葡萄牙波尔图大学恩根哈利亚学院的学者何塞·博尔赫斯,提出了家谱数据可视化的新方法——上下文家族树,一个制作家谱的新工具,能够克服其它家谱工具的在某些方面的局限和不足。作者介绍,开发这个工具的公司,出发点就是要让家谱展示家族信息方面尽可能的完美,呈现的信息尽可能清晰。因此,用这个工具进行可视化家谱数据,也体现出了很强的侧重展示的设计逻辑。来自德国奥格斯堡大学的两位学者亚历乌恩鲁和阿纳托尔萨金,介绍了一个名为“蒙德里安”的统计数据可视化软件,这个软件追求给专业的测量人员和研究人员提供帮助,显然,性质和“上下文家族树”相同,利用软件,通过可视化的信息来清晰展示数据意义,理解数据本身。
展示型的数据可视化,会因为设计的信息的侧重点的不同而产生不同的设计方式。例如中西方家谱的可视化设计,就很好地体现了这一点。前文提到来自葡萄牙波尔图大学恩根哈利亚学院的学者何塞·博尔赫斯的“上下文家族树”,就是在展示信息上强调清晰完美。西方重视个体的价值,在家谱设计上追求以个人角度出发的家族统计。而中国的家谱,非常重视祖先的地位和家庭亲属关系。中国的家谱保存至今的主要来自清朝和民国,所以体现出很强的传统文化特色。北宋文学家欧阳修编撰的《欧阳氏谱图》,就是一种比较古老的家谱设计方法,简称“欧式”,“欧式”家谱的特点是世代分格,由右向左排列,五世一表。每个世代人名左侧可有一些生平记述,主要介绍该人的字、号、功名、官爵、生辰年月日、配偶、藏地、功绩等。不同的文化背景,导致设计家谱的可视化有了展示信息重点的差别。
(二)传播型
当进行数据可视化的个体或组织在得到数据之后,就对数据其中含义有了大致了解时,他们所进行的数据可视化工作,侧重的是传播信息,利用可视化之后的结果——信息图所天然带有的客观性来表现一定的内容。在这种情况下,数据的客观性被大大削弱,数据可视化得到的图示带有一定传达工作(数据可视化)者意图的主观性。为了追求这个传播效果,这种类型的传播者就会不那么强调数据的处理,而是在寻找强有力的视觉语言上下功夫,寻求最合理的数据映射和最生动直观的表达方式。例如北京印刷学院的几位学者对中国濒危物种动物中五种濒危级别较高的动物的相关数据进行了可视化展示,最终目的是呼吁人们行动起来保护濒危动物。为了达到这一目的,他们选择了非常吸引人眼球的柠檬黄色和橙色闪点和光点,并且特别处理了文字的跳跃和对比,在这次的可视化数据过程中把很多精力都放在了对视觉语言的提炼和选择上,追求传播效果。另外还有广东财经大学商学院的学者李宏,认为可以将叙事设计加入新冠肺炎疫情数据可视化设计之中,为的是减少民众不必要的恐慌情绪,刻意地减轻人们对疫情信息所产生的心理负担。在这种类型的可视化数据工作中,传递信息成为了重点。在这种情况下,数据可视化的设计者也就是信息的传播者,这种传播数据的行为就是针对信息的“编码与解码”。信息通过传播者的编码进入流通环节,并由信道传输至受众,受众接收到编码后,根据自身的情境进行解读。数据可视化则通过对数据的可视化呈现,将编码和解码的环节直接打通,受众直接获取数据源,因而大大减轻了解码过程中需要的能量损耗,触及信息核心。
(三)美学型
数据可视化随着互联网科技发展而发展,它不仅被应用在传统的医学、天气、实验等领域,而且随着时间向前,和新兴科技例如交互技术,AR、VR技术等等也联系起来。在重视美学效果的数据可视化设计过程中,虽然和侧重传播的数据可视化设计逻辑一样,会在视觉语言上花费功夫,也像展示型数据可视化设计一样把技术当作重点,但其最终目的不仅在于数据的交流和理解,也在于利用数据可视化来进行一种美学上的创造。例如上海工程大学的学者LIQI,介绍了Paras Kaul创作的3D游戏,“工作思维花园”,脑电波的活动决定了旅程的进程,根据用户的大脑频率创造出游戏体验。类似的还有北京邮电大学的学者李铁萌介绍的Jason Salavon的作品《Shoes,Domestics Produc—tion》,是以美国1960年至1998年期间生产的31种鞋的生产为驱动所创作的数据可视化作品,它既像一个俯视的喷泉,又像宇宙物质的爆炸,有着独特的美感。
数据可视化的美学设计逻辑,其实体现的是一种艺术家利用数据进行的创作。在当今时代,互联网急速发展,数据也成为一种艺术表现的媒介。利用一些简单容易操作的数据软件,艺术家创作了数据艺术作品。这种数据艺术作品,虽然被冠上了“艺术”的称呼,但是本质上仍然呈现数据,只不过是,这种作品比起一般的数据可视化更增加了美学意义。这就要求数据可视化的设计师有着良好的美学素养,能够在传递信息的基础上,创造艺术的视觉感受。对于一些内容不过分吸引人的数据来说,艺术性能够吸引人的目光,从而帮助数据信息的传播;而对于难以理解的数据来说,审美性增加了这种数据可视化的可读性,从而也更好地实现了数据传递信息的本质要求。
数据本身是一种理性客观的存在,是一种没有情感的事物,所以,并不具备吸引人的特点。而艺术美则能够满足人们的美学需求和情感需要,能够吸引人们的目光,打动人们的内心。将冰冷的数据和艺术表现结合,能够赋予枯燥的数据图表生命力,使之真正地服务于人们的生活,可以被更多人理解和接受。所以艺术和数据的结合体现了一种互相补充的设计思路。从实用性角度来讲,赋予数据以美学意义可能会显得过分修饰,但是实际上,致力于打造一个具有美观价值的数据可视化作品有着很大的实际意义。
三、结语
数据可视化的设计逻辑因为这项工作的开放性,而产生了不同。不同的设计逻辑,体现的是数据可视化工作者对数据的解读角度,利用方式和最终目标,他们的可视化工作虽然都经历了对原始数据的加工,对映射和设计语言的选择、表现这几个步骤,但是在这项工作开展的过程中,他们作为设计者的思路,差异很大。当明确了利用数据的目的,就能更好地使数据发挥作用,运用合适的方式来展现数据的奥秘。
数据需要设计师的处理,才能清晰直观,而在这个处理过程中,难免会产生一些问题。首先在于一些数据可视化的作品过分讲究美感,而忽视数据信息的传递,舍本逐末,这样做显然就失去了数据的意义;还有一些数据可视化的作品没有对数据进行整理,所呈现出来的信息过于丰富,产生了难以传递信息的问题。解决这些问题既需要对数据的深度掌握,也需要对视觉图像有一定的表现能力。