APP下载

数据可视化研究综述

2021-12-28刘滨刘增杰刘宇李子文陈莉孙中贤王莹张一辉赵佳盛张红斌刘青

河北科技大学学报 2021年6期
关键词:数据可视化

刘滨 刘增杰 刘宇 李子文 陈莉 孙中贤 王莹 张一辉 赵佳盛 张红斌 刘青

摘 要:數据可视化对于从海量数据中发现规律、增强数据表现、提升交互效率具有重要作用。目前,数据可视化的概念及相关研究领域不断扩展,就数据类型而言,可视化研究逐渐聚焦于多维数据、时序数据、网络数据和层次化数据等领域。通过对中国知网(CNKI)中外文文献进行分析可知:2014年、2015年是数据可视化领域研究热度升级、理论成果大量产出的“里程碑”式年份;中国大数据领域研究热潮形成后,数据可视化是迅速发展的一个重要支撑领域;国内外数据可视化领域的研究,在时间上基本同步,而武汉大学、浙江大学、北京邮电大学、国防科技大学、电子科技大学等都是在该领域研究活跃度较高的国内高校。

要获得良好的视觉效果,帮助用户降低理解难度,高效分析数据和洞悉价值,通常还需要注意色彩与语义、突出核心数据、防止数据过载、防止思维过度发散等技术要点。现有的数据可视化技术主要分为基于几何技术、基于图标技术、基于降维技术、面向像素技术、基于时间序列技术、基于网络数据技术的数据可视化方法,以及层次可视化技术和分布技术等。基于几何技术的可视化方法,包括平行坐标、散点图矩阵、Andrews曲线等。基于坐标的可视化方法,可以清晰展示变量间的关系,但受限于屏幕尺寸,当数据维度超过3个时,难以直观显示全部维度,需要结合人机交互技术进行展示,适用于表达不同维度之间的相关关系,比如学生学习行为之间的关联关系等。基于图标的可视化方法,主要包括星绘法和Chernoff面法,以几何图形作为图标刻画多维数据,直观反映出图标各个维度所表示的意义,适用于工作完成情况、激励工作进度概览等。基于降维技术的可视化方法,根据维度属性确定点的坐标,在保持数据关系不变的前提下映射到低维可视空间中,主要涉及主成分分析、自组织映射、等距映射等。基于时间序列的可视化方法,是一种显示数据间相互关系和影响程度的可视化方法,主要包含线形图、堆积图、地平线图等,随着时间发展采集相应数据,并利用上述3类可视化方法进行呈现,适用于表示信息数据流动和变化状态,如不同时间段成绩流向趋势分布、主题概念的变迁等。基于网络数据的可视化方法,核心是自动布局算法,通过自动布局与计算绘制成网状结构图形,主要有力导向布局、圆形布局、网格布局等,常用来表示大规模社交网络结构,适用于活跃度分析、引文关系展现等。层次可视化技术,主要包括节点链接、空间填充、混合方法等,通过绘制不同形状的节点和包围框来表示层次结构的数据,适用于表示群组成员间交互关系的发现和挖掘,如在线协作员工之间的交互。

基于CNKI,通过对数据可视化研究情况的分析,提出数据可视化研究过程中的注意点,指出数据可视化需要重点考虑色彩的匹配,在色彩与数据内容的重要度之间建立关联;可视化方案应在满足业务需求的基础上以业务逻辑为依据,合理组合与应用相关可视化技术;统一的可视化风格有助于提升人们理解数据的连贯性、一致性和效率,兼顾用户的审美要求,在风格与色彩之间建立合理的匹配关系;数据可视化应以实用、合理、高效地表现关键过程、关键目标、关键结果为主要面向。此外,对可视化应用实例Echarts展开综述,包括Echarts 交互组件(markPoint和markLine标注点组件、dataZoom区域组件、图例交互组件)在可视化中的应用,以及动态数据绘制等。最后,对可视化存在的挑战以及未来研究方向进行了分析和展望,指出虚拟现实、可视化系统和数据分析是可视化未来的研究方向,其应用热点领域还包括统计可视化、新闻可视化、思维可视化、社交网络可视化和搜索日志可视化等。

关键词:计算机图形学;数据可视化;多维数据;时序数据;网络数据;层次化数据

中图分类号:TP393   文献标识码:A

doi:10.7535/hbkd.2021yx06012

Review of data visualization research

LIU Bin1,2,LIU Zengjie1,2,LIU Yu3 ,LI Ziwen4,CHEN Li5,SUN Zhongxian1,2,WANG Ying1,2,ZHANG Yihui1,2,ZHAO Jiasheng1,2,ZHANG Hongbin6,LIU Qing1,2

(1.School of Economics and Management,Hebei University of Science and Technology,Shijiazhuang,Hebei 050018,China;2.Research Center of Big Data and Social Computing,Hebei University of Science and Technology,Shijiazhuang,Hebei 050018,China;3.Library,Hebei Professional College of Political Science and Law,Shijiazhuang,Hebei 050061,China;4.Hebei Institute of Laser Company Limited,Shijiazhuang,Hebei 050081,China;5.Air Force Early Warning Academy,Wuhan,Hubei 430019,China;6.School of Information Science and Engineering,Hebei University of Science and Techno-logy,Shijiazhuang,Hebei 050018,China)

Abstract:

Data visualization plays an important role in discovering rules from massive data,enhancing data performance and improving interaction efficiency.At present,the concept of data visualization and related research fields are expanding.In terms of data types,the current visualization research gradually focuses on the fields of multidimensional data,time series data,network data and hierarchical data.Through the analysis of Chinese and foreign literature on CNKI,

it can be seen that 2014 and 2015 are "milestone" years in which the research heat in the field of data visualization is upgraded and a large number of theoretical achievements are produced;Data visualization is an important supporting field of rapid development after the formation of the research upsurge in the field of big data in China;The research in the field of data visualization at home and abroad has basically achieved synchronization in time;Wuhan University,Zhejiang University,Beijing University of Posts and telecommunications,University of national defense science and technology and University of Electronic Science and technology research actively in this field in China.In order to obtain good visual effects,help users reduce the difficulty of understanding,efficiently analyze data and insight value,It is usually necessary to pay attention to technical points such as color and semantics,highlighting core data,preventing data overload and preventing excessive divergence of thinking.The existing data visualization technologies are mainly divided into geometry based technology,icon based technology,dimension reduction based technology,pixel oriented technology,time series based technology,network data based technology,hierarchical visualization technology and distribution technology.Visualization methods based on geometric technology,including parallel coordinates,scatter matrix,Andrews curve,etc;The coordinate based visualization method can clearly show the relationship between variables,but limited by the screen size,it is difficult to visually display all dimensions when the data dimensions exceed three.It needs to be displayed in combination with human-computer interaction technology,which is suitable for the correlation between different dimensions,such as the correlation between students' learning behaviors;Icon based visualization method mainly includes star drawing method and Chernoff surface method.Geometric graphics are used as icons to depict multi-dimensional data,which intuitively reflects the visual significance of each work surface.It is suitable for work completion and incentive work progress overview,etc;The visualization method based on dimension reduction technology determines the coordinates of points according to the dimension attributes and maps them to the low-dimensional visual space on the premise of keeping the data relationship unchanged.The dimension reduction technology mainly involves principal component analysis,self-organizing mapping,isometric mapping,etc;The visualization method based on time series is a visualization method to display the relationship and influence degree between data,mainly including linear graph,stacking graph,horizon graph,etc.the corresponding data is collected with the development of time and presented by the above three visualization methods,which is suitable for representing the flow and change state of information data,such as the trend distribution of grades in different time periods and the change of theme concepts,etc;The core of the visualization method based on network data is the automatic layout algorithm,which draws the graph of network structure through automatic layout and calculation.It mainly strongly guides the layout,circular layout and grid layout,etc.It is commonly used to represent the large-scale social network structure,which is suitable for activity analysis,citation relationship,etc;Hierarchical visualization technology mainly includes node connection,space filling and hybrid methods,etc.it represents the data of hierarchical structure by drawing nodes and bounding boxes with different shapes.It is suitable for the discovery and mining of interactive relationships among group members,such as the interaction between online collaborative employees.

Based on the analysis of data visualization CNKI research,this paper puts forward some points for attention in the process of data visualization,and points out that data visualization technology needs to focus on color matching and establish a relationship between color and the importance of data content;The visualization scheme shall reasonably combine and apply relevant visualization technologies based on business logic on the basis of meeting business needs;The unified visualization style helps to improve the coherence,consistency and efficiency of people's understanding of data;At the same time,It also takes into account the aesthetic requirements of users and establishes a reasonable matching relationship between style and color;Data visualization should focus on the practical,reasonable and efficient performance of key processes,key objectives and key results.This paper also summarizes the visualization application example Echarts,including the application of Echarts interactive components (markPoint and markLine annotation point components,datazoom area components,legend interactive components) in visualization,dynamic data rendering and so on.Finally,the challenges and future research directions of visualization are analyzed and prospected,and it is pointed out that virtual reality,visualization system and data analysis are the research directions of visualization in the future.Its application also includes statistical visualization,news visualization,thinking visualization,social network visualization and search log visualization.

Keywords:

computer graphics;data visualization;multidimensional data;time series data;network data;hierarchical data

數据可视化,是近年来大数据领域各界关注的热点,属于人机交互、图形学、图像学、统计分析、地理信息等多种学科的交叉学科,综合数据处理、算法设计、软件开发、人机交互等多种知识和技能,通过图像、图表、动画等形式展现数据,诠释数据间的关系与趋势,提高阅读和理解数据的效率。就数据类型而言,当前的可视化研究逐渐聚焦于多维数据、时序数据、网络数据和层次化数据等领域[1-5]。当前,武汉大学、浙江大学、北京邮电大学、国防科技大学等形成了国内该研究领域的“第一梯队”。由于在业务逻辑、数据内涵、实施目标、设计水平等方面存在差异,导致数据可视化应用存在着一些误区和问题。例如:色彩与语义间的失配、核心数据被次要数据“淹没”、数据过载、思维过度发散等。本文提出当前可视化研究逐渐聚焦在多维数据可视化、时间序列数据可视化、网络数据可视化和层次信息数据可视化的观点,介绍了各自的代表性方法;同时,给出数据可视化主流工具Echarts的相关应用实例。

1 基于CNKI的研究情况分析

以“数据可视化”为篇名检索词,在中国知网(CNKI)学术期刊和学位论文库中精准检索,检索出文献11 673篇(中文4 763篇、外文6 910篇)。通过分析可知:相关中文文献从2014年的402篇,上升至2015年的975篇,考虑到文章的撰写和发表周期,可以说2014年、2015年是数据可视化领域研究热度升级、理论成果大量产出的“里程碑”式年份;大数据类相关中文文献2012年396篇,2013年2 195篇,2014年4 936篇,直到后期的逐年翻倍,如实反映了中国大数据研究从2012年的逐渐兴起,到2013年渐热,再到2014年3月写入国务院《政府工作报告》后形成热潮的客观事实,也表明数据可视化是中国大数据领域研究热潮形成后迅速发展的一个重要支撑领域;相关外文文献从2014年的243篇,上升至2015年的659篇。虽然中国知网涵盖的外文文献有限,但从发展趋势来看,国内外数据可视化领域的研究,在时间上基本同步。

通过分析在数据可视化领域发表论文的高校可知,虽然国内有相当多的研究成果在国外期刊发表,但也可推知,武汉大学、浙江大学、北京邮电大学、国防科技大学、电子科技大学等都是在该领域研究活跃度较高的高校。

通过对与数据可视化主题关联度较高的前20个学科进行分析可知,计算机软件与应用学科的关联度最高,其次是自然地理学和测绘学、新闻与传媒、图书情报与数字图书馆等,计算机学科既是研究数据可视化技术的主力学科,也是为其他学科提供技术和平台支持的学科。因此,数据可视化是一个面向应用、立足实际的学科,其研发成果已经融入到测绘、互联网、电力、矿业、电信、建筑、工业、海洋、航空航天等国民经济产业,从现实需求中发现问题和解决问题,也是推动该领域快速发展的重要方式。

2 数据可视化在应用中的注意点

2.1 注重色彩与语义的联系

色彩在数据可视化中发挥着重要作用,是人们读取数值、感知趋势、发现异常的关键视觉编码元素。

与光学物理学、美学等领域关注于色彩自身属性(如波段、美感等)不同,数据可视化中的色彩设计以让用户高效地理解数据、发现规律、探索任务为目标,侧重于挖掘色彩与数据、任务、设备等可视化应用环境之间的关联关系[6]。设计者要时刻留心色彩与其用处之间的关系。例如:个推公司制作的交通热力图(见图1),红色表示人员密集度较高的情况,绿色或者黄色表示密集度较低的情况。

2.2 突出核心数据

一个数据可视化作品中的数据都是极具针对性的,应该基于用户需求展示相关数据。用户看可视化作品主要通过数据图表的展示尽早找到核心问题的答案。作品显示的无关数据越多,找出关联信息越困难,就会极度分散注意力,浪费时间。例如,图2所示的电商年度销售数据可视化图,应该将可视化重点放在销售额、订单量、完成率、增长率、重点商品的销售占比、各平台销售占比等销售数据上,而非物流配送、消费者性别、买了什么品牌的什么产品这些详细信息。优秀的数据可视化作品应该优先显示重要信息,而后是关联信息、可操作性信息,其他内容则都应该尽可能淡化。

2.3 防止数据过载

数据可视化可以贯穿情况分析与决策支持的全过程,丰富的数据可以为决策者提供更多的观察维度、更多的可分析层次。但是,丰富不等同于单纯的数据累加,超过正常观察能力的可视化数据会带来理解和思考上的障碍,影响最终的决策质量。图3给出的2013年MLS(美国职业足球大联盟)薪酬榜数据中,给出了太多的球员和薪酬数据,形成了数据过载,难以达到让观察者迅速看清全局、捕获重点和关键信息的目标。针对此问题,应对主题和属性的个数进行合理限定,确保主流阅读者能够舒适、高效地观察和理解。

2.4 避免思维过度发散

图4展示了美国货物贸易逆差和工厂雇佣员工数量的关系,但却令人难以理解,其有2个主要问题。第1个问题,贸易逆差的全部数据都是负值,而工厂雇佣人数全部是正值。在没有将2组数据归一化到同一尺度的情况下,

将其组合到一幅图中表达是不合适的。这种直白的处理方式导致了第2個问题——2组数据没有共享同一个基线。贸易逆差的基线是图顶部左半段的红线,而右边尺度的基线又在图表的底部。其实将2组数据组合在一幅图中是没有必要的。在重新设计的图表中,贸易逆差和工厂雇佣人数之间的关系更为清晰,仅仅是多占据了很小的一点额外空间[7]。针对此类问题,应该以“奥卡姆剃刀原理”为指导,即如无必要,勿增实体,在一幅图中,从维度、标注等方面,按照简单直接的原则进行设计。

3 基于特征的主要数据可视化技术

作为一门问题和目标主要来自于现实世界的学科,数据可视化在很多领域获得了研究、应用和长足进步,在从研究范围(广度)、研究精细化(深度)不断拓展学科边界的过程中,逐渐收敛成为若干热点领域。本文以数据特征来划分,介绍其中的4类技术。

3.1 多维数据可视化

3.1.1 基于几何的可视化方法

平行坐标:使用平行竖直的线来代表不同的维度,在坐标轴上描绘多维数据的数值并连接数轴上的坐标点,进而在二维空间内展示多维数据[8-11]。在可视化交互方面,有学者提出了基于平行坐标系的多维数据可视化方法,以交互方式对数据进行筛选,通过更改显示比例优化可视化效果[12-13];在可视化应用方面,雷君虎等[14]提出了利用PCA主成分分析法对高维度的数据进行降维,降维后的数据通过平行坐标系可视化,应用于香精香料指纹图谱数据;在可视化增强方面,郭翰琦等[15]提出设置传递函数、对颜色和透明度等可视化特征定义数值,优化图像效果。

散点图矩阵:通过二维坐标系中的某一组点来展示变量间的关系,将各个维度数据两两组合,按规律排列绘制成散点图[16],运用可视化方法与散点图矩阵相结合,加强对多维数据效果的显示。使用散点矩阵图可以清晰地发现变量之间的关系,但受限于屏幕尺寸,当数据维度超过3个时,难以直观显示全部维度,需要结合人机交互技术进行展示[17-19]。

Andrews曲线法:通过坐标系展示可视化效果,将多维数据通过周期函数反映到坐标系曲线中,用户通过观察曲线,感知数据聚类等情况。

3.1.2 基于图标的可视化方法

基于图标的可视化方法主要是用几何图形作为图标对多维数据进行描绘,图标的特征属性(硬度、形状、长短、大小等)体现出信息的维度,利用图标与多维数据之间的联系反映可视化效果[20]。基于图标的可视化代表性方法有星绘法(见图5)和Chernoff面法(见图6)。星绘法通过点到线的方式映射出信息维度,线段长度反映不同维度的数量值;

Chernoff面法通过对面部形状、特征等进行识别体现信息维度,并绘制脸部图,直观观察信息数据。由于Chernoff面法更加有趣高效,有利于识别各个重要特征和要素之间的关系,所以更多用户选择使用Chernoff面法[16]。

3.1.3 基于降维映射的可视化方法

降维映射可视化方法把多维信息数据看做是某一维度中的点,根据维度属性确定点的坐标,保持信息数据间关系不改变的前提下,将点映射到可视的低维空间中[21]。在降维时选择性省略掉部分信息数据,最终在二三维空间中呈现出数据集。此类方法主要涉及主成分分析、自组织映射、等距映射等方法。降维映射一般分为线性降维(如主成分分析)和非线性降维(如等距映射),通过特征选择与提取来实现。特征选择通过选择具有代表性的特征属性(简称优势维)进行降维映射,特征提取则是重组多维度属性来构建优势维度,实现降维映射,这类提取适合没有代表性特征属性的信息数据集。

3.2 时间序列数据可视化

时间序列可视化随着时间的发展采集信息数据,运用可视化技术手段进行呈现,呈现出的可视化方式主要有3种。一是线形图(见图7),通过最开始的点展示不同时间段信息数据变化,在可视化过程中信息數据呈现较多时间维度,根据不同维度建立相应图标进行排列,观察数据的变化;二是堆积图(见图8),这类图主要对所有时间序列进行叠加,出现负数时,堆积图无法处理所有的时间序列,极大程度降低了可视化的呈现效果;三是地平线图(见图9),随着时间变化清楚地观察到信息数据的变化率,颜色的深浅表示正向、负向的变动效果[23-25]。

3.3 网络数据可视化

网络数据可视化技术手段核心是自动布局算法,将信息数据通过自动布局、计算,绘制成网状结构的图形。应用较广泛的有3类。力导向布局(见图10):借助力的概念,连接受力节点绘制网状图,由于互斥力的存在,可以减少节点间的重叠,适用于描述事物之间的关系,例如计算机网络关系、社交网络关系等各类关系网络情景[26-29]。圆形布局(见图11):将所有节点自定义排序,按照顺序在圆形上排列出来,快速分析出结果,受限于屏幕大小,节点数量较多时,圆形半径越来越大,难以直观显示全部节点,适用于查找较多关联关系的节点场景,例如在圆形布局图中可明显分辨出哪些节点关联关系较多。网格布局(见图12):采用网格设计方式绘制网格状信息数据网状图,适用于分层网络,利于观察整体层次[30-35]。

3.4 层次信息数据可视化

层次结构常被用来描述具有明显层次结构的对象,包括图书馆标签、计算机层次系统或者面向对象程序类之间的继承关系等[36-40]。层次信息数据可视化用到的方法主要包括节点连接、空间填充、混合方法等。

3.4.1 节点连接

节点连接主要绘制不同形状节点表示信息数据内容,节点之间连线表示数据之间的关系(见图13)。此类层次代表技术有空间树、圆锥树(见图14)等。

3.4.2 空间填充

空间填充主要运用包围框表示层次结构信息数据,上层节点与下层节点之间包围关系表示信息数据间的结构关系[41]。此类层次代表技术有树图(见图15)、信息立方体(见图16)等。

3.4.3 混合方法

混合方法结合多种可视化技术优点,使认知行为更加高效[42]。此类方法代表技术有弹性层次(见图17)、层次网等。

综上可知,按照可视化技术划分,可视化特征及应用场景详见表1。

4 数据可视化应用实例

当前涌现出一批专注于数据可视化领域的企业,如帆软、数字冰雹、蛛网时代、Echarts数据可视化等,其以数据可视化为基础,根据用户需求设计不同模式和主题,控制数据呈现形式和视觉效果[43-47]。Echarts客户端构建前端界面使用script引入Echarts依赖JS库。客户端引入图表库流程如图18所示。

数据可视化呈现界面并非静止不变,还包括用户交互体验感、使用感受和图像反馈等。Echarts推出大量交互组件应用于可视化中[48-53],成为用户深入分析了解数据的关键手段。

4.1 markPoint和markLine标注点组件数据中往往呈现最大、最小值,markPoint和markLine组件分别用来表示增加标注点和图表标线。如图19所示,在数据可视化销量类别显示中,markPoint和markLine标注点组件显示数据。

4.2 dataZoom区域缩放组件

dataZoom区域缩放组件提供了一种人机交互能力,主要是为了达到区域缩放的效果。通过坐标轴的左右平移进行缩放,用户可以了解到数据的细节,总览整体,去除离散数据的影响;还可以观察个别数据的走势,有针对性地掌握重要数据。在可视化系统设计中,如果想关注某个专业的信息数据细节,则需要加入dataZoom区域缩放组件进行缩放,如图20所示。

4.3 图例交互组件

通过点击图例标记展示对应的数据系列,帮助用户排除不必要的数据系列,将关注点放在目标数据上。如图21所示,通过点击图例进行图例交互,显示单个图例所对应的系列数据。

4.4 动态数据绘制流程

数据可视化的图形绘制中,并不全部是静态数据,动态数据的绘制要通过Ajax技术,从服务器读取进行动态加载后呈现出来[54-55],基本流程如图22所示。

5 研究展望

有研究认为,数据可视化高频关键词为信息可视化、可视化分析、大数据和数据挖掘,其未来发展方向为协同分析和计算等[56-62]。通过对可视化领域文献进行计量,根据关键词共现图和时区图中的可视化分析、人机交互和信息可视化等研究热点,结合关键词突变图,笔者对数据可视化未来的热点和发展趋势进行全景式分析展望,认为除了虚拟现实、可视化系统和数据分析外,可视化未来研究方向还包括以下内容。

1)自动、智能化 目前数据融合越来越复杂,将工作流自动化和可视化组件结合,可以有效提高工作效率和质量;将智能科学和可视化结合,可以利用智能科学认知,弥补人类感知能力和可视化表达方面的不足,克服复杂数据分析和理解中的难题。

2)协同可视化 在可视化实现过程中,需要多团队协作完成,创造出协同可视化的环境(可视化接口设计、可视化协同平台开发、协同可视化视图设计、工作流管理等),进行工作站之间的数据资源共享,通过对可视化过程进行控制,解决多团队之间的协同性问题。

3)应用领域拓展化 数据可视化技术已经被应用到越来越多的领域,既促进了各个领域的发展,也为可视化技术自身发展和完善提供了良好环境。未来可视化的应用热点领域还包括统计可视化、新闻可视化、思维可视化、社交网络可视化和搜索日志可视化等。

数据可视化是一个以实际应用为主要面向的人机交互、图形学、图像学等多学科交叉的领域,计算机科学是推动其研究向纵深发展的主力学科,自然地理和测绘、新闻与传媒、图书情报、自动化、互联网等领域的需求推动了其应用领域的不断拓展。未来还需要对国外研究动态进行更为全面详细的梳理,并对数据可视化应用领域具有代表性的重要案例进行更為深入的探讨和分析。

参考文献/References:

[1] DOU Hui,XU Baile,SHEN Furao,et al.V-SOINN:A topology preserving visualization method for multidimensional data[J].Neurocomputing,2021,449:280-289.

[2] EADIE A,VSQUEZ I C,LIANG Xuefeng,et al.Transcriptome network data in larval zebrafish (Danio rerio) following exposure to the phenylpyrazole fipronil[J].Data in Brief,2020,33:106413.

[3] WANG Qiyao,FARAHAT A,GUPTA C,et al.Deep time series models for scarce data[J].Neurocomputing,2021,456:504-518.

[4] PASPATIS I,TSOHOU A,KOKOLAKIS S.AppAware:A policy visualization model for Mobile applications[J].Information and Com-puter Security,2020,28(1):116-132.

[5] 任磊,杜一,马帅,等.大数据可视分析综述[J].软件学报,2014,25(9):1909-1936.

REN Lei,DU Yi,MA Shuai,et al.Visual analytics towards big data[J].Journal of Software,2014,25(9):1909-1936.

[6] 曾琼,汪云海,屠长河,等.面向数据可视化的色彩计算[J].计算机辅助设计与图形学学报,2020,32(10):1549-1559.

ZENG Qiong,WANG Yunhai,TU Changhe,et al.Color computing in data visualization[J].Journal of Computer-Aided Design & Computer Graphics,2020,32(10):1549-1559.

[7] 帆软.数据可视化的三大问题+七大误区[EB/OL].https://zhuanlan.zhihu.com/p/105053580,2021-09-01.

[8] 石凯,聂富强,孙峰.多维数据判别分析的非参核密度算法研究[J].计算机工程与应用,2019,55(6):8-12.

SHI Kai,NIE Fuqiang,SUN Feng.Research on algorithm of nonparametric kernel density for discriminant analysis of multidi-mensional data[J].Computer Engineering and Applications,2019,55(6):8-12.

[9] 闫涵,张旭秀,张净丹.多感知兴趣区域特征融合的图像识别方法[J].智能系统学报,2021,16(2):263-270.

YAN Han,ZHANG Xuxiu,ZHANG Jingdan.Image recognition method based on multi-perceptual interest region feature fusion[J].Journal of Intelligent Systems,2021,16(2):263-270.

[10]FRANCIA M,MARCEL P,PERALTA V,et al.Enhancing cubes with models to describe multidimensional data[J/OL].Information Systems Frontiers.[2021-09-01].https://pubmed.ncbi.nlm.nih.gov/34131390/.

[11]PENG Zhen,LIU Wanquan,AN Senjian.Haze pollution causality mining and prediction based on multi-dimensional time series with PS-FCM[J].Information Sciences,2020,523:307-317.

[12]CHEN Yi,CHENG Xianchen,CHEN Hongqian.A multidimensional data visualization method based on parallel coordinates and enhanced ring[C]//Proceedings of 2011 International Conference on Computer Science and Network Technology.[S.l.]:IEEE,2011:2224-2229.

[13]张元鸣,高亚琳,蒋建波,等.一种基于平行坐标系的流转数据可视化方法[J].计算机应用与软件,2018,35(4):55-60.

ZHANG Yuanming,GAO Yalin,JIANG Jianbo,et al.A visualization method for flow data based on parallel coordinates[J].Computer Applications and Software,2018,35(4):55-60.

[14]雷君虎,杨家红,钟坚成,等.基于PCA和平行坐标的高维数据可视化[J].计算机工程,2011,37(1):48-50.

LEI Junhu,YANG Jiahong,ZHONG Jiancheng,et al.High-dimensional data visualization based on principal component analysis and para-llel coordinate[J].Computer Engineering,2011,37(1):48-50.

[15]郭翰琦,袁晓如.体数据可视化传递函数研究[J].计算机辅助设计与图形学学报,2012,24(10):1249-1258.

GUO Hanqi,YUAN Xiaoru.Survey on transfer functions in volume visualization[J].Journal of Computer-Aided Design & Computer Graphics,2012,24(10):1249-1258.

[16]杨彦波,刘滨,祁明月.信息可视化研究综述[J].河北科技大学学报,2014,35(1):91-102.

YANG Yanbo,LIU Bin,QI Mingyue.Review of information visualization[J].Journal of Hebei University of Science and Technology,2014,35(1):91-102.

[17]王赋攀,吴亚东,杨文超,等.一种视觉信息融合数据手套设计研究[J].计算机研究与发展,2018,55(12):2764-2774.

WANG Fupan,WU Yadong,YANG Wenchao,et al.Design and research of data glove based on visual information fusion[J].Journal of Computer Research and Development,2018,55(12):2764-2774.

[18]冯志全,乔宇,冯仕昌,等.多种手势对应同一语义的柔性映射交互算法的研究[J].电子学报,2019,47(8):1612-1617.

FENG Zhiquan,QIAO Yu,FENG Shichang,et al.Research on flexible mapping algorithm of multi-gestures to one semantic[J].Acta Electronica Sinica,2019,47(8):1612-1617.

[19]CIFLIKLI C,TARTAN E O.A model for the visualization and analysis of elevator traffic[J].Transportation Planning and Technology,2019,42(8):868-880.

[20]郑娅峰,赵亚宁,白雪,等.教育大数据可视化研究综述[J].计算机科学与探索,2021,15(3):403-422.

ZHENG Yafeng,ZHAO Yaning,BAI Xue,et al.Survey of big data visualization in education[J].Journal of Frontiers of Computer Science & Technology,2021,15(3):403-422.

[21]翟擎辰,周園春,宋秋成,等.数据降维及聚类算法在烟叶相似性分析中的应用[J].数据与计算发展前沿,2021,3(1):112-121.

ZHAI Qingchen,ZHOU Yuanchun,SONG Qiucheng,et al.Application of data dimensionality reduction and clustering algorithm in tobacco leaf similarity analysis[J].Frontier of Data and Computing Development,2021,3(1):112-121.

[22]陈法法,汤宝平,苏祖强.基于等距映射与加权KNN的旋转机械故障诊断[J].仪器仪表学报,2013,34(1):215-220.

CHEN Fafa,TANG Baoping,SU Zuqiang.Rotating machinery fault diagnosis based on isometric mapping and weighted KNN[J].Journal of Instrumentation,2013,34(1):215-220.

[23]CHEN Bingkun,HONG Zhou,CHEN Xiaojun.E-Embed:A time series visualization framework based on earth mover's distance[J].Journal of Visual Languages & Computing,2018,48:110-122.

[24]ALI M,JONES M W,XIE Xianghua,et al.TimeCluster:Dimension reduction applied to temporal data for visual analytics[J].The Visual Computer,2019,35:1013-1026.

[25]SUH A,HAJIJ M,WANG Bei,et al.Persistent homology guided force-directed graph layouts[J].IEEE Transactions on Visualization and Computer Graphics,2020,26(1):697-707.

[26]韓刘.多元异构网络复杂多维数据可视化方法[J].计算机仿真,2020,37(11):299-303.

HAN Liu.Visualization method of complex multidimensional data in multiple heterogeneous networks[J].Computer Simulation,2020,37(11):299-303.

[27]王悦.可视化指导下的图像领域深度学习模型优化方案设计[D].合肥:中国科学技术大学,2020.

WANG Yue.Design of Optimization Scheme for Deep Learning Model in Image Field Under Visual Guidance[D].Hefei:University of Science and Technology of China,2020.

[28]涂乐,陈彬捷,周志光.OD数据可视分析综述[J].计算机辅助设计与图形学学报,2021,33(8):1160-1171.

TU Le,CHEN Binjie,ZHOU Zhiguang.A survey on OD data visualization[J].Journal of Computer-Aided Design & Computer Graphics,2021,33(8):1160-1171.

[29]尹彦,张红斌,刘滨,等.网络安全态势感知中的威胁情报技术[J].河北科技大学学报,2021,42(2):195-204.

YIN Yan,ZHANG Hongbin,LIU Bin,et al.Threat intelligence technology in network security situation awareness[J].Journal of Hebei University of Science and Technology,2021,42(2):195-204.

[30]田丰,喻纯.自然人机交互新进展专题前言[J].软件学报,2019,30(10):2925-2926.

[31]许世健.沉浸式流场可视化交互技术研究[D].绵阳:西南科技大学,2021.

XU Shijian.Research on Interaction Technology of Immersive Flow Visualization[D].Mianyang:Southwest University of Science and Technology,2021.

[32]李恒,沈华伟,黄蔚,等.地理社会网络数据可视化分析研究综述[J].中文信息学报,2018,32(10):11-18.

LI Heng,SHEN Huawei,HUANG Wei,et al.Research overview of geo-social networks data visualization and analysis[J].Journal of Chinese Information Processing,2018,32(10):11-18.

[33]JO S,PARK B,LEE S,et al.OLGAVis:On-line graph analysis and visualization for bibliographic information network[J].Applied Sciences,2021,11(9):3862.

[34]MCBRIDE M.Data visualization in society[J].Journal of the Australian Library and Information Association,2021,70(1):91-92.

[35]WANG Peng.Visualization research on scientific and technological information of aviation industry in Shaanxi province[J].E3S Web of Conferences,2020,189:03014.

[36]田宇荃,趙迪,陈虎.海绵城市建设前后的可视化效果分析——以常德市为例[J].智能建筑与智慧城市,2020(6):98-99.

TIAN Yuquan,ZHAO Di,CHEN Hu.Analysis on the visual effect of sponge city before and after construction:Taking Changde city as an example[J].Intelligent Building & City Information,2020(6):98-99.

[37]WEN Yun,MIRAULT J,GRAINGER J.Fast syntax in the brain:electrophysiological evidence from the rapid parallel visual presentation paradigm (RPVP)[J].Journal of Experimental Psychology:Learning,Memory,and Cognition,2021,47(1):99-112.

[38]朱梦泽,赵海英.叙事式可视化综述[J].计算机辅助设计与图形学学报,2019,31(10):1719-1727.

ZHU Mengze,ZHAO Haiying.A summary of narrative visualization[J].Journal of Computer-Aided Design & Computer Graphics,2019,31(10):1719-1727.

[39]梁婷婷,邱素贞,陆珊.本科层次大数据人才需求可视化分析[J].智能计算机与应用,2020,10(4):276-279.

LIANG Tingting,QIU Suzhen,LU Shan.Visual analysis of undergraduate level big data talent demand[J].Intelligent Computer and Applications,2020,10(4):276-279.

[40]陶芳.网络舆论数据可视化技术研究[D].北京:北京邮电大学,2019.

TAO Fang.Research on Network Public Opinion Data Visualization Technology[D].Beijing:Beijing University of Posts and Telecommunications,2019.

[41]张甜甜,李妮,龚光红,等.一种基于数独分组的拉丁超立方试验设计方法[J].系统仿真学报,2020,32(11):2185-2191.

ZHANG Tiantian,LI Ni,GONG Guanghong,et al.A fast latin hyper cube experiment design method based on Soduku grouping[J].Journal of System Simulation,2020,32(11):2185-2191.

[42]ZHANG Lidong,VINODHINI B,MARAGATHAM T.Interactive IOT data visualization for decision making in business intelligence[J].Arabian Journal for Science and Engineering,2021,70:1-11.

[43]崔卓,贾力,黄豆,等.矩形微槽道平板热管流动与传热特性可视化[J].科学通报,2020,65(17):1770-1779.

CUI Zhuo,JIA Li,HUANG Dou,et al.The visualized investigation on flow and heat transfer characteristics of flat-plate heat pipe with micro rectangular grooves[J].Chinese Science Bulletin,2020,65(17):1770-1779.

[44]孟鑫,李洋,王学良.多组件Web可视化开发平台在调度自动化系统中的应用[J].计算机系统应用,2020,29(12):100-105.

MENG Xin,LI Yang,WANG Xueliang.Application of multi-component Web visual development platform in scheduling automation system[J].Computer Systems & Applications,2020,29(12):100-105.

[45]张慧军,陈俊杰,张小龙.利用问题求解理论来研究交互式复杂信息的可视分析行为[J].图学学报,2020,41(3):325-334.

ZHANG Huijun,CHEN Junjie,ZHANG Xiaolong.Using problem-solving theories to investigate user behaviors in interactive visual analytics of complex information[J].Journal of Graphics,2020,41(3):325-334.

[46]KRAUS M,KLEIN K,FUCHS J,et al.The value of immersive visualization[J].IEEE Computer Graphics and Applications,2021,41(4):125-132.

[47]LIU Zhansheng,BAI Wenyan.Building information modeling methods for post-earthquake retrofitting visualization of buildings using augmented reality[J].Applied Sciences,2021,11(12):5739.

[48]崔蓬.ECharts在数据可视化中的应用[J].软件工程,2019,22(6):42-46.

CUI Peng.Study on the application of ECharts in data visualization[J].Software Engineering,2019,22(6):42-46.

[49]何巍.社交媒体数据可视化分析综述[J].科学技术与工程,2020,20(32):13085-13090.

HE Wei.An overview on social media visual analytics[J].Science Technology and Engineering,2020,20(32):13085-13090.

[50]马梦宇,吴烨,陈荦,等.显示导向型的大规模地理矢量实时可视化技术[J].计算机科学,2020,47(9):117-122.

MA Mengyu,WU Ye,CHEN Luo,et al.Display-oriented data visualization technique for large-scale geographic vector data[J].Computer Science,2020,47(9):117-122.

[51]沈恩亚.大数据可视化技术及应用[J].科技导报,2020,38(3):68-83.

SHEN Enya.Big data visualization technology and applications[J].Science & Technology Review,2020,38(3):68-83.

[52]LI Mengyao,DU Wenli,QIAN Feng,et al.Total plant performance evaluation based on big data:Visualization analysis of TE process[J].Chinese Journal of Chemical Engineering,2018,26(8):1736-1749.

[53]BAKHSHI A K,AHMED M M.Utilizing black-box visualization tools to interpret non-parametric real-time risk assessment models[J].Transportmetrica A:Transport Science,2020,17(4):739-765.

[54]边根庆,陈蔚韬.面向Web的建筑三维模型可视化方法研究[J].图学学报,2021,42(5):823-832.

BIAN Genqing,CHEN Weitao.Research on web-oriented visualization method of 3D architectural model[J].Journal of Graphics,2021,42(5):823-832.

[55]駱菁菁,唐卫贞,丁继婷.基于皮尔逊系数的管制仿真训练数据独立化与因子分析下的数据可视化研究[J].计算机科学,2021,48(sup1):623-628.

LUO Jingjing,TANG Weizhen,DING Jiting.Research of ATC simulator training values independence based on pearson correlation coefficient and study of data visualization based on factor analysis[J].Computer Science,2021,48(sup1):623-628.

[56]戴国忠,陈为,洪文学,等.信息可视化和可视分析:挑战与机遇——北戴河信息可视化战略研讨会总结报告[J].中国科学:信息科学,2013,43(1):178-184.

DAI Guozhong,CHEN Wei,HONG Wenxue,et al.Information visualization and visual analysis:Challenges and opportunities - summary report of beidaihe information visualization strategy seminar[J].Science China:Information Science,2013,43(1):178-184.

[57]JIA Hekun,LIU Zhiyuan,YIN Bifeng,et al.Visualization research and optimization strategy for combustion process and emission characteristics of internal exhaust gas recirculation small non-road diesel engine[J].International Journal of Automotive Technology,2020,21(2):481-492.

[58]黄河燕,曹朝,冯冲.大数据情报分析发展机遇及其挑战[J].智能系统学报,2016,11(6):719-727.

HUANG Heyan,CAO Chao,FENG Chong.Opportunities and challenges of big data intelligence analysis[J].Journal of Intelligent Systems,2016,11(6):719-727.

[59]张新荣,马杰,张才斗,等.基于MATLAB倒立摆可视化建模仿真与控制[J].计算机工程与设计,2018,39(10):3214-3219.

ZHANG Xinrong,MA Jie,ZHANG Caidou,et al.Visualized modeling and simulation of inverted pendulum control based on MATLAB[J].Computer Engineering and Design,2018,39(10):3214-3219.

[60]LI Mengyao,DU Wenli,QIAN Feng,et al.Total plant performance evaluation based on big data:Visualization analysis of TE process[J].Chinese Journal of Chemical Engineering,2018,26(8):1736-1749.

[61]孫灿燃,崔晨,徐静乐,等.基于虚拟现实的社交网络三维可视化系统[J].计算机仿真,2019,36(7):318-322.

SUN Canran,CUI Chen,XU Jingle,et al.Social network 3D visualization system based on virtual reality[J].Computer Simulation,2019,36(7):318-322.

[62]LEE B,ISAACS K,SZAFIR D A,et al.Broadening intellectual diversity in visualization research papers[J].IEEE Computer Graphics and Applications,2019,39(4):78-85.

收稿日期:2021-09-16;修回日期:2021-10-28;责任编辑:张士莹

基金项目:国家文化和旅游科技创新工程项目(2020年度);河北省省级科技计划资助项目(20310802D,21310101D,20310701D);河北省社会科学基金项目(HB20TQ008);河北省高层次人才资助项目(A2016002015);河北省创新能力提升计划项目(20551801K);石家庄市科学技术研究与发展计划项目(19SCX01006,191130591A)

第一作者简介:刘 滨(1975—),男,河北石家庄人,教授,博士,主要从事大数据、社会计算方面的研究。

通讯作者:刘 宇副研究馆员。E-mail:446927742@qq.com

猜你喜欢

数据可视化
移动可视化架构与关键技术综述
大数据时代背景下本科教学质量动态监控系统的构建
可视化:新媒体语境下的数据、叙事与设计研究
我国数据新闻的发展困境与策略研究
基于R语言的大数据审计方法研究
数据可视化概念研究
大数据背景下数据可视化方法研究
基于B/S结构的考试成绩分析系统
基于Hadoop的商业数据可视化分析模型的研究
用户数据统计挖掘与展示