数据可视化技术在政务大数据中的应用研究
2018-11-01周建功
周建功
摘要:该文介绍了有关技术背景,分析了数据可视化技术的主要架构、有关功能和具体应用。运行结果表明:应用可视化技术直观和高效地呈现政务大数据、可以提高人们对数据获取的时效性、准确性和利用率,探索出在数据量高速增长的今天,高效利用数据的一种方法。
关键词:可视化;数据;应用
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2018)18-0273-02
1 引言
数据可视化是技术上较为高级的技术方法,而这些技术方法允许利用图形、图像处理、计算机视觉以及用户界面,通过表达、建模和对立体、表面、属性以及动画的显示,综合利用认知理论、科学信息、可视化以及人机交互技术,对数据加以可视化解释。以辅助人们更为直观和高效地洞悉大数据背后的信息、知识与智慧,为大脑减负,极大地降低了数据应用的门槛。一方面,数据赋予可视化以意义;另一方面,可视化增加数据的灵性,两者相辅相成,幫助人们从海量数据中提取知识、从知识中收获价值。
2 可视化平台技术边界
2.1 可视化平台基本呈现
数据可视化平台用于对既有数据分析结果的快速呈现,把复杂抽象的数据结果,轻松化、直观化、简单化。在已经建立数据仓库基础上,运用ETL工具,对数据完成抽取、清洗、转换并建模、加工,形成一个个多维数据的情况下,可以直接部署大数据可视化技术进行报表配置和数据分析、呈现。将结果输送至电脑终端、大屏终端、pad和手机终端等。
2.2 可视化平台总体逻辑视图
数据可视化专注于数据的可视,不仅要支持传统图表形式的数据可视,也要支持以3D技术、地理信息技术融合的大数据可视化,作为大数据应用“最后一公里”的数据可视化,强调认知、可视化、人机交互的交叉与融合,利用包括文本可视化、网络可视化、时空数据可视化、多维数据可视化、关系图谱数据可视化等在内的多种可视化技术,将政府各项业务体系内部各类多源、异构、海量的数据以图形的方式呈现出来。
2.3 关键技术
DAC数据访问控制:支持连接各种数据源,包含RDBMS类、文本类、Hadoop/hive大数据平台以及其他JDBC/ODBC数据源等。同时支持实时数据源,以及第三方Webservice、http、socket数据。
数据分析引擎:基于 Map Reduce 和 Stream Computing 理论开发的分布式系统架构,支持对海量数据的高效处理和分析,数据查询达到秒级响应。采用NIO 内存映射技术能够尽量发挥机器系统的性能,所有的计算都会被以最优化的方案转化为库内计算,避免频繁的 I/O 访问数据库,加快数据的计算速度,从而获取最好的性能。高效的数据分析,提供多维分析引擎、分布式查询引擎,支持灵活的多维分析、即席查询,支持各种常见的函数,为了更好地理解数据,提供了自定义模型能力,可将以形成业务模型进行引用。
可视化设计器:基于浏览器的图形化报表编排集成开发环境(IDE),内置丰富的WEB交互组件、统计图表组件、关系图形组件、3D组件等,满足各种多样化的可视化呈现场景。
集成扩展框架:开放式的集成扩展框架,提供丰富的API和自定义组件开发规约,并提供丰富的可视化扩展组件库,供用户进行二次开发及自定义组件开发。
3 可视化技术在政务大数据的主要应用
3.1 自助数据建模
传统的基于数据仓库的数据建模用户只能用已经创建好高质量的数据仓库,而在运用数据可视化技术下,用户可以通过简单的可视化操作,将数据库中的数据表创建成待分析的数据模型,可以通过编写SQL语句建立一张虚拟的表创建模型和定义虚拟表之间进行关联,建立表与数据表和数据视图关联建模,把数据库中的数据视图作为一个虚拟的表创建数据模型。同时可视化提供的数据建模工具不依赖于客户现有的数据环境,可以创建完全自定义的数据分析模型。而且提供了数据安全机制,让用户只能访问自己受信任的数据模型,也可以通过授权方式共享给其他用户使用,即保证了数据的访问权限,也保证了开放共享。这样一套更灵活的数据建模的混合方案,不仅能够满足星型模型和雪花模型还能满足用户自定义的数据模型的创建。
3.2 可视化编排
政务大数据可视化平台设计UE是基于纯JS代码开发的IDE,可以在大多数浏览器下进行数据可视化设计,设计器可以编排适合移动端显示的页面,并提供分辨率自适应功能,以确保编排的页面能够在一定范围内适应多种不同分辨率的显示终端。平台提供的可视化组件,包括各种统计图形、图表组件等,用户只需要通过简单的拖拽和参数配置,即可创造出专业的数据分析报表、dashboard仪表盘、数据可视化大屏以及适用于移动设备的图表页面。为了在进行数据分析的同时,也能编排出一个完整的数据呈现WEB系统。大数据可视化平台设计UE增加了独有的WEB交互控件,可以设计出多样化的,具备交互能力,可用于数据呈现、数据查询、数据联动、数据分析的全套WEB查询系统。
3.3 多维数据分析
政务大数据可视化平台能提供各种常见的OLAP分析操作,除基本的分组聚合外,还可以进任意多维度分析功能。如拖拽式自由分析,在多维数据分析一体化工作台中,可以选择任意数据模型中的任意维度、度量进行自主拖拽分析。同一个模型中,所有的数据已经关联在一起了,这就决定了多维及时分析的自由度。多层钻取,在进行多维分析时,支持自由创建维度间的层级关系,构建维度分级。将具备层级的维度应用到各种图表上,即可实现自动多层钻取能力,逐层分析和查看各种数值情况。聚合,在数据分析工作中,除了对普通数据的维度、度量进行直接分析和观察数据的整体效应外,也能分析平均数、最大值、最小值等常见需求。自定义计算度量,度量(指标)可以来自原始的数据字段,同时也可以是通过公式计算得来。大数据可视化平台支持创建自定义计算字段。这些新增字段是通过原有的一个或者多个数据字段,采用普通的数学公式函数计算即可。动态查询,用户可以自由组合、动态添加各种查询条件,满足自助式的、灵活多变的查询、数据分析需求。
3.4 支持集成框架和外部引用
数据可视化设计UE能够非常方便地与其他应用进行集成。提供专门的SDK组件、提供二次开发调用接口,让开发者很容易就能进行二次开发。在平台集成和客户化功能方面,设计UE开发的报表是完全基于HTML5技术,可以灵活和第三方进行集成应用和跨平台部署。数据可视化平台发布的报表工程、页面,能通过URL或者API接口方式嵌入到第三方应用系统。根据安全要求以及第三方系统特性,同时支持免登录方式和权限认证方式。
4 结束语
利用数据可视化技术展示政务服务中各项业务所形成的海量大数据,对政务服务平台业务数据、运维数据以及其他数据进行系统对接、数据处理、视觉建模,将数据处理结果进行可视化编排,通过以直观、清晰、易于理解并美观的方式展,让抽象的数据变得具体、直观,从而很好地帮助机关工作人员和普通百姓更快地理解、利用数据,辅助各级政府进行业务决策、政策制定、资源分配和方便百姓网上办事及查询等,收到了比较好的效果。政务部门在选择和部署业务智能和分析平台时,利用数据可视化技术,让数据与政务人员之间、数据与普通百姓之间、数据价值和部门业务之间真正实现“零距离”。