新基建
2020-10-20杨海明
为通过“新基建”驱动智慧社会发展,我们采取云基、网联、数智三步走策略,实现数据服务产业化、技术服务产业化、平台应用产业化。
—联通系统集成公司CTO杨海明
大数据最开始是从小数据、抽样数据的概念发展起来的。我认为大数据是将所有的数据整合到一起形成的一条完整的数据链。我们经历了小数据、大数据、关键数据三个阶段,现在着眼于“如何基于关键数据构建新基建里的数据中心”这一课题。而我们谈及的数字化转型则包括政府数字化转型、产业数字化转型、大众需求转型三点。其中产业数字化转型的流程是:基于头部行业的企业需求建立数据平台,最终应用于整个行业,带动整个行业数据应用的发展,建立新的技术体系。
在区块链、5G等技术的影响下,我们了解到的大数据的内涵发生了变化。在大数据应用时,我们认识到大数据在不同行业的应用特点愈加明显。大数据的整体思路是聚数据、建平台、攻技术、定标准。从前的大数据行业聚焦于数据底层的建构,如平台搭建、数据处理等方面。而现在我们逐渐认识到数据具有强烈的行业属性,从某一行业采集的数据最终一定会应用于该行业。
基于行业导向,我们更加注重新技术的研发。随着新技术的发展,数据的入口将不仅仅分散在網站、移动端,还分布在物和人的交互点。新技术带来的变化本质上是有关人的交互方式的变化。在交互方式发生变化的情况下,新的数据应用场景将会出现,如何运用这些数据驱动整个智慧社会的发展成为了关键点。
在数据应用方面,大多数的数据应用都需要一个“脑”,这个“脑”包含了大数据、云计算等新颖的概念。这个“脑”和我们人类的大脑一样需要成长,我们需要用数据来培育“脑”,再通过“脑”将数据应用于行业。
下面我想谈一下数据运营。过去,数据运营的概念是建设平台,签合同,做项目。而如今,我们对数据运营的认知、客户的需求都在持续变化。如BI曾经的职能是负责在业务端进行技术转换,帮助非专业人士理解代码。现在大数据领域都聚焦于无代码概念,我们提供工具来帮助团队完成相应的应用框架搭建后,需求方不需要精通代码开发就能够进行应用的迭代。在这种需求下,从基础的总体需求分析能力到大数据服务方向的运营能力的演变变成了关键点。
基于大数据应用场景发生的变化,我们梳理出了构建这个时代的数字新基建的八个能力:可视化开发、数据科学研发、智慧数据应用、数据安全、数据资源目录、数据汇聚、资产管理、集群治理。这八个能力不包括数据抓取、数据中台,一方面是由于数据源是多样的,每个数据源有自己的行业特征,数据抓取无法统一这些行业特征。而另一方面,我们在应用中发现数据中台本身在分裂、分拆,不同的数据,通过不同的清洗方式,需要用不同的数据治理方法进行治理。过去我们在实施一个智慧城市项目时,只需要建立一个智慧城市的中台,但在建设过程中我们发现智慧城市的需求不断扩大,这些需求如便民服务、应急管理、数字政府等也需要在数据中台上实现,并且是用一个统一的数据中台来完成这些需求,实际上相当于把微观的需求浓缩到数据中台里面统一完成,这样反而增加了中台的工作量。
在数据集的应用方面,不同的数据集可能会产生不同的数据库应用。我们在对数据库进行扫描时,发现很多数据库的作者在阐述数据库能够解决的问题的同时,还在往边缘扩展,试图证明他们的数据库还能应用于其他领域,但特定的数据需要特定数据处理方式,这个时候我们需要统一集群治理的能力来限定每一个数据库的应用范围。
下面我们谈一谈数据的汇聚。以5G为例,5G有很多形式,如可以建立私网,因此,5G产生的数据非常复杂,汇集数据比较困难。在资源库方面,从应用的角度来看,我们并不关心数据是什么,以政府项目为例,政府内部有数据资源目录。汇集的数据要如何共享,如何使用,储存下来的数据要如何才能产生效果,这些都要以服务目录形式展现出来。在资产方面,数据逐渐有了趋同于资产的趋势。区块链行业未兴起时,我们进行数据交换时缺乏统一的标准。如果把数据看作是资产来进行处理,我们可能会加速数据库的扩展,因为两个数据集之间的碰撞,往往能取得最优的效果。
然后就是数据应用方面的问题,数据处理得出的结果需要展现出它的价值。数据很贵,不在于买数据贵,而在于数据储存技术很贵。为了让行业内的人员都能了解到数据的价值,数据的可视化成为了关键。从业人员了解数据的价值,但是做决策的人可能不懂数据逻辑,我们需要把数据展示出来,也就是要高效维护数据平台、发展人机互动、提高可视化水平、促进正向理解,让非专业人士、非IT专业人士也能理解数据的价值。数据可视化可以通过交互来实现。交互方式还在不断地变化,从开始的交互屏幕到触摸屏,到现在已经可以通过语音、图像的方式进行交互,未来将会有更多种类的交互方式出现。
最后我们谈一下数据安全。政府比较重视数据的安全性,因此,数据的开放需要有一定限度,更需要合理的监管。
(根据演讲内容整理,未经本人审核)