APP下载

为什么是贵阳
——贵阳和它的大数据梦想

2015-08-07

信息安全与通信保密 2015年6期

为什么是贵阳
——贵阳和它的大数据梦想

此前提起贵阳,很多人会自然而然想到美景、美食、美女,而2015年,大数据与大数据相关产业却与贵阳紧密地联系在一起。也许很多人会问,为什么是贵阳?此前,中国大数据产业观察网一篇分析文章曾表示,对比曾经的美国硅谷和现在中国贵阳,认为贵阳和一个世纪以前的硅谷很像——空气清新,生态自然,资源便宜,更重要的是,这里正在汇聚大量做“DT”的人。再细细考量一下贵州省和贵阳市在大数据方面已经取得的成果:贵州省是国内第一个基于云计算建成省级数据统一管理、支持共享平台的省份。贵阳把握“互联网+”发展先机,抢先拿下了六个关于大数据的“全国第一”:全国第一个大数据战略重点实验室(DT空间);全国第一个免费WIFI全覆盖城市;全国第一个提出块数据理念与搭建第一个“块数据”公共平台;全国第一个政府数据开放示范城市;全国第一个大数据交易中心;全国第一个大数据发展聚集区。

由此可见,以贵阳为平台和基地,打造一个像美国硅谷一样有世界影响力的中国大数据的产业链,在国家战略的统筹下,涉及到大数据产业链的各个环节,并于“事在人为” 的理想状态下,有国家政策的支持,网络环境的需要,乃至成熟的运行体系,打造一个相对比较完善的大数据产业链的生态系统,完成世界级的产业发展的引领作用,掌控产业发展先机的红利,这是我国业界追求的最终目标,是走向 “网络强国”的必由之路。

大数据新概念——块数据块数据产生背景

到目前为止,人们所讨论和应用的数据几乎都是被某个行业或领域掌握的“条数据”。无论是传统企业掌握的,如银行卡、会员卡所汇聚的企业内部数据,再到各级政府实施的信息化工程所掌握的卫生、教育、交通、财政、安全等部门数据,还是互联网企业存储的电子商务、互联网金融等行业数据,都可以定义为“条数据”,即在某个行业和领域呈链条状串起来的数据。但是这些数据被困在一个个孤立的条上,相互之间不能连接起来,这使得条数据的作用受到很大限制,产生了如下几个问题。

1、数据孤岛。条数据难以在更大范围进行数据交换、共享,使得数据和信息系统成为一个个孤岛。数据孤岛成了这个阶段的普遍问题,企业内各个环节存在着数据孤岛,企业间存在数据孤岛,政府机关之间也存在数据孤岛。

2、数据资产垄断。由于条数据的单维度性和封闭性,数据资产被少数企业所垄断,难以开放和流动,资产价值难以发挥,这不仅浪费了数据资源,而且会阻碍商业、社会治理和服务民生等领域的创新。

3、数据预测失真。在数据预测领域有很多“井底之蛙”,过错可能并不在“青蛙”,实在是“井”太深了,这只“青蛙”能掌握的就是有限领域内的有限数据,根据这些数据做出的“科学”预测也就失去了科学性,以偏概全,甚至出现重大偏差。

过去几年,以谷歌为代表的企业,大力发展基于空间信息系统的大数据,其目的是通过地图信息的载体把各种条数据联在一起,某种意义上来讲,它是块数据的一个初步尝试,但是由于数据量和开放性等原因,仍然具有很大的局限性。解决问题的根本出路,是真正意义上的块数据的产生。块数据的产生,打破了传统信息的不对称和物理区域、行业领域对信息流动的限制,通过对不同类型、来源信息的集成、挖掘、清洗,极大地改变了信息的生产、传播、加工和组织方式,进而给各个行业的创新发展带来新的驱动力推动各类产业彻底变革和再造。人类将以块数据为标志真正步入大数据时代。以往很多数据价值的外部性难题,将可以通过块数据以市场化和行政化手段实现补偿。

块数据的概念

定义

所谓块数据,就是以一个物理空间或行政区域形成的涉及人、事、物的各类数据的总和。(块数据不只是“条集合”,更是“条集构”。)

人的数据、物的数据,以及人与物,物与物的关系数据,构成了各种活动和事件的数据。

块数据的形成

开放、共享、连接是块数据形成的基本机制,在一个个“块”内形成开放、共享、连接的块数据,再把一个个块数据开放、共享、连接起来,就会产生更大的块数据网状结构。

对块数据几个范畴的理解

1、块集合。如前所述:块数据是以一个物理空间或行政区域形成的涉及人、事、物的、各类数据的总和。

首先,块数据是数据集合,包括:点数据(单点数据、多点数据)、条数据(单条数据、多条数据)、面数据(单一层面、多个层面),只是在大数据时代及其既有技术环境下,面数据与块数据同步发展形成,块数据是点线面数据的总和及组构。

其次,块数据在集合过程中,既有数据空间的填充,也有空间数据的重构,既有集合过程中的组构,也有组构过程中的集合,既有新数据的汇集,也有基于原有数据组合后的衍生数据。

再次,块数据在块组团过程中是空间网状,而不是简单堆砌,具有明显的网线、节点、脉络,及其自身内在逻辑运行规律。类似一个物理学的“电子云”,或“能级层”。

2、块规模。对有关块规模的思考,按照本书研究的领域,更多是从实践角度考虑其现实可行性。块数据的重点是关注一个人类活动相对集中的区域,及其相应的行为数据。主要是考虑人类相对较大聚落密度时的数据特征,也可以理解为,相对较为关注空间、密度及复杂行为。当然,这不意味着块数据规模就一定是一个超级大都市,但是,显然如果我们仅说地球村、大经济体,在当前的技术环境下,也可能会对块数据的操作性有较大影响。我们也思考了“块”的时间序列、数据的域、多个条数据的权重、数据组合的膨化、数据衍生的变异等涉及块数据规模等问题。对更大的“块”,建议读者考虑“块数据组团”、“超级块数据链接”、“块筛选”、“块流动”。对于更细的“块”,现有数据思维及技术已无障碍。

3、块边界。这是一个具有理论和现实双重意义的难题。首先,可以称之为一个相对独立的块数据的前提是:这个块数据要具有“块”定义域内清晰的宗旨和功能;其次,“块”的边界可以是相对丰富有弹性且动态的,因而是智慧的;再次,“块”间联系,是基于“块”中心外法线方向,持续与其他“块”链接并催化有价值的数据流,这些数据流有些是一次数据流——原生数据交换,有些是二次数据流——经过加工,或者经过不同“块”优选整合后的数据集合。

块数据的三大自我智慧

块数据时代的到来,既是一个难得的机遇,也是一个复杂的挑战。我们觉得,块数据时代,至少需要拥三大自我智慧。

一是边界识别技术。在设计阶段就应当关注块数据的边界识别技术,这将有助于提高“块”内效率,也将有助于优化“块”间价值交换,还将有助于实时识别并惩罚恶意攻击。

二是条间避让智慧。在庞杂的块数据网格内,当某些时候有些条数据有碍于“块”的宗旨和主要功能时,块数据应当具有系统的自动避让功能。块效率是为了解决条功能和条效率的问题,块数据也要解决块的自效率问题。

三是快的重构与自我修复能力。块数据的基因就包含对条数据的组合、纠偏、选择。因此,“块”的重构与自我修复能力,也是块数据自我纠偏的智慧和执行力所在。块数据本身就应当是一个高度自适应网系。

块数据的特性

1、高度关联性:“你”“我”“他”与“们”

数据的关联度越高,信息量越大,价值也就越大。块数据来源可能是一条街、一个社区甚至是一个城市,人口的关联关系相对清晰,相互之间的关联性更高。

2、立体性:块数据的维度结构

从物理上看,由“条”到“块”本身就是一个维度增加的过程,这实际上就寓意着数据结构的变化。

3、活性:随时随地都在更新

数据的活性是衡量数据价值尺度的重要指标,这里的活性就是数据的更新率和鲜活度,与条数据更新更多发生在增量上有所不同,块数据的更新既发生在增量上,也发生在存量上,同时数据更新频率更快、鲜活程度更高。

4、主体性:以人或物的活动为起源

如果说条数据的产生是源自企业“产品”的话——这里的“产品”包括企业的服务,而块数据则是围绕“人或物”的活动而产生的。

5、开放性:块数据的基因表达

在块数据时代,企业本身拥有的数据固然重要,但更重要的是对开放数据聚合分析的能力,在于通过开放是否能够把一些不关联的数据相互关联起来,特别是把那些非结构化的数据变成结构化的数据,实现结构的关联,发掘数据资源的价值。

块数据的价值

正是因为数据的开放与共享,才构成了块数据相对于“条数据”更加丰富、更加庞大的规模和关联性,这也正是块数据本来的价值所在。

1、商业模式发掘潜力巨大

块数据将以往那些分散化、碎片化的行业数据、领域数据连接起来,把以往那些“数据孤岛”连成一片,我们就可以综合分析出个人的消费喜好、生活需求、收入水平等商业要素。特别是精确找准那些高度个性化、长尾化的市场需求,孕育产生全新的商业模式。

1) 围绕数据分析本身形成新商业模式

2) 通过颠覆或注入新元素的方法,再造传统商业模式

3) 直接买卖数据的商业模式

2、社会领域应用前景广阔

块数据量化和预判的特性对社会生活的影响将是全方位、多领域的,对维护社会安全与稳定,提升社会整体运转效率,激发各个社会组织、群体、个人参与社会公益,凝聚社会共识具有不可替代性,可以讲,其在社会领域的应用价值与经济领域的应用价值同样巨大。

1) 提升社会保障水平

2) 改变社会议题管理方式

3) 推动社会组织更好履行社会责任

3、政府职能发生深刻改变

大数据时代的滚滚洪流正扑面而来,人们的衣食住行、社会的沟通与运转方式、既有的经济结构和产业发展路径都在发生深刻变革,作为公共服务的提供者和社会安全与稳定的维护者,政府也不可避免地卷入这股潮流之中,为了在一个迅猛变化的时代赢得民众的支持和社会的可持续发展,其将全力推动自身的思考方式、行为方式和与民众的互动方式升级换代。

1) 模式升级

2) 服务升级

3) 规则升级

4、社会公共文化被重新定义

块数据对社会成员活动轨迹的全天候、全方位记录和分析将影响社会文化走向和社会公共价值形成,弘扬社会正能量。

1) 形成诚信文化

2) 形成分享文化

3) 形成开放文化

4) 形成创新文化

块数据在各个领域的应用

1、商业领域:大数据,大产业

块数据正在将包括服务业、工业、农业在内的所有产业数字化。这当然不是在即有的土地、物件,或者人员身上加装MBB模块那么简单,实际上是将这一切连入互联网,装上计算系统,将生产活动中的每一个细节、人员活动中的每一次行动都记录下来,就像司法裁判中的证据一样,这些记录下来的数据就是一个个证据,然后通过证据倒推事物发展规律,让传统产业衍生出新的业态类型、运作方式,让生产生活的针对性、实效性提高到一个新的层次,从而推动产业的整体性变革。完全可以预计,这场变革将会催生一大批新的商业模式和商业机会。

块数据对产业的影响是一个递进的过程,就像“前店后厂”模式一样,基于人的主体性构建的块数据首先影响的是各类服务行业,通过数据挖掘,既能发现需求,又能创造新需求,紧接着再根据需求定制服务和产品,影响也随之向工业、农业延伸。而在这个过程中,块数据本身也逐步完善自己的产业结构,形成全产业链条。

1)服务业领域

在服务业领域,有这样一句话,“谁离客户最近,谁就能笑到最后”。这里的“近”至少包含两层意思,一是了解,既要弄清楚每一个客户的倾向,他想要什么,想要干什么。二是熟悉,就是要培养与客户的亲密度,推动客户对产品、服务背后的品牌认可度和忠诚度。

2)工业领域

工业给人的一般观感是机器化的大生产、流水线化的规模产品和冰冷的车床、坚硬的外壳,但大数据的广泛应用正在改变这一切。一是就像无数科幻影片中描述的那样,工厂中将会只剩下极少数的管理者和机器工程师,取而代之的是大量的机器人,这一场景在汽车生产中已经得到应用。二是工业产品将会具备一定程度的自我决策能力,比如空调根据外界的环境的变化自动调节温度,冰箱在某些食物放置时间过久时发出警报,等等。三是产品物流会通过一系列新算法、新技术的使用,实现物流配送的最优化,推动企业实现动态零库存的目标,从而将企业的生产效率、经营效益维持在较高水平上。这些场景实际上是工业化和信息化融合发展的结果,同时也是智能制造时代来临的重要标志。

3)农业领域

在三类产业中,农业也许是离大数据最远的行业。一方面,这个行业的从业者大部分是面朝黄土背朝天的农民,对智能化、互联网、大数据知识储备比较欠缺;另一方面,尽管近年来农业机械化推进取得了一些进展,但是实事求是的讲,农业中现代科技的含量依然偏低。所谓“穷则变,变则通”,在这样的情况下,大数据时代正在给农业以“重启”的机会。

4)块数据的全产业链

如果讲以上介绍的都是大数据特别是块数据对一二三产的影响的话,那么块数据的出现也在创造出基于服务自身需要的产业链条。这个产业链条有两种分类,一种是从“硬件”上来讲,就是构建了一整套产业体系;一种是从“软件”上来讲,就是诞生了新的商业体系。

新的产业体系

基于块数据的产业几乎涉及信息基础设施建设、硬件终端设备、软件应用等各个层级,构成了一个完整的产业体系,而且它还有一个很鲜明的特点,就是对一个地方既有的产业基础要求相对不高,对当地的生态环境、资源禀赋、地质条件等则有较高要求,这对于在传统制造业发展时代落后而生态良好的城市和地区来讲是一轮新的发展机遇。

新的商业模式

如果把数据作为一条贯穿整个大数据产业发展的主线,那么,块数据产业发展的一种思路就是以建设全城、全覆盖、全免费的Wi-Fi系统为基础,实现大数据,尤其是“块上”数据的集聚,推动互联网产业的发展和大数据交易市场的形成,最终建立完整的互联网金融产业体系。

2、民生领域:大数据,大民生

大数据特别是块数据来源于社会,服务于百姓。在民生事务中,通过将包括交通、医疗、教育、基建、商业、气象等数据以及各类企业提供的数据集成整合、公开、开发,首先能够精确分析公众的具体要求,民生服务将进入长尾化和个性化阶段;其次可以基于数据模拟等技术,能够对重大民生事项实现提前预测,变模糊被动的后端治理为见微知著的前端治理;同时基于深度学习等技术,可对重大民生问题的解决提供智能化的支持,降低服务成本,提升工作效率。可以设想,一个更加温馨、更具效率、更有个性的民生服务体系将会展现在我们面前。

1)文化教育

文化是一个社会的DNA,教育则是实现文化DNA传承的基本方式,两者共同推动着整个文明社会的形成与演进。块数据的引入,有助于改变传统教育规模化、填鸭式、流程化的人才培养方式,为文化的传播与重构注入了新的元素,无处不在的网络,各种各样的智能终端,为文化知识传播和个性化教育提供了支持,人们可得到更好的文化和教育体验。

2)健康医疗

块数据在健康医疗领域的一大运用就是基于对个人医疗历史和身体健康状况以及基因条件而做出预测,这其实只是其中一个重要方面,块数据对医疗卫生事业的改变是全方位的,将极大促进医药资源有效配置、医疗模式优化变革、医疗环境不断改善。

3)就业创业

现代社会,人们在担心能否就业的同时也在担心能否就好业——找到一份称心如意的工作,而块数据为这一问题的解决提供了一套新思路。从劳动者角度来讲,查询就业信息,结合自身专业、性格爱好、就业意向、岗位需求等的综合分析,对照企业岗位要求、企业发展现状等,通常能够找到适合自己的岗位。从用人单位来讲,通过对人才信息的全面掌握,将人才放在合适的岗位加以锻炼和培养,达到企业与人才愿景的高度契合。从政府主管部门来讲,借助块数据,一方面在平台建设上可以极大扩充数据量,而且是不同行业、不同地域的数据,从而为挖掘数据价值提供更好的基础。

4)社会保障

块数据在社会保障方面的应用,一是实现了时空大扩容,把工作延伸到了八小时外以及传统方式中覆盖不到的地方和人群。二是实现了长尾化,让那些个性化的救助帮扶能够纳入到社会保障体系中来,从而提升老百姓对政府工作的满意度。

5)交通出行

随着块数据时代的到来,我们在交通治理上迎来了机遇,通过在及时、全面、海量的数据基础上建立的科学分析交通管理体系,可以实现在 不断扩大路网规模的前提下,增强交通路网的通行能力。

6)城市安全

在城市安全方面,我们可以更多地依靠块数据的技术手段,搭建解决安全问题的新路子,这个路子既可以提升发生安全事故时的应急处理能力,更能够实现提前研判和预防。

7)块数据的全服务链

我们知道,块数据最大的价值在于实现一个区域单位内不同条数据的融合和共享,并从中挖掘新的使用价值。在民生工作领域,全服务链凭借着大量条数据的融合、分析,一方面将原有的服务体验做到更好,另一方面提供更多的民生服务,让老百姓的生活更美好。

3、政府治理领域:大数据,大治理

未来,在块数据思维的引领下,政府既有行为模式将会发生大转变。在信息全面深入公开的背景下,规范自身行为不仅仅是出于领导意志或者较为空洞的舆论压力,更是应对大数据时代挑战的内在的、紧迫的现实路径选择。在数据化建模和决策的推动下,政府“拍脑袋”决策的现象将大为减少,民众的意见将会以一种更加快速、更加便捷、更加集中的方式引入到政府日常管理之中。特别是,政府既有的工作链条将会大大缩短,“花钱才能办事、跑腿才能办成”将真正成为过去式。