知识图谱:智慧城市的下一个制高点?
2020-04-09臧根林
臧根林
智慧城市已经成为一种城市发展理念,据有关统计,目前100%的副省级城市、89%的地级以上城市、49%的县级城市已经开展智慧城市建设,累计参与的地市级城市数量达到300余个。
虽然智慧城市遍地开花,但真正出彩的成功案例其实并不多。城市管理运营包含民生、交通、教育、医疗、维稳等等几十个方面,分析大量的智慧城市建设案例后,可以发现很多知名的试点城市都是拿城市其中的一、二个点去“智慧”一下,其他部分平平淡淡,比如提出“城市大脑”概念的某公司,能拿出来说就是通过算法合理控制红绿灯,从而对城市堵车问題起到了百分之多少的作用,该“大脑”对其他城市管理问题还没见到什么“智慧”举动。
进一步分析可以发现,智慧城市的建设实际上一直是技术驱动的,某些技术的进步倒逼着城市管理的进步,由于这些年技术进步在加快,物联网、云计算、大数据、人工智能等一波未平一波又起,这也导致了很多智慧城市建设在方案设计时觉得挺先进的,等几年后建完了就觉得没什么先进性了。 IBM最早在 2009 年提出智慧城市的概念,中国是2011年开始由宁波、上海等城市探索智慧城市建设。在这之前,城市里面的各项管理基本上已经电子化,但那时还叫电子政务、电子警务等等。2009年物联网技术差不多成熟了,提出了“感知中国”的口号,也就是说,摄像头、传感器可以源源不断提供实时新鲜的数据,约二年后开始建设“智慧城市”了。没有感知,就无法“智慧”,所以第一轮智慧城市建设强调感知智慧;2013年云计算差不多成熟了,约二年后提出建设“新型智慧城市”,强调的是数据共享。的确是这样,没有云计算,政府各部门数据都在自己部门的机房里,虽然网络互通着,但共享起来不容易。云计算成熟了,部门的机房没了,不少部门信息中心、电脑室都撤消了,数据集中到了云平台,共享就容易得多;2017年大数据技术差不多成熟了,现在到处建设智慧城市开始强调大数据。按照这个规律去推测,智慧城市建设的下一轮制高点在5G、区块链、知识图谱和人工智能几个方面里产生。
5G技术将影响城市的感知方面和移动应用方面,数据采集更快更多更全,但5G技术不会对智慧城市的总体架构产生很大影响;区块链可以解决城市管理中的某些问题,如电子存证、智能合约等应用,但这只是智慧城市中的很小部分功能,对整体架构影响不大;人工智能肯定是智慧城市要发展的方向,但人工智能研究可能会非常漫长,以前已经研究了60多年,到真正在城市管理中代替人类或发挥巨大作用,也许还需要60年甚至更长,一定是缓慢的局部的推进。造成人工智能研究缓慢的原因,正是大数据和人工智能之间还存在着巨大的鸿沟,很多数学模型在实验室里可以运行,到了现实数据环境下就转不起来,比如一个有丰富经验的警察,看到一个人,凭直觉判断这个人有问题,就去查验,发现真的是罪犯,这个过程数学模型很难实现;知识图谱技术只是大数据的存储架构提升,并不是像大数据、人工智能这样的可以划时代的技术,但知识图谱是大数据走向人工智能的阶梯,知识图谱技术也许就是智慧城市的下一个制高点。
现有的智慧城市建设存在很多问题,比如各个部门之间的数据共享问题,虽然大家都希望设计成数据集中采集多处共享,实际上目前没有一个城市能真的做到,像医院化验数据,一家医院看病化验的结果,别说给城市其他部门使用,另外的医院都拿不到,按理这个数据患者交了化验费,化验结果应该属于他个人的数据;政府部门之间的数据“烟囱”现象依然很严重,虽然有顶层设计总体设计,但大部分还是各自为政,智慧民生、智慧交通、智慧医疗等等都各干各的,系统之间的协调共享不足。
理想的智慧城市模型应该是像平行宇宙一样,现实中运行着一个城市,在网络上运行着一个相对应的数字城市,现实城市运行中产生的各种数据,都实时映射到数字城市那边,也就是数字孪生,而数字城市通过人工智能的一些模型算法,及时反馈优化现实城市的运行。目前不少城市已经把数据抽取到城市大数据中心(图1.目前大部分的智慧城市结构),也实现了局部智慧,但数据结构设计还是模拟着现实城市,和这里讲的数字城市还不是一个概念。
数字城市应该从具体的事物中抽象出来,重新组合数据,形成新的数据结构,这种结构可以用知识图谱的实体、关系、属性三要素来描述和存储。一个城市最核心的要素是人,没有人其他的一切都没有意义。一个人的数据,如果按照从出生到死亡的时间轴立起来,就像一棵树,树根信息是出生之前的数据:父亲信息、母亲信息、出生地信息等等;随着年龄长大“树”也同步长高,大的“树枝”包括上学信息、婚姻信息、子女信息、就业信息等等。一个城市如果有500万人口,每个人对应一棵“信息树”或者叫“数字人”(图2.数字人,图3. 数字家庭),形成的数据我们可以称之为“数字森林”。
“数字森林”是数字城市的核心数据,“数字森林”的下面应该是支撑“数字森林”存活的基础数据,也就是维持一座城市正常运行的基础信息,如道路交通、医院、学校、企业、文化等等,如同森林下面的土地;如同对森林的管理和维护一样,哪些树木应该多浇水施肥,哪些应该除虫喷药,通过对“数字森林”的分析,知道城市中哪些弱势群体需要救助、哪些有害人员需要清除,这些管理和服务的事件数据,如同森林上方的天空。“天人地”三层结构,构成了“数字城市”的整体架构(图4.数字城市示意图),也可以叫“三才模型”。
已经有不少智慧城市建设中将数据集中管理,叫“城市大数据中心”、“数据运营中心”等,有些厂商把这样的“大数据中心”叫成“虚拟城市”,实际上和我们这里讲的基于知识图谱的“数字城市”有很大差别:一是体系架构不同。“大数据中心”把自然人、法人、城市基础数据等放在一个平面上,没有突出“人”的核心要素,“数字城市”实际上是通过对“大数据中心”的数据作深加工,提取出数据关系、属性等,重新组织的数据,在“大数据中心”之上的一层,形成“以人为本”的新的数据架构;二是数据结构不同。“大数据中心”没有存储关系,也没有“事件”根目录,而知识图谱的本体是除了实体,还有事件、文档、多媒体等作为根本体;三是起到的作用不同。基于知识图谱的数据结构,在涉及关系等方面的智能检索时速度比一般大数据结构要快几百倍;很多人工智能的数学模型可以在知识图谱的数据架构上才能运行,如果没有将数据之间的关系建立起来,就像脑细胞之间没有突触一样,脑细胞之间没有联系,这样的大脑功能不可能强大,而基于知识图谱的“数字城市”把数据之间的关系和数据一起存储,可以通过和各种算法模型配合,形成真正的“城市智脑”。也就是说,智慧城市的逻辑结构如图5所示,除了大数据中心,还应该有下面的“智脑”部分,包含知识图谱技术构建的数字城市和AI算法模型库。
设想一下,如果一个现在出生的人,从0岁开始,把他的数据孪生到数字城市那边的数字人上,一直到他老了,這些数据包括照片图像、音频视频等,足以把这个人的一生描述得非常清晰,如果他得了老年痴呆症,AI足以帮他回答各种问题,甚至他已经去世了,数字人还可以继续和后代交流。会不会在数字城市里数据只增不减导致数据量过大呢?美国的动画片《寻梦环游记》里的设想可以借鉴,就是当一个已经去世的人不再有现实这边的人想念他的时候,数字人也就彻底消失了。而那些对社会有巨大贡献的人,世世代代有人感念他们,这样的人将在数字世界里得到永生。
一个基于知识图谱技术的数字城市建设需要几年甚至更长时间,可以把这个思路称作“智城智脑2025”吧。知识图谱,应该就是智慧城市的下一个制高点。