建立新的数据服务体系
2020-04-07李铁
李铁
随着信息革命和互联网的发展,在城市化高速增长的过程中,很多城市都在追逐现代化的愿景,提出了建立“信息城市”“智慧城市”和“数据城市”的目标,并且投入了巨额资金,现在绝大部分城市都建立了数据中心和信息平台。
更多依赖新技术和新信息源
但是,在我们看到的疫情防控案例中,这些平台在对疫情传播的监测和跟踪中到底发挥了多少作用,还有巨大的潜力需要挖掘。原因在于,当初投资建立的这些信息平台和数据中心,仍然利用的是传统数据源。也就是说,所谓的数据都是来自于政府内部机构的上报数据。例如统计局的普查和抽样数据,各个部门和企业的上报数据等。
这些数据作为经济社会发展年度分析报告的支撑,曾经发挥了重要作用。但是遇到了波及全国范围的如此重大的的公共卫生安全危机,这些上报的数据由于时效问题,很难发挥作用。因为要掌握人口的流动状况和空间位置,如果按照传统的数据来源,必须再次动员全社会的力量,成本巨大,而且信息的准确性也存在很大问题。这说明,我们面临着科学技术的快速发展,建立的城市数据中心和信息平台,需要发挥新的信息源数据源的作用。
这次疫情迅速传播带来的压力已经提醒了我们,面对未来的城市社会治理和公共卫生安全等一系列问题,必须调整原有的思维模式,更多依赖于新技术和新信息源,才能最终达到服务于全社会以及所有城乡居民的效果。
什么是新的信息源和数据源?其实就是以互联网、移动数据以及手机信令的空间位置信息为基础,以所有个体用户为主体形成的信息源和数据源。
简单来说,每个成年人,包括部分少年儿童,都离不开手机和网络。手机的空间定位信息是自动生成的,而网络消费中的各种定位也是经过个人授权后被网络运营商所采用的。这些基于每个人的手机信令和网络数据的信息源,同时也就构成了所谓覆盖最广的数据源。所谓大数据,并不仅包含传统的上报信息,更多的是覆盖全社会的以互联网和手机信令为基础的数据源。
在信息源和数据源中,谁的覆盖面广,数据源多,谁的社会消费影响力就越大,未来可开发的数据潜力也越突出。据统计,目前网络信息源占有优势的是腾讯、阿里巴巴、百度、京东等几家大的互联网企业,2019年腾讯微信月活跃用户9.91亿;阿里巴巴移动端月活跃用户达7.85亿,支付宝月活跃用户已经超过6.5亿;百度APP月活用户3.16亿;京东活跃购买用户3.34亿;此外,抖音月活用户达到了6.5亿。而手机信息源占有优势的是中国移动、中国联通和中国电信,它们的手机用户分别达到9.47亿、3.21亿和3.34亿,分占全国手机用户的59.2%、20%和20.8%。
网络信息数据和手机信令数据相比,在日常应用过程中,显然是网络用户占有优势。单就一个互联网企业,例如腾讯或是阿里巴巴的信息用户,就可以达到与中国移动用户相当的规模,而且应用范围十分广泛。但是从全覆盖角度看,特别是在这次疫情传播危机中对于潜在感染者的追踪,显然网络数据的覆盖能力相比之下弱于手机用户的覆盖能力。因为对于网络用户来说,一个手机可以同时提供许多个网络服务的定位,但是所有网络服务都离不开手机。也就是说,无论是腾讯和阿里,即使各自用户都覆盖了中国60%-70%的人口。但是仅此而已。两者即使相加,总用户还是这么多,所以空间定位无法做到全覆盖。对于手机用户来说,虽然总的手机用户可以达到16亿多,超出了中国的总人口。但是三大运营商的手机用户是无法重叠的,即使有一人多机现象,也很难改变用户的总规模。可以说,中国移动、中国联通和中国电信的手机用户加总,基本可以覆盖全国所有用户。从这个意义上来说,手机用户相比于互联网用户更可以做到全覆盖。
统筹使用信令数据 完成真正基于大数据的城市治理
从生活实际中也可以看到,除了少儿之外,几乎所有成年人都离不开手机。因为手机信令可以做到空间和人口全覆盖,通过手机信令的大数据系统,对人口空间移动进行全方位追踪是可以实现的。只要把三大手机运营商的信令数据统筹使用,我们就可能完成真正基于大数据的城市治理。
手机信令的追踪能力可以做到对任何一个持有人,无论是开机还是关机,一天24小时的持续定位。我们不仅可以对个人的行动轨迹进行跟踪,而且可以对城市的人群进行数据化的分析。
例如,一个城市在过去半年内有多少人口,哪些是外来的,哪些是本地的,通过手机号码的实名认证,就可以得出结果。在半年的数据保存时间内,可以对人口的流向,空间位置的聚集,做出准确的分析。出于疫情防控的需要,从手机信令入手,只需把三大运营商的数据拿来,对于武汉市在疫情初始传播到高发期间,有多少手机用户在本地,有多少是外地手机用户,就可以清楚地了解疫情涉及到的人群规模和具体的人员情况。
如果要进一步了解这些手机用户的空间变动情况,只要把这些外地和本地外出人员的手机号,特别是封城前的流动信息,通过疫情重点城市分别上报三大公司总部并发往各地公司,各地就可以根据这些手机信令数据来随时监测这些疫区外出人员的行踪。
要做到这些,既需要三大手机运营商动员全国基层公司,提供准确数据源,同时也需要相关的公司来进行大数据模型运算,建立规模人群的追踪监测系统。这样就可以清楚地得到最终的人口流向和发现疫情传播的轨迹,为全国各地的疫情防范提供最准确有效的数据源。
融合信息平台和数据平台
通过这种方式,可以大大减轻各地政府的压力,减少社会成本,实现有效精准地疫情防控。在动员三大手机运营商的基础上,也可以通过各级政府,要求各地网络运营商提供网络信息数据,对手机信令数据源进行补充。这样可以强化数据的监测能力,防止遗漏。
当然,对于手机运营商和网络运营商来说,会加大工作量和投入。但是政府的防疫总动员,可以提供专项投入予以支持。各个企业也可以把对灾区的支持,体现在数据源的支持上。
对于各级地方城市政府,这无疑也是一次最好的机会。就是利用这次疫情灾害,重新建立起面向全社会的数据服务体系,改革传统的数据搜集方法,建立以互联网和信息技术为中心,以用户数据源为基础的真正的大数据系统。把政府的信息平台和数据平台融合。从只针对政府的服务,转向为针对全社会的服务,特别是可以应付各种可能出现的各种社会危机。
對于手机运营商和互联网企业来说,通过整合数据源,真正地放大了数据利用渠道,从企业自身的需要和满足于社会责任的需要,使得长期被沉淀甚至浪费的数据源得到充分的利用,而且在数据全覆盖的过程中发现新的商业机会和社会服务机会。
一些有能力提供数据服务的企业,则可以利用这次数据整合进行深入研发,建立新型的社会公众服务和商业服务的数据信息平台。
中央政府一方面也可以在在疫情危机中,有效利用手机和网络数据源,通过购买服务的方式,支持企业的数据储存库建设。各个手机运营商和网络运营商,因为数据储存会占用资金和资源,大多都在半年或最多两年内就删除过往数据。如果中央政府支持企业建立数据储备库,对于手机运营商和网络运营商长期闲置和浪费的数据资源应该是一次最好的再生和无限利用机会,可以为国家和城市以及各类企业进行更为广泛的服务。
另一方面,经过这次疫情危机,一些互联网大数据企业可以成立新的公司,利用新的数据源展开商业和社会服务,政府也可以把数据服务交给市场,形成新的数据源管理方式,提高应对城市和社会治理,以及各种突发性危机的效率,并降低成本。