交通大数据应用之殇
2019-04-30
大数据在体量上指规模庞大的信息和海量的数据,信息量大到无法利用传统的方法(无论是技术手段还是人工方式)进行分析或有针对性地过滤。同时,大数据技术不适用于所有应用场景,也不能解决所有交通问题。但是,仍然有许多企业为了自身的利益,过度宣传大数据的效用,把大数据说成是“包治百病”的“万能药”。此外,有许多交通业务部门由于交通问题解决的迫切性,对大数据技术期望太高,认为大数据技术能够解决目前急需解决的问题,投入大量的资金、物力和人力,却导致了“一窝蜂”的浪费。
大数据不是万能的
大数据平台需要高投入,高投入却很难带来高效益,这才是目前大数据给交通行业带来的不能承受之重。
一方面,过去几年随着大数据概念的兴起,大数据技术不断发展,IT公司纷纷转型成为大数据公司,意图获得高估值。但是,大数据概念的热炒,催生了一个又一个泡沫,原因在于概念多于实践,忽视了技术发展过程中的问题,如国内数据开放程度低,没有充足的“大”数据;数据应用概念不落地,没有技术支撑;数据服务或者技术服务目标不明确,只为建设而建设;定制化属性难以标准化,难以达成规模效益。
另一方面,交通管理层对“大数据技术”期望太高,无论是否具有大数据所必需的基础,都要建设大数据平台,好像应用了大数据技术,建立了大数据平台,便拥有当今最先进的技术,拥有了今后所有业务系统的基础,并可以解决所有交通问题。
大数据不是万能的,不可能成为解决关键交通问题的灵丹妙药。
大数据应用的业务链条,包括数据源、数据技术和数据应用。国外大数据公司可以专注于业务链条中的单一环节,将一个环节做好,便可成长为10亿美元以上的独角兽公司。我国的大数据公司仅做好其中一个环节,业务开展都非常困难,发展很容易遇到瓶颈。大数据需要数据互联,仅仅一个公司掌握数据,另一个公司掌握技术,则大数据依然发展不起来。大数据之大不可能一家独大。正如维克多·舍恩伯格所著的《大数据时代》所言,大数据分析非随机样本,而是全体数据;非精确性,而是混杂性;非因果关系,而是相关关系。因此,只追求数据的量不是大数据。
比如,车辆的动态定位数据数量以每秒十几万、几十万条记,但是若仅用于统计在线率、查找轨迹就并不是大数据应用,但要看其时空分布特征,以分析背后原因,仅仅GPS位置数据还远远不够。
大量数字化不是大数据。交通管理部门存在大量的文本化纸制文件,又进行了大量的数字化处理,如扫描、录入等,这些数据并没有太多的历史价值和全局性、连续性特征,只是片面的、临时性的数据积累,因此,不适用于大数据处理。数据大集合不是大数据,所有实际上并不存在任何内在关联的数据,无论其量如何之大都不适用于大数据技术,大数据技术是寻找数据之间的关系,并分析其规律。
传统统计分析不是大数据。正如上述所描述,很多交通部门依然延用传统思维中的统计分析方法,谈不上大数据分析与大数据计算模型。因此,传统意义上的主题分析不是大数据。
深入理解“大数据”
大数据只是解决特定问题的特定技术,需要体现大数据背后的现象、实际,更需要说明原因。在(移动)互联网的背景下,分析深度关联、多层原因变得更为重要,这就面临一个大数据分析难题:如何提升数据分析能力,即如何将数据与人的心理、行为联系起来。不是简单的联系,而是预测这些关联性。大数据从庞大繁杂的交通运行数据中,寻找到人们所需要的交通问题之逻辑关系,然后“理解”人们更深层的需求,如交通问题原因探究,这才是大数据技术真正的价值体现。
大数据在带来机遇的同时,也面临很多问题: 需要在明确数据的属性、价值及本质的基础上才能进一步挖掘其价值;大数据在应用过程中会涉及信息安全及隐私保护问题;整合信息资源需要强大的技术支撑;目前在专业人才上还存在缺口。
目前,大多数大数据平台分析系统,仍然局限于“条件分析”,远没有实现“智能探究”。人为设置的主题和分析方向,大多数情况下是已经知道原因,只是为了得到数字的验证。交通管理部门仅使用了大数据的存储和计算技术,但却大大忽略了大数据的分析能力,而这正是需要真正投入研究的。目前,可行的方法还是借助“半人工”方式,通过大数据自主分析,人工发现需要探究的目标,然后再一次挖掘大数据,循环往复。
当然,大数据技术正在飞速发展,人工智能的深入研究与介入,对于大数据中语义的分析、自然语言的理解、数据关联性的主动性关联等技能不断发展,能够逐步实现行业期待的大数据真正的应用价值——自主发现、自主探究。
踏实走好大数据的每一步
交通大数据要取得真正实用的价值,没有任何捷径,必须理性地看待这一技术和“工具”的使用,并认清交通大数据应用仍然是初级阶段。交通大数据应用,先从最易入手的分析开始;大数据分析,又要先从数据互联开始。先实现信息传递,才能实现价值转移。
交通大数据重中之重是需要数据,有能够互联的数据。智能交通管理系统的发展水平与数据的公开化程度息息相关。但是,我国交通管理的“条块分割”严重,政府业务系统一般被承建企业把控,系统中的数据对接与数据互联、信息互通,是目前交通大数据的最大障碍,是交通管理和参与企业应该调度重视的问题。信息公开能带来诸多便利之处,对于政府来说,信息公开有利于树立起良好形象;对于企业来说,信息公开能增加其收益;对于民众来说,信息公开能保障决策参与权。要提高交通数据的利用率,需要提高信息的公开化程度,信息管理方式的开放性较低,无法挖掘信息的价值,更无从谈大数据价值。
大数据公司要为交通管理部门提供优质的大数据分析及其应用和相关服务,数据源(对数据采集汇聚能力)、数据技术(对数据处理计算能力)和数据应用(对数据内涵和外延的发掘能力)3个环节都要有独特竞争力,而交通行业所有部门,也必须真正基于“大数据”技术本身的能力,结合交通问题的解决意图建设交通大数据系统。
人工智能、区块链技术的兴起,无疑会给大数据应用的技术进步带来更多的发展空间,但是,这会不会又是一轮新的概念炒作?“大数据”成本之大,是大数据之殇,对企业、对政府都是不可承受之重。