APP下载

智慧生长:变革未来交通

2016-07-05蒲实

三联生活周刊 2016年25期
关键词:优步阿里交通

蒲实

当城市分享出行的市场和资本热度还滚烫的时候,我们已开始谈论和想象带有终极色彩的未来:一个效率极高的、陆海空资源一体化的智能交通系统。什么力量在变革着交通,并激发出未来的想象力?

分享经济:人·车·行

2015年12月22日,几位纽约乘客通过Via App共享一辆车出行。使用Lyft和UberPool这样的拼车服务App,让纽约人在路途中不期而遇

5年前,因为家人工作单位的搬迁,我们搬到北京城郊居住。城区复杂而密集的公共交通网络还没有蔓延和覆盖到这里。虽然家门口就是高速路入口,家人开车,但我不开车,一开始,也不愿开车。小时候生活的西部城市远没有北京大,出门都是步行、骑车加公交,我不愿意舍弃那种感觉,今天看来,还可以附加一些绿色出行的价值。但很快,我发现这种想法很虚妄。我家离最近的地铁五号线最北端有10公里,需要乘公交车或出租车到达。步行至公交车站大概需要20分钟,时间如紧张,就得打车。冬季,我时常站在郊外备感荒凉的马路边,在寒风中遥遥无期地等待不知什么时候会降临的出租车;夏季,我在烈日下挥汗如雨,望眼欲穿地望着不时会出现海市蜃楼景象的公路尽头。过去紧凑的日程表概念就这样在每一次出行的漫长等待中逐渐瓦解,一切都变得不可控和随机起来。

我决定学驾驶,一旦学会,就买车(不久,北京买车就得摇号)。这个时候,“滴滴”和“快滴”出世了。记得第一次用滴滴打车来叫出租车,2分钟左右,竟然就有人接单。我第一次顺畅地乘上车进城,整个人感觉到实现了从城市“吊丝”到郊区中产的跃迁,满足感巨大。但郊区出租车密度毕竟有限,有时还是得下好几次订单,才有人接单。在特别空闲的时段,也出现过屡次发订单都没人接单的情况。有一次,孩子幼儿园的班车出了故障,需要家长亲自去接。我无论如何都叫不到车,情急之下,是搭乘院子里一辆刚好路过的装修面包车去的。因为感激这位司机,我给了他与出租车费差不多的“小费”,他非常高兴,没想到顺路赚了外快。没想到,不久,滴滴的专车和快车服务也上线了,我开始用快车和专车叫车。我不用坐班,经常可以错峰出行。根据快车和专车的价格机制,这会比出租车便宜不少,有时甚至只有一半的价格。更重要的是,从那以后,我的订单总是在1分钟以内就有人接单了,以后变得越来越快,总是10秒钟不到就有人接单。这说明,使用滴滴的私家车司机增长很快,它的派单技术也在不断优化。

对我来讲,出行已经完全不成问题。每当想到出行软件能无时无刻地把我和我看不见的空间里无数流动的车辆迅速联系在一起,就有点时空变换的感慨。买车的想法,也坦然搁置到了一边。增添私家车对城市公共交通环境和生态环境的影响不谈,我不是没有首先从自利的角度算过一笔经济账。像我这样出行依赖出租车或快车、专车的人,这笔高频率购买车辆服务的开销,是否过于高昂?是不是应该自驾私家车?粗略计算,我得出的结论是,哪怕我每天都打两次车,也比哪怕仅购买一辆20万元左右的普通小轿车节省很多。更何况,开始摇号以后,买车也就成了彩票中奖一样的小概率事件,没必要苦苦等待下去。

在5月贵阳举行的大数据产业峰会上,滴滴出行董事长兼CEO程维介绍说,滴滴已有了3亿注册用户和1400万司机,按照相关就业标准,在滴滴平台上实现个人直接就业的司机超过了100万。滴滴专快车日均服务订单已超过了1000万,平台日服务总订单已超过1300万,是全世界范围内第一次移动出行突破千万量级。这些数字大概是美国移动出行市场的5倍,远远领先欧洲及印度、日本、韩国等国。所有交通工具都被互联网连接到了线上,专车、快车、顺风车、代驾、巴士,各种出行服务缓解了打车难、出行难,提高了城市整体资源的利用效率。他说,他相信,“未来不需要每个人买一辆车,而是大家共同分享一辆汽车”。

作为共享经济的受益者,我赞同程维的观念。在尼尔森中国《2015年中国移动互联网出行市场研究报告》中,对北京等13个城市4000名乘客的调查数据显示,共享出行模式的出现,减少了私人对小汽车增量的购置需求,降低了存量小汽车的使用强度。48.9%的有车族表示“我还会保留我的车,但我会开得越来越少”,32.4%的人表示“我不打算再买一辆车了”,19.8%的人表示“我现在几乎不开车了”,甚至有9.7%的人表示“我正在考虑把我的车卖了”。而无车族中,67.8%的人表示“自从用打车软件后,我觉得我没有必要买车了”。我对他们的选择感同身受。在摇不到车牌号的时代,我们倒是可以畅谈分享出行。

以移动互联网企业为平台和主导的分享经济的到来,似乎正在瓦解着工业时代物权私有化的唯一合理性。这些互联网平台,首先创造了一个信息几乎完全对称的出行市场,并以智能算法匹配供需。而正是在资源最紧缺的领域,孕育出了分享经济。在腾讯研究院出版的《分享经济:供给侧改革的新经济方案》一书中,马化腾写道:“交通资源、路面资源是中国交通发展最大的瓶颈。过去的十几年,中国汽车的保有量在快速发展,但是道路的发展跟不上车的发展。……实际上中国只有1.5亿辆民用汽车,8亿的城镇人口,18%左右的人均汽车拥有量,不到美国的四分之一。但如果我们把汽车的数量从1.5亿辆提高到5亿辆,从现有的道路资源来看,完全不现实。因此,替代性的方案应运而生:在不增加汽车总量的情况下,通过更好的分享提高汽车的使用率。”

移动互联网企业勾勒的分享经济蓝图,有点像一份交通出行从社会主义初级阶段过渡到共产主义高级阶段的共产主义宣言。他们是这样宣示的:分享经济未来3~5年,汽车闲置的主体将加入企业,企业将整合自身的闲置资源进行分享,将名下的大量汽车闲置资源共享出来完成变现,降低企业运营成本;未来5~10年,政府和公共服务体系的闲置汽车资源也将加入共享大军的行列,当政府用车开始共享时,社会上主流的汽车保有群体都已完成共享;未来10~20年,共享将以地域分区,由政府统筹城市级别的个人、企业、政府完成共享串联,实现汽车资源的高效利用;未来50~100年,可能会看到全社会汽车资源在体系中无差别共享。

从另一个角度看,它们以极大的市场体量和极有效率的智能方式,重构了交通的最基本要素——人与车的关系。分享出行的巨大市场,让企业在传统上被政府所垄断的交通领域里,有了建立个性化智能交通体系的主导机会。全球资本也为此摇旗呐喊。就在我们写作这组封面报道期间,苹果公司投资滴滴出行10亿美元,引发了人们对苹果战略的诸多猜测;几天后,另一家移动出行平台优步(Uber),获得了沙特公共投资基金的35亿美元投资,创下了全球未上市公司中估值最高、单轮融资金额最大的纪录。随后,中国人寿又对滴滴进行了超6亿美元的战略投资。

派单与价格:配置的效率

在我拜访优步位于北京那幢被员工们戏称为“像菠萝,像笔筒,或像垃圾桶”的大楼里的办公室时,优步的员工明确地谈论对交通的理解:“交通问题可以用算法解决,其本质是效率问题。”以滴滴和优步为代表的新出行模式,改变了交通的时空分布。优步研究院负责人聂育仁这样说:“在时间分布上,出行平台大多为兼职司机和社会车辆,释放了司机碎片化的时间和车的闲置价值,在不新增一辆出租车的前提下,可以实现不同时段的灵活供给,起到了消峰平谷的作用;在空间分布上,则通过就近匹配和自动派单,引导司机服务公共交通欠发达地区的居民。”而促成交易、完成供需调控的杠杆,则是基于算法的动态定价体系。

追求纯粹效率的理念,促使优步把价格的算法做得更为极致。有人甚至不无说服力地认为,优步“第一次解决了人类经济学上的最大难题之一:价格问题”。优步的后台会计算汽车每一秒的即时动态供需关系,在基础车费(参照了城市的消费水平、出租车价格等等)之上,有一套基于派单的溢价算法,以自动解决市场的供需失衡。在平峰期段,可以保证运力不减,而高峰期,会通过溢价来引导运力流向需求最强烈的区域。优步想做“看不见的手”的价格体系,在没有补贴的一些市场里可能表现得更清楚些,高峰期甚至会有4倍甚至8倍的提价。在2015年澳大利亚一个咖啡厅的恐怖袭击事件后,人们掏出手机叫车逃离,优步价格瞬间涨价到4倍。事后,有新闻媒体抨击这是生死面前的贫富不平等。但从另外一个角度想,在一个完全理性的市场中,价格高,才会吸引周围的司机冒着危险赶过来。在去年的天津大爆炸期间,优步关闭了动态定价机制,对剧增的用车需求,合作车主也自发承担了事发区域乘客集疏运,同时优步将乘客在受灾当日往返灾区的行程车费全额返还。

优步的数据化运营起步很早。2011年前后,它就成立了一支专门做数据科学的队伍,它也将自己定义为一个技术型公司。它使用一套源自Travelling Salesman Problem的算法,解决的核心问题是如何把无数个移动的点用最短的线串起来,用最少的车最有效率的满足城市需求。它的派单技术是做得最早的。优步中国北区、西区总经理张严琪告诉我们,在优步进入中国市场之前,“中国市场上所有的出行软件都是用司机抢单。司机一边开车一边看屏幕,还要上手点,不安全。效率的弊端更大,叫车后,哪个司机抢到单哪个司机开,那么10公里外一个4G手机的司机,可能就比500米以外3G手机的司机快,抢到单的司机要空驶10公里,乘客要多等十几分钟”。优步进入中国市场后,“抢单”变成了“派单”,所有的算法都变了,更复杂,也更高效。将上千万的订单都派得精准,是出行行业的尖端技术。与滴滴出行相比,优步最大的不同,是从一开始就不做预约。从效率最大化的角度来看,优步甚至认为,预约也是低效率的,因为它阻碍了“像流水一样的出行”。通过后台技术,计算当前每一秒的运力和每一秒的供给和需求,才是流水一样的交通。使用优步,如果不拼车,也不用输入目的地的地址,这一点也是优步和滴滴的不同,同样基于对效率的理解,优步认为促进订单迅速成交,比让司机选择目的地更有效率。

2015年7月,优步在中国推出多人顺路拼车服务“人民优步+”(uberPOOL)。司机一次搭乘的不是一位乘客,而是同一方向的两位乘客,中途可能会有一位乘客下车,也可能在此前还会再搭乘第三位乘客。我得知,拼车的产品在优步看来,是具有战略性的,因为它是非常高效的整合,不仅能在高峰期从集中的地点前往不同分散的地方,而且也能实时实现用最少的车辆运载最多的人。张严琪告诉我们,要做成拼车,“之前要搜集和积累大量的数据。不同城市的交通习惯也不一样,有的城市集中在几条主干道,有的城市出行需求就相对分散。在哪个城市能够先推出拼车服务,不是按城市规模来决定的,而是从大数据分析看这个城市的运营数据,看哪一个更合适。我们首先是在成都测试多人拼车。我们发现,成都人民南路的主干道上,4个人拼车的情况最多。北京也有长安街主干道,但其他干道也很多,相比之下成都多人拼车这方面更有特点,成功率更高”。聂育仁说,据测算,一般私家车和出租车,需要18辆车才能运送27位乘客,但优步通过“人民优步+”,在不增加一辆车的情况下,只需要10辆车就能达到相同的运送量。目前,“人民优步+”在国内15个城市上线,2016年1月到4月中旬,选择共享行程而非独自开车的人已相当于帮助减少1.5亿公里以上的行程,每月行程数超过3000万。

优步首席架构师马特·兰尼(Matt Ranney)曾介绍过其供需匹配系统。在优步的系统里,从供给端能知道一个车辆有几个座位适合乘坐,是否容纳残疾轮椅和是否有婴儿座椅。系统也可以做“匹配优化”,匹配供应和需求,新的“匹配优化”让优步维持一个全局指数,因此也需要更多数据,新系统希望处理每秒100万写操作和频率更高的读操作。为了完成这种扩展,优步使用了Google S2几何图书馆(S2 Geometry Library),S2能够将地球球体分为小单元l,每个小区有一个ID,优步使用3.31平方公里的单位来分片其数据。当一个乘客使用优步时,优步会使用乘客的当时地理位置和S2的面积覆盖函数来寻找其周围适配的司机,然后选择更短的预计达到时间(ETA)。

优步中国北区、西区总经理张严琪

这些算法上的优化,能大大降低乘客的ETA和司机的额外驾驶时间。以北京为例,根据中国社会科学院和社会科学文献出版社发布的2015年《公共服务蓝皮书》,打车难是个突出的问题,北京市有7.99%的公众等待时间为30分钟以上,有25.64%的公众等待时间为20~30分钟,31.07%的公众等待时间为10~20分钟,26.33%的公众等待时间为5~10分钟,8.97%的公众等待时间在5分钟以内。聂育仁告诉我们,根据2016年3月的优步数据,“北京市优步平均叫车等待时间仅为3.8分钟”。算法也提高了资源的使用效率。北京交通发展研究中心发布的《打车软件对北京市出租汽车运营影响分析》的研究报告显示,北京市出租汽车日均运营里程约293公里/车,前后两次载客之间的空驶距离约为3.4公里,而“优步平台上的大数据显示,网约车空驶里程平均不足1.5公里”。在高举分享经济大旗的滴滴出行和优步这样的公司看来,对于北京、上海等这些产业、人口聚集效应明显的中国特大型城市,必须有“公共交通为主、共享交通为辅、私人交通抑制”的出行,才能有城市的绿色出行生态。

在优步的人看来,纯粹的效率,从根本上是对算法的考验。但在接受我们采访的一位外部观察者看来,有时一些非技术性因素也会影响公司的未来。比如,优步的业务创新滴滴现在也很快就能实现,滴滴正变得越来越像优步。而很多时候,“业务的创新是最不具有专利保护性的”。

滴滴与快的合并之前,快的有一套智能推单算法。它的核心,也是提高人与车匹配的效率。阿里投资快的后,在2014年8月遇到一个核心问题:接单率太低,早晚高峰和遇到下雨,更是没有人接单。这意味着,在人与车的配置上,作为出行软件,快的缺乏效率。当时正在做交通大数据、全程参与这个项目的阿里云数据挖掘专家闵万里告诉我,早在2011年,他曾为新加坡出租车公司做过一套算法,把乘客订单推送到最合适的司机终端上。“这是一个供需之间的实时匹配问题,有点像我们的互联网广告,如这里有一个广告位,我们应该用什么广告填上,填上后点击率最高。同理,订单匹配得合理,司机就不会拒绝。”

原来的系统推送订单时是盲推和群发,司机终端天天像小蜜蜂一样嗡嗡叫,司机烦了就关机。闵万里和他的团队启动了一个项目,把订单精准地匹配到某几个最合适的司机。“以前是以乘客为中心几百米画一个圈,里面的司机都收到。这很可怕,如果十几个人都叫车,周边的司机就会被轰炸十几次,也会造成信息通道的拥塞。我们把订单特征、司机特征、地点特征等全部考虑进去,做了一个司机对订单的感兴趣度模型,对司机打分。一个订单,对排名靠前的司机推送,成功率提高十几个百分点,相应派送速度也从22秒缩短到18秒。”这个派单的模型2015年2月份全面上线。后来快的和滴滴合并,这一套就卖给了滴滴。

高德地图副总裁董振宁

阿里也做了动态定价的算法。闵万里向我解释,这套算法“理论上靠一套公式来计算,实际客户端操作则通过加价5元、10元等来实现的,现在则改成一点几倍。还有‘好单坏单的因素,如高峰期有人在很偏远的地方叫车,对司机而言这是一个‘坏单;如果有司机正好送乘客往你这儿走,顺路,这就是‘好单。早晚高峰和下雨这样的场景也是参数。后台考虑的因素很多,但最终呈现给乘客的是几个简单倍数”。这套动态定价的算法,“过滤掉非刚需,也就是不那么必要出行的需求。对繁忙时候的交通而言,在错误的时间出行,是低效率的行为——‘添堵,那就多交钱。通过价格,来调整出行的需求,也就是让整个社会的出行,在更长的一个时间轴上‘弹性释放”。所谓“弹性”,就是将一个经济体中的供给按需“弹性释放”。这种基于算法的经济模式,“在人类社会的历史上从未有过”。今天,由于互联网和出行软件基于大数据的匹配机制,滴滴、快的(今天的滴滴出行)这种模式,还能够将供需之间的关系瞬间“弹性转移”。比如,你下班了,开着私家车,本来是车的需求方,但现在成为一个专车司机,一下又变成了车的供给方。“定价机制是出行软件的命根。既是滴滴出行的命根,也是优步的命根。”闵万里说。但这还不算是通过完全市场的价格体系来进行人和车的资源配置机制,而主要是“过滤掉不必要的需求”和“吸引区域外新的供应”。

云“智慧”:算法改变交通

到杭州一下飞机,萧山机场所有的柱子上都是阿里云的口号:“为了无法计算的价值。”大幅移动互联、金融、能源、生命科学和球赛的图片场景,都闪烁着数字的隐喻符号,空幻的数学符号就像爬山虎,爬满我们所生活的微观至宏观世界的墙壁。

在杭州西溪已扩建得十分辽阔的阿里巴巴园区的一幢大楼里,我见到阿里云的资深数据挖掘专家闵万里。今年4月,德意志银行发布了一项名为《中国互联网:模糊的货币化机会》(China Internet: Cloudy with a Chance of Monetization)的研究报告,指出在中国的云计算市场中,阿里巴巴已占据主导地位。2015年,阿里云第四季度营收约1.28亿美元,增长126%,年度净收入预估高于Google云平台,达到全球第二名微软Azure体量的1/3。报告还显示,中国的三家云计算供应商(阿里、腾讯、百度)的增长都令人瞩目,保持着三位数以上的年复合增长率;但最先起步的阿里云的计算规模是腾讯的10倍\百度的30倍。这个连续7年投入巨资却一直不见效益的“无底洞”,终于开始有了说服力。曾任阿里集团首席架构师的王坚力排众议做云的往事,也成了阿里传奇的一部分。“如果不是王坚的坚持和马云的支持,这个部门早已不知被拆分多少次了。”一位阿里老员工告诉我们。今天,阿里巴巴的员工喜欢谈论全球排名第一的云计算平台亚马逊云(AWS,Amazon Web Services的缩写),因为它提示着阿里可能的未来。根据亚马逊2015年的财报,虽然AWS业务仅占亚马逊总营收的1/20,但AWS的利润增长率未来将占到整个亚马逊的1/5。这个趋势让阿里云备受鼓舞。

闵万里长着一张机智的娃娃脸。当年他15岁上大学,进入中科大少年班。2013年,被阿里云吸引来到阿里,那时云计算的商业前景还不明确。2004到2009年,他在IBM研究院做“智慧城市”领域的大数据应用研究。IBM的“智慧城市”是基于PC机,加上软件和算法的方式去做,“它是世界上第一个预测城市内未来路况的交通项目,准确率很高,美国主流媒体都报道过”。但瓶颈又很明显,“想把这件事全面铺开的时候,发现计算量太大。如果覆盖全新加坡,需要非常昂贵的硬件设备”。他深刻体会到,靠硬件赚钱的商业模式销售难度越来越大,做带有分析的解决方案才是值钱的。虽然云计算的概念已经有了,“但在几十万人的大公司里要做一个变动是很难的,‘蓝色巨人行动缓慢”。他离开IBM,到了Google,做广告大数据。Google的技术架构全部基于谷歌云的架构,“我对云计算的能力和未来深信不疑”。2012年,当他接到猎头电话,告诉他“阿里有大数据岗位,丰富的数据将来比eBay加亚马逊加PayPal还多”,他迅速回国加入了阿里。那时,阿里云做了3年,“所有电商业务都在大数据平台上跑了”,也正在张望电商的“围墙花园”外还能做些什么。与Google云专注和深耕于搜索和广告不同,阿里云追求生态丰富,志向就是要做基础设施。闵万里感到:“2010年前在新加坡过于昂贵的事,现在可以落地了。”

在阿里巴巴集团尝试将电商行业沉积的大数据能力和价值投射到其他行业的时候,智能交通成了重要的路径和选择。这是一个垂直行业,而且交通场景跟所有人都关联,交通的数据本身就是大数据。再加上交通数据的采集手段已经如此丰富,“视频探头、电子警察、微波雷达、地感线圈,加上手机导航的APP,它天然就是多源异构、有视频的大数据。交通行业也足够复杂,大数据能力有充分发挥的余地”。闵万里告诉我们。他的专业是数学,做概率。过去,做交通的人都是工程师,用的是网络流理论、排队阵理论、交通控制论和仿真模型等等。现在,“我们不再从工程角度去理解交通,而是用数据的概念去理解。传统的交通工程理论,奠定但同时也禁锢了思维。我们开始用大数据的理论建模,比如随机过程,完全不同的角度,才能做过去做不了的事情”。

自2009年阿里云将云计算能力开放后,阿里云上集中了很多客户,包括创业者、开发者、公司以及政府客户。像12306、海关总署、中石油、中石化和浙江省交通厅等,都是阿里的客户。阿里去找浙江省交通厅,“当时是一拍即合”。交通领域的人大多是做交通工程领域出身,“我们就拿以前他们做的事来讲,很复杂的公式,用几句话讲清楚,他们明白,就好办了”。最先,闵万里的团队想做未来60分钟路况的预测,因为已有的导航解决的只是当前时刻什么地方拥堵,“空间距离导致时间的滞后,假定远方的路况固化在此时此刻,就是刻舟求剑”。当时还想了很多其他的应用,比如景区人流管理、大卡车大货车的实时发现和预警等等。

他们在寻找云计算与交通行业可能垂直深入下去的链接点。整个浙江省1300公里高速公路,这就需要每隔400~800米路段过去6~8周里每5分钟的车速,当时的路网关系数据、实时车速。预测分两步,“首先我们需要知道实时路况,这个是交通厅通过手机来预算的。开车的人多半都有手机,手机在移动,在基站间切换,切换越频繁,说明移动得越快。通过高速公路上的手机,可以精准定位并计算出每条高速公路上的路况是什么。这个计算量很大,全省几千万人,大概几万、几十万人在高速上,每秒算一次,最后得出每5分钟里,这个路段的车速是多少。有了这些数据,系统再次通过算法预测未来60分钟是什么样。原始数据量大概是1个月一个T左右,车速可以在秒级上算完,预测也是在秒级内算完。另外一个计算量大的地方是,如何把预测模型做出来,这就需要1300公里上6~8周的数据,需要20分钟左右把这个模型算完。算完后,实时运行模型时,秒级内就算完了。以往,这是一个难以想象的事情,这是一个4000多乘以2万多的大矩阵,根本无法算完。但在阿里云的MaxCompute上,很快就能算完”。这个应用目前在浙江已经落地,正在与上海、武汉、深圳谈。

2015年7月30日,阿里巴巴集团旗下阿里云联合中科院在上海成立一个全新的实验室——中国科学院-阿里巴巴量子计算实验室,共同开展在量子信息科学领域的前瞻研究。图为科研人员在实验室超冷原子平台工作

很多交通设施也正在变得智能化。比如,目前大多数城市的红绿灯和信号灯还比较“蠢”,假设东西向早高峰的车很多,但东西向、南北向的红绿灯时间一样,就会导致东西向车堵塞,而南北向没有什么车。调控东西向和南北向的红绿灯时间,让红绿灯可以看懂实时的交通路况,又使红绿灯之间可以相互沟通,是一个系统性的大数据分析。“世界上第一家互联网信号灯一旦落地,所有的信号灯厂家都会感兴趣。它们都想往互联网+转型”。另一个例子是,中国法律规定所有的旅游客车和危险品运输车辆的位置每15秒上传一次数据。但这个数据是海量的,浙江省就有大约11万辆这种车。过去,这些上传的数据很难得到利用,都是等到出事了再做排查。阿里云用算法帮助政府解决了这个交通监管难题:首先能抓数据造假的人,软件就可以识别跨省经营、修改GPS坐标和修改时间的人;还可以做到危险品运输车进入居民小区100米范围内的几秒钟内,系统就能接到报警。桥梁上的无数感应器,提供了判断车辆超载的大数据;每个交通路口的摄像头,也在采集大量的数据。现在,通过对摄像头数据的分析,可以查获假牌车、套牌车,只要两辆同一车牌的车在一分钟内,出现在两个路口,肯定有一辆车是假的;摄像头摄取到数据后,可以进行查询核对。过去,获得这些数据并不难,难的是“对视频这种非结构化的数据做出识别,而且车辆的数据库很大,还需要涉及五六个数据库的关联查询”,算法、计算能力和大数据打通能力,都是过去不具备的,现在都可以做了。

5月9日,北京申通快递的员工正在分拣快件。每年几百亿的网购订单信息,是挖掘和更新数据库的最好来源之一

闵万里从交通开始做,后来又延展到物流,因为物流“涉及货物配送路线,跟交通有关”,再垂直往下,“又做物联网”。智慧交通对互联网巨头来说,远不仅仅是车辆的互联网,而且还是车辆与所有道路装置的互联化和整个道路系统的互联网化。

地图:重建时空

6月8日,端午节小长假的前一天。17点40分正是交通晚高峰,在高德地图办公室实时监控的大屏幕上,无数发光的小圆点正在北京地图上缓慢移动,超过一半的道路红成了一张网。高德地图副总裁董振宁饶有兴致地读起了“极度拥堵”的排行榜:“第三名,西二环,47分钟;第二名,北三环,79分钟;最堵的是北四环,这段路不到3公里,测算要走131分钟——已经彻底堵死了。”

所有的拥堵在这里都被数字精确地量化:新街口外大街不到2公里左右的路程,还要再走50分钟。德胜门外大街上的乘客打开手机,会发现自己所处的路网颜色早已红得发紫——他们正在忍受着高达46的拥堵指数,意味着他们这段旅程耗费的时间将是正常行驶时的46倍。

城市的路网正在以500米到两三公里不等的长度单位进行监测,这些实时的路况数据,22%来自高德从出租车、物流车等处得到的行业车辆数据,78%是众包的数据来源。众包的对象,就是乘客们自己:地图上移动的光点,都是现在正在使用高德地图的用户,它们像采集器一样把自己的行进方向、速度等作为道路信息实时传到服务器上。这种交通大数据动态信息的更新,已经达到了分钟级的水平。

即使是在五六年前,北京数字地图的数据的更新还要以季度为单位。董振宁还记得,14年前自己加入高德地图时,公司的底层道路数据采集全都靠采集车,一台车成本至少几万块钱,上街采GPS轨迹、采录像,高峰时期100多辆采集车在全国扫街。“那都是计划经济的做法,我要采北京、天津、上海,就开始做排期,派车一个城市一个城市地去收集数据。”当时的用户没法直接使用高德导航,高德只把地图导航服务提供给整车厂,用户买新车时要花几万块钱加一个车载导航模块。2006年开始提供车载导航时,高德最初卖的版本只有36个城市,随后是72城市、140个城市,一直加到全国360多个城市。如果想跟上新地图,还要再向4S店花2000块钱买张新光盘来升级。至今,不联网的车载导航依旧按这种方法缓慢地更新换代,只不过光盘变成了硬盘。

那种“大城市一年更新四遍,小城市一年更新两遍,太小的城市一年就一遍”的地图更新速度,今日看来简直是天方夜谭。移动互联网兴起后,手机导航很快取代了车载导航的重要性,采集车还在,但成千上万无处不在的用户一打开APP,就立刻变成了海量的触角,每一步移动都在贡献最新的地理数据。

“每一个用户都是地图的信息源,如果路网上本来这一片是空白,渐渐发现有用户在这里快速地经过,跟卫星影像叠加在一起,我们就会发现这里是一条新增路线;如果一条路看上去是小道,但有大量的用户在走,就说明这是条交通要道,我们就要在导航里把它的道路等级提高。”董振宁告诉我们,手机数据本身会说话——步行的行人时速不会超过6公里,而且手机会持续剧烈地震荡;驾车的时速会超过二三十公里,要比外卖小哥的电动车更快速。他认为大数据是最准确的测量方法:两条路,一条有一万个人走,另一条有一百个人走,肯定前者比后者更重要。当你能采集到这么大量的使用信息时,对道路的判定就变得极其精准,这就是大数据魅力所在。

如果说采集车时代是一条一条人工渠,那么移动互联的普及让每一个手机都成了数据的源头,字节从每个人指尖的点点滴滴开始汇聚,集合成了滔滔不尽的数据湍流。而正是这些湍流推动着地图向着众包化和智能化的方向越走越快。现在的人们打开数字地图,已经不仅仅是为了知道从A地到B地怎么走,还想要了解怎么才能更好走:尤其是在北京、上海等大城市,人们更多依赖地图去帮忙躲避通勤的拥堵。看几点出发、走四环路还是三环路能更节省时间。在近两三年,又涌现了另一个海量的需求——给自己的位置做定位。

腾讯地图事业部副总经理谢建家发现,在过去的两年内,腾讯LBS(基于位置的服务)调用量增长超过了20倍。在微信、手机QQ、京东、滴滴等APP上,人们大量地发出、调用地理位置,这背后都是腾讯地图的数据支持,人们已经习惯了这种地图使用方法,而且需求在持续上升,现在腾讯地图每天要处理的定位调用量已经超过了400亿,LBS服务的调用量超过了20亿。

跟高德地图以道路信息为重点不一样,谢建家认为腾讯地图的核心,是为整个腾讯的生态体系提供LBS支持,就像云计算、支付一样,都在提供一个基础的服务。谢建家列举,在应用商店里,top10的APP里面,腾讯要占6个,top20里,腾讯要占11个:“腾讯有广泛的LBS服务场景,有最大规模的用户群体。在服务的过程中,腾讯地图取得的是活的数据,形成了一个闭环的大数据体系。”这个数据的闭环,正在丰富数字地图的另一个维度:POI(Point of Interest,即“兴趣点”)。

跟路网相比,路上的餐馆、学校、商铺等点数据要远远庞大得多。百度地图事业部副总经理胡玥在年初列举过几个数据:“在中国到底有多少道路?——超过1000万公里。如果你想让你的地图有效的话,至少把600万公里搬到地图上来,但一年内超过30%的道路都会发生变化。”如果说路网的变化可以靠行车的大数据来解决,POI的变化则是所有地图商共同要面对的难题——1000万公里的路网上,需要采集的POI会有几千万个,而城市里那些小餐馆、小商铺更替的速度,只能用瞬息万变来形容。你在微信上发送的每一个定位、在百度外卖上输入的每一个收餐地址、在滴滴上发送每一个叫车位置,都在使用POI的信息,也同时在告诉背后的地图运营商:这个POI是活的。一个越发重要的数据源是专车。腾讯地图是滴滴打车最早的合作者,滴滴车辆的调动、派单的规划,都在使用腾讯地图的服务。全国每天上千万的订单是一笔巨大的数据财富,它们自己携带着POI信息,也在做自我验证,而这种互联网产品的最大特点就是,用的人越多,服务越准。

高德地图正在利用母公司阿里的物流信息——淘宝网的每张订单上都有一个发货地址和一个收件地址,每年几百亿的订单滚动下来,就是挖掘和更新POI最好的数据库。董振宁说,在理想状态下,一个商铺的公司发生了变更,如果有物流进入阿里的渠道内,几天后高德地图上的信息就会做出改变。“还有阿里的菜鸟物流,它掌管着中国将近50%的物流车,我们在帮它解决最后一公里的引导问题。它把所有的物流数据给我们,我们再以此更正地图数据,互惠互利。”

跳出这些量变的修正,所有采访对象都告诉我们,互联网地图真正的质变,都要回归到无人驾驶上——在行车导航上,不管是精度,还是跟车的结合上,现在的手机地图已经到极限了。虽然看起来车载导航的市场在萎缩,可一旦汽车连接了互联网,未来的导航还是要回归到汽车本身。无论是高德、百度、腾讯地图,还是内容提供商四维图新,大家都已开始制作高精度地图,传统地图数据的精度是米级别的,这对于驾车导航服务来说已经足够。但自动驾驶要实现的是在高速行进中的变道超车、上下匝道等动作,对于数据精度的要求达到厘米级别。目前在测试道路上,像百度高精地图的误差,已经能达到只有不到一根车道线的宽度。

相比于继续砸钱做高精度地图,一些小体量的地图正在弯道超车。搜狗地图刚刚在5月份发布了全语音“搜狗智能导航”,这个导航看起来更像一个会追问的siri,在演示视频里,车主口述出去机场的需求,车载导航可以经过几轮对话,提供出航班的延误信息、建议车主出发时间,记住出行的起始点。整个交互过程都是依靠语音完成的,几轮对话已经开始接近于人与人之间的交互方式。搜狗地图事业部总经理孔祥来正在和各种车企谈合作,把这套系统直接植入到新车上。传统车商不擅长语音识别的技术,导航往往听不懂车主在说什么。搜狗这几年的在深度神经网络上的布局,正好解决了语音识别和语义理解的问题。“传统的识别率只能达到93到94%,但一旦有了深度神经网络,识别率一下子提升了三四个点,在百分之九十几的情况下,再提升三四个点是一件非常了不起的事情。”而搜狗这个导航背后,是搜狗输入法的支持。搜狗输入法每天有20%的输入都是靠语音完成的,相当于每天能采集到1亿多的语料样本过来帮助它快速迭代后台,进行神经网络的机器学习。

说到这里,虽然明白了从输入法,到地图、车载导航,再到自动驾驶之中的语音逻辑,但依然会觉得几件事已经越扯越远了。为什么所有的互联网巨头都要养着地图?到目前为止,对任何一家公司,地图都是一个烧钱的买卖,为什么大家不能互相购买地图服务?孔祥来几年前就说过,地图是个非常烧资源的行业,基本小公司没有太多存活机会。到了这个节点,地图更需要靠大公司的全套体系才能完成海量的数据更新和技术进步。孔祥来告诉我们,在当下的移动互联网时代,地图是一个基础设施,它能把虚拟和现实直接联系起来,同时,当每家公司都想尽可能多地掌握用户数据时,地图是一个最正当的工具。而在即将到来的无人驾驶市场,地图当然是最好的入口。这就不难理解为什么百度、腾讯、阿里、搜狗,都在厉兵秣马地用自家的超级APP和整个公司的生态体系来升级地图——面对一个前景广阔的未来交通大市场,今日的路网和POI中,就藏着未来的大布局。

2013年11月1日,印度新德里的早晨,路上挤满了骑自行车赶着去上班的人们。人口大国中国和印度,为交通的大数据应用提供了丰富的场景

关于未来的想象

6月初,笼罩在“江南烟雨”中的杭州很潮热,堵在不断阻塞的路上让人不禁有些烦躁。从萧山机场到阿里巴巴所在的西溪园区,恰好横穿这座城市的东西对角线。我不禁想,可惜缺少高架桥,是大数据也解决不了的工程问题。用滴滴招来的快车寸步不挪动,这时,与我同车的乘客璐璐讲了一个在我看来与现实颇有张力的故事。她说,她的朋友去日本旅行,有一次在早高峰坐地铁,遇上有人卧轨自杀,地铁毫无疑问延迟。出地铁站的时候,她领到一张卡片,上面写着,因为有人卧轨自杀,地铁被延迟了。下面有5分钟、10分钟和15分钟三个选项,她的那张在10分钟上划了个勾,每一班地铁都有不同的延误时间。这张卡片主要是为日本上班族准备的,用于打卡时做解释,你既不会因为地铁的延误而被扣工资,也无法借口地铁延误而迟到得更多。在惊叹于日本地铁的人性化的同时,她赞叹日本公共交通的高度智能程度。

在浙江省交通厅午休时分安静的办公楼里,我见到信息中心的主任韩海航。他没有官僚气,谈话也毫不给人有所顾虑的谨慎感。他所领导的信息中心在全国交通系统的信息中心里算最小的部门,但在智能交通领域,它的创新在全国范围内都很领先。“这个部门的人对数据理解和管理都有深刻的认识,政府和社会的数据服务能力有很多提升。”韩海航向我解释,从政府部门的角度,智能交通分几个方面,“城建部分负责城市交通和道路建设,交警管交通事故,公共交通如出租车、地铁和公交车则由我们交通部或者交委管。深圳和上海比较前卫,交警和交委在体制和管理上逐渐融合,这更符合国际上先进城市的经验”。

韩海航是移动互联网和大数据的拥趸,“尤其在中国和印度这样的人口大国,为交通的大数据应用提供了最丰富的场景,很有前景”。3年前,阿里云推广还很艰难的时候,他接触到阿里云,当时世界上真正把云变成实践的还只有亚马逊云。但中国的政府部门利用移动互联网做事情其实很早。“上海世博会的时候就在用了,我们与上海交流很多,所以接触互联网的理念也很早。上海世博会实际是一个开放的城市,与北京奥运会有所不同。那上海市政府就必须要预测,世博会召开的那4个月会有多少人。上海世博会没有出现任何踩踏事件,其人数进入最多的一天达到了103万人次。当时他们用互联网预测,一天园区会停留90万人,公安部门用传统方面预测的是70万人,上海市政府是按照90万人配警的。103万是流动的总人次,按90万配警就没出现任何事件。之后上海出现过踩踏事件,恰好是因为那一次不是由上海市,而是由发生踩踏事件的区政府在做应急预案,区政府没有这个手段来预测人流。后来我们利用大数据做交通时,借鉴了上海,就是移动互联网。”接触到阿里后,他很快意识到,“利用阿里云的基础设施,可以获得三大电信运营商不能提供的一些通讯资源。以前我们的网站放在电信,用电信的带宽,就经常有联通的用户投诉我们,该怎么办?电信和联通之间的网关是有瓶颈的。阿里把这三家运营商的带宽融合在一起,就解决了这个问题。这个需求当初是直接目的。”

实际上,阿里、腾讯和百度沉积的大量数据,也为政府部门提供了很大方便。“很多专家经常呼吁政府要开放数据,我说,政府是缺数据的。有的数据不能开放,比如隐私和身份信息;其他数据又大多是统计数据,统计口径不停在变,原始数据不可追溯,可信度很成问题。”在阿里、腾讯和百度从电商、社交网络和搜索引擎积累的海量数据里,交通部门开始挖掘和筛选业务里有用的数据。2014年10月1日,浙江省交通厅借用阿里的数据处理能力,在浙江省两条最堵的公路上做了智能交通的尝试。“以往我们不知道公路什么时候堵,大家都用百度或高德了解通行情况。城市里面很准,但高速公路上他们有一定困难。我们用更加廉价的方法,比如手机芯片(跟联通合作),分析当前这几条高速路的通行状况。2015年我们做了1300公里浙江的高速公路,去年12月1日,同阿里做了未来1小时的高速公路路况预测。这个场景只听说巴西利用微软的技术做过,但也只是很小一段路。我们的整体准确率保守估计是80%以上,到春节的时候,达到将近90%。”预测模拟,这是大数据作用。“有人问,政府为什么要做实时数据?高德和百度不都有吗?但实际上,我们的目的是预测,以便治理和服务。”

戴姆勒旗下汽车共享项目car2go CEO尼古拉斯·科勒。car2go是华盛顿和波特兰的第一个分享汽车服务,用户可以通过智能手机应用软件找到34平方英里内可使用的车

虽然目前的实践,还主要在城市交通的范畴内,但城际交通的智能化未来,却也开始有一些端倪和探索,政府和公司都思考着这个问题。在今年4月腾讯研究院发布的一份《城际出行报告:后滴滴时代的千亿蓝海》报告中,它勾勒了一幅不远未来的出行场景:你只需对手机说“我要从中关村去香格里拉,请给我推荐路线”,手机就会弹出一个窗口,语音答复“您可选择如下最佳路线A”。这条路线不仅有火车、飞机,还有正规的旅游汽车、当地出租车,价格×××,可以入住当地××酒店。这种智能化的一站式交通的实现,有赖于统一资源平台的形成,在这个平台上,应该具备所有的交通工具、交通服务者和交通路线。这份报告畅想,智能交通的发展大致可以划分为三个阶段:第一阶段,实现城内出行,聚合一个城市所有交通资源,实现一站式的客运;第二阶段,实现跨城出行,聚合省内各种长途交通工具,提供无缝的跨出出行解决方案;第三阶段,全国出行,联合全国海陆空各种公私交通资源,通过互联网实现一站式的出行选择。目前,在城际交通领域,还没有发生动静很大的变革。但跨城出行的潜在市场体量巨大,2014年可统计的市场规模超过3600亿元,开发程度却极低。

阿里巴巴集团阿里云事业群-数据事业部资深数据挖掘专家闵万里

有一些“星火”般的努力,在做出一些尝试。韩海航向我透露,现在信息中心正在做一些地面和空中数据整合的努力,“可能明年会看到一些应用成果”。作为政府部门,信息中心发挥的是“牵线”的作用。比如,浙江有一家企业,专门做空港大巴的售票系统,在郑州、福州和杭州都做。现代出行,空港是一个枢纽,下了飞机坐上大巴就可以回家,不用自己开车,也覆盖周边没有机场的城市。信息中心给这家民企和一家央企做了桥梁。今后出行,在航旅纵横上,很可能就是这样一个场景:你乘飞机到杭州再坐大巴去绍兴或千岛湖,在APP上输入目的地,飞机一起飞,它就自动地帮你订好大巴票,下飞机,扫一下二维码就能乘上大巴。公司也可根据航班情况来调度大巴,如果航班误点,地面公司也可以重新安排好大巴的时间,同样,你上了去机场的大巴,航空公司也知道你什么时候到达机场。在中国,空中和铁路交通的运输和组织都是从中央自上而下的垂直管理体系,全国联网,地方上能够涉足的飞机和铁路管理范围是很有限的,比如空中交通,浙江省交通厅能管的只是机场。但以机场为枢纽,通过信息系统,它也将服务延伸出去,并不突破管理体系,但也与北京的央企联系起来。另一个例子是铁路,信息系统把上海铁路局和浙江省管区内的所有客流和铁路信息都联系起来。智能交通更远景的未来,也许是陆海空都衔接的综合交通,“整个社会资源无缝对接最大有效化”。现在,公路、铁路和空中交通还没有无缝对接起来。这方面,日本是一个很好的榜样,如果火车、飞机晚点,末班公交车也会相应的晚点。大数据和信息技术给交通领域提供了突破原有很多空间限制的想象。从互联网企业的角度,实现多种交通模式的换乘和无缝链接,技术上可能不是难题,最关键的是需要有买单的人。在综合交通智能化程度非常高的日本,它基本是靠政府投资来实现的。

与交通相关的传统企业,也以警惕但必须参与的心态审视着行业生态的变局,其中最重要的就是汽车企业。在腾讯研究院出的《分享经济:供给侧改革的新经济方案》这本书里,搜罗了很多传统汽车厂商拥抱共享经济的案例,包括德国戴姆勒全资子公司戴姆勒智能交通服务集团的car2go绿色出行方案、宝马的DriveNow汽车共享项目、大众的Quicar汽车共享项目、雷诺的电动车Bluecar共享业务、福特的GoDrive试验项目、通用的Maven和CarUnity汽车共享业务等。

在阿里、腾讯和百度这样的互联网巨头企业眼中,汽车的未来更可能是从简单出行,变成更差异化的终极体验式消费。阿里就主要与上汽合作,进行一个车联网项目。闵万里预测:“智能驾驶和无人驾驶,它要有车载终端。这个车联网项目,就是在车上加一套嵌入式操作系统,实现各种通过联网可实现的事,以及智能规划它的出行方案。厂商需要的是差异化,像特斯拉那样,要有标准件,也要有定制件。发动机是无法差异化的,定制主要发生在非机械功能上。”腾讯地图事业部的副总经理谢建家则告诉我们:“未来,车会改变它的属性。自动驾驶之后,车就是一个移动的智能空间。当汽车变成智能出行后,就变成了一个类似家和办公室之外的空间。人在里面需要外界信息接入,需要智能服务。你在里面娱乐、社交、听歌、玩游戏,这是互联网企业可以提供的。腾讯车联就是在做这些。”虽然都在谈智能交通,但传统汽车的思维方式,却又有微妙不同。它们更多的是强调辅助驾驶,未来驾驶者仍然是驾驶的中心,这样会涌现ADS这一类的技术。他们的隐忧,是担心汽车像移动运营商一样被管道化,用户都是互联网的,车变成了工具,慢慢沦为一种运输属性。博弈在进行着。

猜你喜欢

优步阿里交通
为什么中国的滴滴能在优步苦苦挣扎的领域取得成功
云上阿里
繁忙的交通
这一次优步乘车,让我感动了
辰辰带你游阿里
优步转向共享自行车市场
小小交通劝导员
优步:极速前进
阿里战略
阿里是个好榜样