高精度地图“失宠”
2023-04-24Shoot
Shoot
车企走向同一条路
在城市这一复杂路况场景中,高精度地图一度被“多传感器感知派”认为是自动驾驶得以实现的“拐杖”,不可或缺。然而,当越来越多的车企和自动驾驶方案供应商开始逐渐向“纯视觉”路线靠拢,高精度地图还有存在的必要吗?
自动驾驶技术的目标是取代人类,这需要一系列软硬件配合:感知体系代替人的双眼,决策体系代替大脑,执行机构代替手和脚。
在感知环节一直存在两大派系,一派以长期孤军奋战的特斯拉为代表,主要依赖于摄像头,辅以高性能计算,不使用激光雷达,甚至一度取消了毫米波雷达;另一派则是以主流研发机构为代表,主要以激光雷达、毫米波雷达、摄像头等多传感器,组成多传感器融合方案,实现自动驾驶系统的环境感知能力,国内跟随者众。
在后者看来,纯视觉路线中车辆采集到的都是二维图像,不包括距离和速度,车辆仅靠这些信息并不能保证安全。所以不仅要辅以雷达增加感知能力,还要用高精度地图弥补车辆“视力”上的不足。
然而随着功能的迭代,特斯拉摄像头的短板逐渐被补齐,还在苦苦寻求自动驾驶智能拐点出现的车企和自动驾驶服务商们来到了调整路线的关口。
在特斯拉工作五年后,卡帕斯(左)又回到了OpenAI
特斯拉早期Autopilot 辅助驾驶系统确实经常出现误判,但自从2017年,马斯克将安德烈·卡帕斯 (Andrej Karpathy)从OpenAI 挖来担任人工智能和自动驾驶视觉主管后,先是重写了自动驾驶算法,之后又在2019年发布了FSD(Full Self-Driving)自研芯片。至此,特斯拉自动驾驶辅助系统开始出现根本性变化。
FSD芯片经过针对性设计,计算平台上两颗芯片的总算力为144TOPS(每秒钟进行1 万亿次运算),有效算力与两颗总算力512TOPS 的英伟达高性能AI 芯片Orin 相当。在车辆具备大规模数据处理能力的基础上,特斯拉感知系统也有机会逐步以接近人类的方式观察三维世界。
特斯拉在感知系统使用的是360度布置的摄像头,卡帕斯曾在播客中解释,这种模仿人类视觉的感知方式不一定要识别出路中间是什么物体再做决策,而是会像人类一样,“虽然不知道是什么,但会先避开”。
而这样的感知逻辑加上时间轴后,能够预判处理更多交通参与者的行为。比如一个行人正在过马路,中途被一辆类似公交的大型车辆遮挡,此时系统虽然“看”不到这个行人,但自动驾驶感知网络的短时记忆能力能够记住某一时间段的数据特征,从而推测出这个行人在穿过遮挡物后会重新出现。
卡帕斯认为,整个感知系统加上“影子模式”提供的大规模数据训练反馈,特斯拉的视觉感知体系已经可以实现局部地图的实时构建,通过融合多个局部地图,理论上“可以得到任何一个区域的高精度地图”。
从“必备”到“鸡肋”
看着特斯拉在技术上形成闭环,并已经开始取得规模效益,其他尚处于高投入阶段、标榜智能化的车企迅速转换路线,第一步就是向高精度地图“开刀”。
3月,理想、小鹏接连宣布将在今年年内测试无高精度地图的城市辅助驾驶方案;同月,AI 芯片企业地平线创始人余凯和华为终端BG CEO余承东先后表示,要推出不依赖高精度地图的解决方案;专注于L4 级自动驾驶方案的元戎启行也在3月23日正式发布了类似解决方案,成为业内首个宣布彻底解绑高精度地图的自动驾驶玩家。
种种迹象表明,抛开高精度地圖这根“拐杖”已经成了业内不约而同的选择。
高精度地图是给汽车看的地图,一般要达到分米级甚至厘米级,包含有道路类型、曲率、车道线位置等道路信息,以及路边基础设施、障碍物、交通标志等环境对象信息,同时包括交通流量、红绿灯状态信息等实时动态信息。
在车企原来的设想中,高精度地图可以纳入智慧道路硬件设施的交互信息,如同车辆的“上帝之眼”,提高车辆的规划能力,保障车辆在算法的辅助下实现更安全的自动驾驶功能,也就是业内俗称的“AI 弱智能+ 激光雷达强感知+ 高精度地图”解决方案。
不过在应用中,高精度地图建图和后期维护所需的时间成本和经济成本实在太过高昂,以至于难以形成大规模上车应用。
在采集环节,图商需要采用专业绘制车辆进行测绘,测绘车辆通常搭载大量传感器,单车成本动辄上百万元;车队每天扫描的里程又是有限的,平均成本在1000元/公里,采集完了一个城市还要保证地图“鲜度”,要求图商不断上街扫描,跟上实际路况变化。
而国内城市道路系统极其复杂多变,对更新频率有着极高的要求。此前华为很重视高精度地图,2021年时曾表示华为高精度地图的更新频率分两种,高速公路一星期采一次,城区道路一个月采一次。
尽管如此,依然很难保证地图“鲜度”。余承东在3月23 日的发布会后曾吐槽城市道路的复杂性:“中国道路天天改,你今天走了这条路,夜里可能就改了。”值得一提的是,至今还没有一家图商能把全国范围内的高精度地图全部做出来。
新一轮军备竞赛
向纯视觉路线靠拢,除了砍掉高精度地图,部分车企还一直在考虑甩掉激光雷达,以降低硬件成本。不过考虑到国内激光雷达如今价格已经平民化,占整车成本并不高,是否保留已经不再单纯是出于成本考虑,而是要考虑技术安全。
激光雷达能够直接获取前方物体的速度和距离信息,哪怕在夜间依然可以正常运转,这一优势恰恰可以弥补摄像头的缺陷。但是在业内技术人员看来,使用雷达传感器导致探测系统冗杂,也会对数据引擎造成压力。
“每个传感器的功能不尽相同,全部上车会造成感知系统过度膨胀。”一位自动驾驶企业工程人士指出这样一种情况:两种传感器结果发生冲突,决策系统该听谁的?如果相信摄像头,那为什么还要会干扰摄像头判断的激光雷达?
需要明确的是,追赶特斯拉并不是一个单纯去繁就简的过程,车企需要投入另一场软硬件的军备竞赛。
吉利汽车、毫末智行等自动驾驶企业都已经宣布建立超算中心
纯视觉路线意味着系统要处理大量视频图像信息,数据量庞大,对车端和云端的算力要求很高;大量标注后数据用于算法模型训练,再部署到车端验证改进,这一过程需要的不仅是天才工程师,还需要超级AI的参与,不然海量的数据很难完成标注处理。
在车端算力上,国内车企已经走在领先地位,但是为了能更匹配自身算法,自研芯片、自建云端超算中心已经成了必选项。
况且自研芯片也是未来降低自动驾驶辅助系统硬件成本的关键,李想在今年3月曾提到过特斯拉自动驾驶硬件的低成本,“特斯拉自动驾驶辅助系统的传感器和计算平台的成本大约是1500美元,我们打造类似的系统,光传感器和高算力芯片加起来就要4000美元,差距很明显”。
总的来说,头部车企想要在新一轮淘汰赛中活下去并保有优势,皈依纯视觉路线已经是大概率事件,高精度地图可能只是第一颗弃子。