自动驾驶研发中“No Free Lunch”

2020-04-06王刚

工业经济论坛 2020年1期

关键词：阿里巴巴芯片自动

文／王刚

“大事化小，小事化了”，自动驾驶也一样。遵循“No Free Lunch”理论，实际应用中的复杂场景可以通过分解为数个小场景，逐个分析、研究算法得到解决，结果往往比研究一种通用算法要好。

自动驾驶是能给汽车、交通、物流乃至整个出行行业带来巨大变革的变量，这项技术包含挑战，也包含机遇。今天，作为一个自动驾驶的研发人员，借助文章同大家分享阿里巴巴达摩院自动驾驶实验室对自动驾驶技术研发的思路和思考。

与商业结合促良性发展

关于自动驾驶，大家讨论的更多是载人自动驾驶，阿里巴巴从第一天起就在关注物流自动驾驶。

王刚阿里巴巴达摩院自动驾驶实验室负责人

关于物流的自动驾驶，阿里巴巴专注于两个场景，第一个场景是最后1-3公里的无人配送，也称末端无人配送。这个场景有非常大的需求，快递或者外卖员进行最后1-3公里配送的时候效率非常低，因为无法实现集约化，就需要挨家挨户去寄送，导致效率极大降低。

自动驾驶是一个投入大，周期长的行业，单纯是由技术驱动以及投资来驱动，存在很大风险，所以阿里认为必须在早期就要和商业进行结合，和业务进行结合，产生商业的结果，从而能够驱动自动驾驶的良性发展。

幸运的是，阿里巴巴拥有全世界最丰富的商业场景，其中也包括物流场景。阿里内部有一条16字方针，即：需求牵引、技术驱动、结合业务、小步快跑。让商业和技术能够形成良好的互动。

虽然自动驾驶有很多机会，前景值得看好，但不可否认的是，自动驾驶现在还面临着全方位的挑战。我列了一个表，包括算法、计算硬件、传感器、基础设施。算法中除了控制是比较稳定的，感知、定位、决策三个模块都存在一些不足。在计算硬件上面，还没有高性能、低成本，以及能够满足车规要求的计算芯片。传感器也存在挑战，整体上挑战非常多。

作为一名软件开发人员，主要还是从软件角度来讲对自动驾驶的思考。自动驾驶是一个软硬一体的系统，同时，我认为它也是一个软件决定硬件的系统，那么很多硬件设备，包括芯片就必须为软件定制，否则是很大的浪费。

细化分解复杂场景疑难杂症逐个击破

为什么现在还没有一种非常好的算法，能够实现感知和决策？有人认为整个自动驾驶的算法要处理的问题太难了，而且当今社会道路场景繁多、复杂，很难找到一个通用的算法处理所有的场景，就会导致车辆存在碰撞风险。

那么在开发过程中如何处理这个难题？在人工智能领域有一个经典理论叫“No Free Lunch”理论。这个理论表达了一个观点：用通用算法处理所有问题，很难在所有的问题上都取得非常好的结果，相反的，开发者若是针对每个具体问题进行算法的开发、优化，就会在每个问题上得到比通用算法更好的结果。同理，在自动驾驶领域，我们可以把复杂场景分解，变成多个小问题，去进行针对性的算法研发。

为了使用“No Free Lunch”理论，第一步需要把交通场景进行分类、细化、分解，把大问题分解为可以解决的小问题。场景分类的任务并不简单，一个好的场景分类至少要满足两个条件，第一，场景必须是精细化的，一个非常粗密度的场景分类起不到降低问题难度的作用，基本上是无效的。第二，场景分类必须为算法服务，和算法是进行融合的，不是为了测试服务，也不是为了管理服务，是为了测试研发能够有的放矢、各个击破。

以变道切入的场景为例，阿里将其细分为25个场景，进行针对性解决后，效果提高了20%，并带来更高的研发效率以及更低的反应延迟。

图1 自动驾驶技术的全方位挑战

图2 怎么样处理多样化场景？——No Free Lunch理论

数据驱动的AutoDrive平台

计算换智能是一个非常美好的方向，为什么前面没有做？原因有两个，第一个是设计理念上还没有想到，第二个是AutoDrive平台需要一个坚实的工程支撑，如果想实现AutoDrive，必须完成从输入信号到输出结果的完整闭环，才能够让机器自动学习。

借助阿里巴巴的能力，我们做了三个事情：第一件事，将所有的路测数据，全部放到阿里云上，只有云平台才有足够大的存储能力和计算能力。第二件事，我们建立了从数据的上传、标注、模型训练、仿真以及评价整个数据的闭环，从而从信号输入到结果输出都能够在计算环境里去实现。第三件事，依托于阿里巴巴的资源，我们建立了强大的模型训练和仿真回归的平台，能够高效地对数据进行处理。这三个方面的工程能力是AutoDrive平台能够使用的必要条件。

受到美军作战思路的启发，阿里巴巴做了一个叫自动驾驶数据中台的平台。类似于为美军作战提供火力支援的飞机部队和导弹部队。中台就像每个作战团队后面强大的战略资源。自动驾驶数据中台应符合两个条件：第一，实现资源的共享，所有的团队，所有的开发人员，都能够获得相应的资源。第二，资源必须非常强大，非常全面，是能够解决问题的资源。

阿里巴巴的数据中台能够实现场景库的共享、所有数据的共享、系统工具的共享以及技术的共享。所以每个开发人员能够很方便获得已有的信息，并且平台里也包括各种工具，包括训练工具，包括Bug的追溯工具等等，能够让工程师以更高的效率开发算法。

笔者认为，要产生自动驾驶研发的化学反应，必须有三个要素：第一个要素是场景，根据“No Free Lunch”理论，我们需要对这个场景进行精细化的分类，把一个复杂交通场景的问题分解为数个，或者是几百个、几千个更容易解的小问题。第二个是算法，当我们有了这样的分解之后，对算法可以进行针对性的开发，去各个击破，去处理每个场景。第三个是云平台，这样的算法开发在现有的模式下，对人工的要求非常高，所以我们提出要用计算换智能，找到自动化的方式，提升研发效率和质量。

最后还有一个问题，是计算能力，也就是芯片。最近几年，人工智能芯片是一个关注度非常高的领域，但人们关注的更多是端上怎么进行快速推理的芯片，对于训练芯片以及训练集群的关注有点少。可能一些网络结构的搜索需要五千个GPU，但现在的芯片能力很难达到这种程度。

从某种程度上说，计算芯片、训练芯片限制了我们对更高效训练方式的研发，甚至说被发明，人们可能有很多更好的主意去训练算法，但因为训练芯片的限制，没有办法付诸于现实，所以这方面应该引起关注。