让人工智能“看”得更清楚
2018-10-21张友发
张友发
据美国媒体报道,5月4日,在美国亚利桑那州钱德勒市的公路上,谷歌旗下自动驾驶公司Waymo的一辆自动驾驶汽车遭遇车祸。而在此之前的3月18日,亚利桑那州因为一起驾驶事故禁止了优步的自动驾驶实验,该事故导致了一位横穿马路女子的死亡。安全问题成为公众对自动驾驶最大的质疑。
眼擎科技公司在今年4月20号发布了国内首个车规级自动驾驶视觉成像方案eyemoreDX120,为解决自动驾驶的困局提出了自己的方案。方案建立在公司的成像芯片eyemoreX42基础上。这款芯片致力于解决复杂光线成像问题。
在交流中,眼擎科技CEO(首席执行官)朱继志措辞谨慎:“我们的方案还需要和设备商磨合,要经过车厂测试。我只能说这比现有方案前进了一大步,但能否在成像方面解决自动驾驶的安全问题,还需要观察。”
除了自动驾驶,朱继志还谈到了眼擎科技在人工智能和芯片领域的布局与野心。过程中,朱继志经常提到两个词:一是“专注”,即公司对某一个细分领域的专注;二是“机会”,包括大的技术变革给中国成像芯片产业带来的机遇。
用人工智能的思路做成像芯片
创业过程中,眼擎科技经历了4年的科技沉淀,积累了能应用于人工智能(AI)领域的复杂成像技术。眼擎科技成像芯片的核心技术是复杂光线下的稳定成像。朱继志介绍,目前人工智能的图像识别率已经很高,在实验室中能达到98%甚至99%,但来到现实场景时,图像识别率就会大大下降。
“这就像我们在淘宝上买东西,看到的都是卖家秀,拿到手的却是买家秀。这其中最大的差别,就是光线环境的问题。”朱继志认为眼擎科技研发的成像芯片能很好地解决行业痛点:“实验室与现实环境的差别是光线差异,这是最大的落地难点。我们研发的这款成像芯片就像我们的眼睛一样,能把实验室99%(的识别率)变成现场99%(的识别率)。”
这是人工智能带来的挑战与机遇。在成像芯片领域,之前芯片厂商的思路是服务于相机,研发的出发点是看镜头的人;人工智能给成像芯片带来了新的课题,研究思路从给人看转向给AI看。
朱继志说:“在传统成像芯片时代,复杂环境下的成像问题不是刚需,因为环境光线不好可以补光,甚至可以不拍。但在自动驾驶时代,这就成了刚需。”
适应新的时代需要变革原有的技术框架,但在朱继志看来,传统公司很难完成转型:“传统的架构不能解决复杂光线下成像的问题。为了解决这个问题,我们从芯片架构到算法,再到场景测试,做了很多工作,我们在复杂光线的适应情况上和传统公司不是一个层级,包括索尼。”
“过去30年,以ISP(图像信号处理器)为代表的传统成像架构一直统治着成像能力的表现,即使现在AI发展了,效果也不可能有很大的提升。原因很简单:30年前的技术架构,人们不可能考虑未来人工智能有什么需求。以前图像只考虑给人看,现在的图像是给机器看,但传统架构成形多年,积重难返。这就是技术架构的弊端。久而久之,大家没看到视觉能够突破,就会形成一种观念——认为视觉能力是不可能突破的,这也是激光雷达日后被叫好的一个原因。其实本质上,我们应该回到问题的源头,视觉能力不够,就研发新的成像引擎架构,做视觉成像专用的芯片,以此来提升汽车的视觉能力。这件事不好干,我们为此专注了4年。”
朱继志觉得这是人工智能的发展给中国芯片企业带来的机遇:“在AI芯片领域,美国比中国领先得不多,也就是几年的优势;而在传统的芯片领域领先了我们几十年。AI给中国公司带来了机会,这是一个新兴市场,我们起点相仿。”
成像技术的第一个应用场景
朱继志的思路是循序渐进,先通过4年积累掌握成像引擎核心技术,第二阶段再推出产品,也就是成像芯片。今年朱继志的目标是完成第三阶段任务,让产品在应用场景中进一步落地。目前发布的产品eyemoreDX120通过配置汽车外围接口做成适应自动驾驶的模组,将芯片产品发展为情景化的自动驾驶解决方案。
eyemoreDX120解决方案的优势在于具备较强的场景适应性,在不同场景下都能够稳定成像,解决了自动驾驶面临的复杂光线成像不稳定的问题。eyemoreDX120的镜头传感器符合接口的行业规范,能解决120dB动态范围内的自动驾驶成像问题。
朱继志将自己的方案看作自动驾驶技术的重要一环:“AI落地的时候是一个接力赛,我们前面是镜头和传感器,我们做的视觉成像处在第三棒,我们后面是成像识别。很多现在的明星芯片公司,比如地平线,都在做这个。”
眼擎科技今年打算让成像芯片在多个行业落地,而之所以选择自动驾驶作为起点,朱继志有着自己的考量:“自动驾驶对人工智能领域的技术要求很高,可以说是最高的。其次,我们的产品在自动驾驶(领域)是刚需,痛点最大。我们判断切入的标准,首先是看这个市场的容量够不够大,其次是看痛点多不多。自动驾驶恰好在这两点上都符合。”
“人工智能的应用场景很多,其中自动驾驶的应用很容易推广到其他领域,成熟的技术可以迁移到AI其他产品中。”朱继志这样解释自动驾驶对于人工智能发展的推动作用。
对于自动驾驶的未来发展,朱继志觉得问题很复杂:“自动驾驶系统相比机器人,挑战更大。自动驾驶需要人工智能不同系统的协调合作。我们只解决成像这一个点,但如果有十几个像我们这样专注的公司,那人工智能自动驾驶问题会得到很好的解决。”
眼擎科技的关键一年
对朱继志来说,今年是人工智能和眼擎科技的关键一年:“2018年是人工智能落地的一年,去年大家主要在做试点。我们公司在未来3年内会有大规模的部署,预计在各个领域开发约60个客户,让方案在不同行业落地,丰富产品线。今年是重要的布局年。”
朱继志未来打算重点在汽车、安防、工业检测和机器人等方面发力:“人工智能进入的领域越多越好,需要和更多产业去磨合试错,然后才能从小到大得到发展。而视觉是人工智能的关键点,我们需要把技术和芯片产品赋能到传统行业。”
对于未来的人工智能大局,朱继志觉得眼擎科技需要坚持好技术导向:“我希望公司能看到技术痛点,解决(痛点)后形成产品,再去寻找潜在的市场。”
至于成像芯片的对手,朱继志半开玩笑地说:“成像芯片目前的综合能力和眼睛差别还很大,我们的对手应该是人眼而不是传统公司。AI最终就是要颠覆原有格局,让机器做得比人更好,这是我们最终要解决的问题。”
链接:新的千亿级市场诞生
视觉技术分为两种:成像(imaging)和图像处理(image processing)。前端成像技术负责生成视觉图像,后端图像处理负责分析、识别、处理视觉图像。换句话说,成像相当于人的眼睛,图像处理相当于人的大脑。
目前人工智能领域的明星公司,包括商汤、旷世、地平线、云从、依图、深鉴等,都是基于图像处理算法为核心技术的公司。在过去的3年里,受深度学习技术的驱动,图像处理获得了飞速的发展,但前端的成像技术,仍然停留在20年前的水平,成为AI视觉未来发展以及商业应用落地的严重瓶颈,也是当前各大AI公司的下一个必争之地。
和数码时代相比,AI时代的成像在成像架构、算法模型、评判标准、光线适应性等诸多关键环节都发生了本质的变化。传统的数码成像技术架构已不能满足AI视觉的需求,面临迅速被淘汰的窘境。未来5年,成像技术将有望完成从“图像”到“視觉”的划时代升级,视觉成像芯片和AI处理芯片一样,成为人工智能的核心部件,由此衍生的产业升级需求,将在未来5年催生出成像领域千亿级别的新增量市场。