关注点别偏了!李彦宏展示的诸多AI秀更值得被关注
2019-09-10黄枪枪
黄枪枪
“AI前进的道路上会有各种各样的事情发生,但是前进的决心不会改变,AI会改变每一个人的生活。”
7月3日,北京国家会议中心,百度AI开发者大会。经历意想不到的插曲后,百度创始人、董事长兼CEO李彦宏淡定地说。
数千人的掌声雷动——事实的确如此,作为百度一年一度最为核心的发布会议,李彦宏展示了百度AI在多个领域的研发成绩及进展:小度智能音箱最新的无需唤醒语音交互能力,与吉利汽车董事长李书福联手秀 “车+互联”场景,让河北保定红绿灯智能化,与浦发银行打造超级员工“金融数字人”。
以及,李彦宏分享了一则有关“盲人按摩店”的故事,百度AI寻人帮助6700个家庭重新团聚。
另外,这也是今年5月百度人事大动荡后多位高管的首次亮相:CTO王海峰、高级副总裁沈抖、副总裁景鲲等高管悉数出席。升任百度 CTO 的王海峰,也带来了百度大脑 5.0 的最新进展,而且,王海峰还宣布又一款语音 AI 芯片“鸿鹄”亮相,宣布百度飞桨与华为麒麟芯片达成深度合作,首次亮相了无人驾驶出租车项目“Apollo Go”。
这是百度正在展开的变革,也是李彦宏在演讲最后部分,提及的“技术是百度的信仰,‘用科技让复杂的世界更简单’是百度的使命”。
智能音箱,不只是音箱
2019年的百度AI大会,全程由百度AI“小度”主持,首先登台的是一身白衬衫的李彦宏。
李彦宏说,今年是第三次举办AI开发者大会,所谓一生二,二生三,三生万物。“AI也是一样,正在唤醒万物。”
智能音箱,是李彦宏选择的第一个AI秀。2018年,百度将智能音箱提高到语音交互时代入口战略地位,李彦宏在去年的大会上展示了小度连续对话的能力。
从这个角度来看,智能音箱正在成为百度AI的一次重要商业化落地,也难怪李彦宏会在众多AI黑科技中选择第一个展示。
这次李彦宏展示的是小度“全双工免唤醒”能力。“全双工免唤醒”实现了“一次唤醒,多轮交互”能力,还能在与他人对话的同时互不干扰地实现人机交互。简单来说,不需要一直说“小度小度”唤醒词,而且能识别哪些是人与人之间的对话,而不是向小度发出的指令。
之后,刚刚晋升为百度公司副总裁的DuerOS负责人、智能生活事业群组总经理景鲲更详细地介绍了小度助手5.0的功能,包含全双工免唤醒能力、家庭信息流、家庭通信与通知和智能音箱DLNA直接投屏能力。
“超级入口”是百度赋予DuerOS的使命。以互联网搜索起家的百度深谙入口的重要性,今年5月,景鲲公开表示,小度是未来百度的搜索和信息流。
景鲲还在现场发布了小度新品,小度智能音箱大金刚、小度智能音箱Play、小度智能音箱限量青春版,还有小度智能音箱1C 4G版。以及百度与爱奇艺深度合作,在大金刚上搭载了智能音箱DLNA投屏能力,无需特别配件和协议,音箱可以变为电视。
根据Canalys发布的2019年Q1全球智能音箱市场报告,百度2019年Q1小度智能音箱出货量达330万台,仅次于谷歌的350万台及亚马逊的460万台,跃居中国市场第一,全球市场第三。
实际上,在百度看来,智能音箱已不再是音箱。景鲲说,智能音箱是一个人工智能的强大载体,它背后是人工智能助手的能力——目前在小度在家上,比如美团外卖、口袋故事等的技能生态,已经成为第一大应用,使用次数已经超过了音乐和长视频。
这有点像智能手机时代,智能手机现在第一大应用已经不再是打电话,而是找信息、购物、看视频等等第三方生态。而今天,在智能音箱上这种事情又再次发生了。
自动驾驶时代加速跑
在李彦宏看来, 小度的进化只是AI变革的小小缩影。AI更大的作用力,正在展现在各行各业,且只要变革某个小小环节,就能带来大大不同。
比如,“停车”一直是城市的一大痛点,2018 年我国乘用车的保有量达到 2.7 亿台,而停车位的缺口高达 6000 万,有 44% 的车位利用率非常低。在一线城市,司机 30% 的驾驶时间花在停车、找车位上。
李彦宏展示了全L4自主泊车方案,通过手机 APP 可召唤车辆,车子就能远程启动,自动开出地库,过程中可以实现自动避障等。
李彦宏表示,目前百度科技园已经实现了此方案,已拿到多个车企的合作订单,将让一部分人实现“最后一公里自由”。
随后李彦宏通过小度车载系统,与车内的吉利控股董事长李书福进行远程互动,秀了一把“车+互联”的场景。
此后,李书福开车来到现场,宣布从吉利博越 PRO 开始,吉利汽车将开始全面搭载融合小度车载交互系统的 GKUI19 系统。双方将在智能网联、智能驾驶、智能家居等方面达成合作。李书福还说,未来的车不仅有超级大脑,还具备线上线下的结合,实现车+互联,为用户带来便捷智能的出行体验。
百度副总裁兼智能驾驶事业群组总经理李震宇在演讲环节还展示了更多:
百度和一汽红旗打造的中国首条L4乘用车前装产线,目前已经开始正式投产下线,首批量产的L4级自动驾驶乘用车将率先落地长沙。
Apollo升级到5.0版本,其中阿波罗开放平台全新开放数据流水线,Apollo企业版则发布了无人驾驶出租车、智能信控两大量产解决方案,重点升级无人驾驶小巴、自主泊车、小度车载OS三大能力。
截至目前,Apollo生態合作伙伴规模已达156家,搭载百度车联网功能的汽车品牌已超过60家,上市车型达300余款。
无论如何,自动驾驶时代距离我们越来越近。
今年6月,继上海、北京、深圳后,广州也正式发放智能网联汽车路测牌照,共发放24张自动驾驶路测牌照,牌照发放数量位居全国第二,仅次于北京。其中,一批自动驾驶企业都顺利拿到了牌照,而百度是拿牌最多的,在北京首批T4级别自动驾驶路测牌照中,百度独揽5张,在长沙更是一口气获得45张自动驾驶牌照。
百度AI对交通产业的智能化变革,不止于车,在场景更大的智能交通领域,百度已在多个城市落地智能红绿灯。李彦宏举例称,在河北保定,通过智能红绿灯规模化部署,市民的行程延误时间减少了 20%~30%,缓解突发交通拥堵效果显著。
百度大脑成AI大生产平台
在李彦宏以后,百度CTO王海峰履新后首次公开演讲。今年5月,百度宣布晋升高级副总裁王海峰为百度集团首席技术官,同时他将继续担任AI技术平台体系和基础技术体系总负责人。
值得一提的是,王海峰演讲前,百度机器人表演了一段传统项目:茶艺。这个机械臂不仅会倒茶,还能和王海峰熟练地对话,并且精准识别茶杯位置。
小小机械臂背后,融合了计算机视觉、语音交互、自然语言处理等多种AI技术。
集百度AI技术大成者,便是“百度大脑”,对内支撑Apollo、DuerOS平台,对外赋能其他产业——在现场,王海峰宣布百度大脑升级至5.0,形成了包括基础层、感知层、认知层、平台层和AI安全五大部分的核心架构。
在技术层面上,1.0主要是语音、图像、自然语言理解和用户画像能力,2.0则形成了更完整的技术体系——算法层、感知层、认知层和平台层,3.0则意味着百度大脑进入到“多模态深度语义理解”阶段,5.0则成为了软硬件一体的AI大生产平台。
王海峰介紹道,百度大脑已经累计向开发者开放200多项AI核心能力,落地到金融、交通、医疗、工业、零售等诸多领域。
另外,王海峰还与华为消费者BG软件总裁王成录联合宣布,百度飞桨与华为麒麟芯片达成深度合作。
这是继去年开发者大会发布“昆仑”芯片后,百度发布的又一款新的芯片——远场语音交互芯片“鸿鹄”。鸿鹄芯片使用了HiFi4自定义指令集,双核DSP核心,平均功耗仅100mW。这款芯片是根据车规级标准打造,将为车载语音交互、智能家居等场景带来巨大的便利。
分析认为,百度做芯片的背景在于AI应用的爆发,对运算能力提出越来越高的要求,基于传统芯片的AI运算加速,已经不能满足需求。因此百度研发出了专门用于AI大规模运算的芯片。
不仅是百度,阿里也在布局芯片。去年,阿里巴巴全资收购大陆唯一的自主嵌入式CPU IP Core公司中天微,投资了寒武纪、Barefoot Networks、深鉴、耐能、翱捷科技等芯片公司,向外界表明阿里巴巴集团要打造“中国芯”。
移动基础决胜AI时代?
“夯实移动基础,决胜AI时代”是百度的战略。
百度App就是“移动基础”的几种体现,在2019百度AI开发者大会上,百度高级副总裁、移动生态事业群组(MEG)总经理沈抖透露,截至目前,百度App日活用户达到1.9亿,百度移动产品月活设备达到11亿。
这背后也离不开技术的功劳——百度针对移动端平台推出的飞桨移动端部署库,这是百度深度学习平台飞桨的子集,专门针对移动端的特定场景进行了多项优化,将模型体积缩小至300KB。目前,其已经支持8种软硬件平台,实现了移动端全平台覆盖。
基于飞桨移动端部署库,百度App实现了“超级分辨率”以及“动态多目标识别”两项技术。
在“动态多目标识别”这一技术中,百度把原来云端200多层的视觉算法模型优化到10余层,实现了100毫秒内识别物体,8毫秒内判断物体位置追踪更新。这一技术的应用,使得百度App可以通过手机摄像头实时追踪并识别出屏幕内出现的多个物体。
沈抖在现场演示了实时识别多款化妆品的场景,百度App不但可以追踪并识别出观察到的化妆品名字,还可以进行找同款、比价格、跳转到电商平台购买等功能。
沈抖称,除了飞桨移动端部署库的应用外,通过更加强大的自然语言处理技术、知识图谱等技术,百度App还能够更好地理解用户的需求,并在互联网的海量信息中为用户找到并呈现出最有效的答案——比如,科比和樱木花道谁高?库里的场均得分和詹姆斯的谁多?等等。
总结:与每个人都相关的AI技术
其实,百度AI在产业和生活更智能化的布局,已经与每个人都密切相关。
比如,在金融领域,百度和浦发银行通过技术创新,打造了一个超级员工——“金融数字人”,它有一个超级大脑,永远不惧怕 996 的工作节奏,可进行个性化的服务。在现场,李彦宏与“数字人”进行交互,它具备流畅的语音交互能力,并且具备表情、手势等肢体语言。
另外值得一提的是,AI技术并不是冷冰冰,而是有温度和爱心的。
首先是AI寻人。李彦宏说,百度AI寻人已帮助超过6700个家庭重新团聚,将覆盖民政部全国1600家救助站。
另一项是AI助盲。这是两位百度工程师发现的语音技术应用的新场景,通过对房间的智能化改造,盲人师傅可以用语音来控制各种设备。百度宣布与多家盲人公益机构联合发起“AI 助盲行动”,先期计划在三个月内,在广州、成都、西安、太原、青岛、郑州等六 大城市进行盲人按摩店 AI 试点改造。
这两个方向,与马化腾提出的“科技向善”是一个意思。在人性之善的引导下,“AI向善”也好,“AI助盲行动”也好,哪种说法都不重要,都将帮助人类提升生活品质,为社会发展创造新的可能。对此,我们不管如何都该积极点赞。