APP下载

中国AI崛起

2017-11-23陈冰

新民周刊 2017年45期
关键词:处理器语音人工智能

陈冰

从更宏观的层面来看,全世界都在讨论并等待一个现状到来:中国AI崛起,在不远的未来将超越美国。

她叫Sophia,是全球首个用流利英文演讲的机器人,也是首个获得国籍的机器人。日前,沙特授予了她人类公民身份。

TA叫涩谷未来(Shibuya Mirai),是一个虚拟助手,刚刚获得日本涩谷地区颁发的特殊居留证。这使得TA成为日本第一个,或许也是全球第一个可以“实地居留”的人工智能机器人……

TA叫AlphaGo Zero,从空白状态学起,在无任何人类输入的条件下,能够迅速自学围棋,并且只用了三天时间就以100:0的战绩击败“前辈” AlphaGo……

在过去的一段时间里,这些关于人工智能的新闻迅速刷爆了朋友圈。而从更宏观的层面来看,全世界都在讨论并等待一个现状到来:中国AI崛起,在不远的未来将超越美国。

帮警察破案,帮医生看病

《逃了10年的逃犯,被它“一眼”识别!》《 男子越狱潜逃17年,被抓前资产过亿公司将上市 》《女逃犯整成“锥子脸” ,还是逃不过“人脸识别” 》《湖北沙洋警方追捕23年,抓获“中国第一古尸案”最后一逃犯 》《潜逃25年命案逃犯落网!被抓之前,他竟然在这个地方…… 》

10年,20年,新闻报道中提及的这些积案命案何以连连破获?除了坚持不懈的精神,各地警方还有一大“神器”——依图人像大平台。

11月1日,依图在国际最高标准、测试数据集规模最大的,由美国国家标准与技术研究院(NIST)组织的全球人脸识别测试FRVT(Face Recognition Vender Tset)中获得冠军,这也是第一个获得此项竞赛冠军的中国团队。根据官方报告,依图在千万分之一误报下的准确率为95.5%,比第二名高出2%。这是目前为止全球公开的最大规模测试集、最权威测试指标下的最好成绩。这意味着上海已经拥有了全球顶尖的人工智能公司。

FRVT测试数据对应了出入境管理、身份门禁认证、平安城市监控等实战应用场景,依图在四项测试中均获得第一名,远超俄罗斯公司 Vocord、法国知名安防大厂 Morphos 等公司。其中的人脸识别算法检索挑战赛项目要求进行 1:N 布控,也就是在百万量级人脸数据库中找到目标人脸或判断其不在库中。查询照片都来自监控视频的截帧,包含识别对象不在摄像头前特定位置的“非配合性”照片。机器面临曝光过度、逆光、侧脸、远距离、低像素的挑战。

衡量指标在于搜索的精确度。检索准确率越高,就意味着依图的算法可以在更大规模的人脸数据库中获得可靠检索结果,可以更加准确、高效地完成身份验证,进而满足广泛范围部署在城市安全、边防、海关、金融等行业的海量需求,大幅提高效率。

实际上,依图的人脸识别技术目前已在全国公安领域广泛应用。它是国内唯一一家拥有支持18亿级人像库技术,秒级返回查询结果的企业,说得通俗一点,就是一秒钟可以比对10亿张人脸,而且误报率是只有十亿分之一的行业顶尖水平。上海地铁第一天上线这个系统,就发现了一名在逃犯罪嫌疑人,通过系统将信息发送至地铁巡查人员的手持终端,轻松抓住了他。

不光是看人,依图科技的“蜻蜓眼”车辆大平台智能车辆识别系统,拥有品牌识别、假套牌分析、基于視觉特征的“以图搜车”等特有的技术能力。通过人工智能算法和工程应用的结合,依图在深度学习中融入了基于统计学的图模型算法,快速实现了各种复杂商业场景的应用,成为警方破案、安防的一大利器。

依图科技创始人朱珑曾陪家人去医院,在候诊室排队很久,进到诊疗室里,医生和他讲了不到3分钟就结束了,他也无从判断医生给出的结果。作为MIT的博士,在医生面前,朱珑有种自己是一个“文盲”的感觉。那时候,朱珑隐隐觉得哪里不对,想着是不是有办法改变这个状况?

2016年,依图科技又进入医疗行业,开启了医疗AI时代。2016年9月,依图与广州妇女儿童医疗中心合作,开发了针对幼儿发烧诊断相关的虚拟医生“咪姆熊”。

“咪姆熊” 是基于深度学习技术,通过对几百万份病历及诊断报告的结构化处理和分析,让计算机系统真正“理解”人类的“自然语言”,并在医生的不断评价反馈下自动优化算法,建立起十几种儿童常见疾病的诊断模型,帮助医生提高诊断效率及准确率,更精准地制定治疗方案。这个被广州妇女儿童医疗中心的医生称为“熊医生”的医疗科研及决策平台可真的一点也不“熊”哦。

更让依图声名鹊起的则是智能医疗影像系统。一般人可能难以想象,一个三甲医院的放射科医生一天要看4万张胸片,这样繁重的工作量,对每一个医生来说都是巨大的挑战。智能医疗影像系统的辅助判读能够完成对医疗影像中的病灶检测、定量分析描述、良恶性的定性判断,以及影像中器官分割和手术中的靶区勾画等工作。说得通俗一点,就是让人工智能先做初筛,检出病灶并对病灶进行描述界定,把人工智能出的结果和医生出的结果做一个比较,结果不同的再由专家把关,这样就可以大大节省放射科医生的工作负荷。在实际使用5个月时间后,浙江省人民医院放射科与依图科技联合训练出来的肺结节计算机智能检测系统,计算机肺小结节的识别率就已经超过了90%,准确率达到95%。

“爆款”特别多

今年的工博会现场特别设立了AI人工智能专题展区,除了前文介绍的依图科技,还有不少重量级的“爆款”。

全球 AI 芯片领域的第一家独角兽创业公司上海寒武纪信息科技有限公司推出了新一代人工智能芯片,适用范围覆盖了图像识别、安防监控、智能驾驶、无人机、语音识别、自然语言处理等人工智能的重点应用领域。公司创始人、CEO陈天石博士说:“寒武纪芯片目前是市场上最完备、最具有前瞻性的IP芯片产品,可以支持视觉、语音、自然语言处理不同的差异化的人工智能任务,可以支持从上古时代的神经网络模型到现在最最流行的新型的深度学习的模型等各种类型的模型多样化的算测。”endprint

早在 2016 年寒武纪就发布了全球首款深度学习专用处理器——寒武纪 1A 处理器。它是国际上首个商用深度学习处理器产品,能够集成到终端 SoC 芯片,每秒可处理 160 亿个虚拟神经元,每秒峰值运算能力达 2 万亿虚拟突触;在人工智能应用上达到了四核 CPU 25 倍以上的性能和 50 倍以上的能效。

这款处理器被用在了全球首款人工智能芯片——华为麒麟 970 手机芯片中。它使华为手机具备了强大的本地智能处理能力。与苹果A11处理器相比,搭载寒武纪技术的麒麟970每分钟可识别2005张照片,而苹果每分钟识别889张照片。不仅如此,这款处理器还拥有极佳的功耗表现,如果手机电量充足,NPU(神经网络处理器) 完全可以利用一块电池实现 50W 张照片的识别。而寒武纪最新推出的机器学习处理器(MLU),将支持多样化的机器学习应用,而非仅仅是深度学习。

陈天石表示,寒武纪将力争在 3 年之后占有中国高性能智能芯片市场 30% 的份额,并使得全世界 10 亿台以上的智能终端设备集成寒武纪终端智能处理器;如果这两个目标能够实现,寒武纪将“初步支撑起中国主导的国际智能产业生态”。

另外,陈天石还表示,未来人工智能方法将在视觉、语音、自然语言、数据分析、经济金融等各位应用方面大显身手,这就要求未来超级计算机、数据中心、智能手机、嵌入式设备等要进一步智能化,而寒武纪机器学习处理器有望成为这些设备的标配。

而在语音、语义识别领域,人工智能也呈现出加速发展的态势。两年前,科大讯飞展示了全球第一次能够把大会的演讲用人工智能直接转化成文字,而且转写准确率超过了人工记录人员的技术;去年,科大讯飞又首次发布了全球可以达到大学六级口语水平的即时翻译机——晓译翻译机,在工博会现场,最新升级的晓译翻译机不仅支持离线翻译,而且可以翻译的语种也从中英增加到日韩法西六国语言。对于录音转文字有刚性需求的记者、学生党来说,讯飞也推出了手机端的录音宝App和PC端的讯飞听见。一想到能把记者从耗时费力的整理录音的泥沼中解救出来,就觉得人工智能的未来真是太美好了。

更厉害的是,科大讯飞与清华大学联合研发的“智医助理”机器人以高分通过2017临床执业医师综合笔试评测,成为全球首个通过国家临床执业医师综合笔试测试的机器人。国家医师资格考试每年举行一次,满分600分,今年的分数线是360分。通常情况下,医疗专业的毕业生,工作几年之后也只有一半的人能通过考试,今年讯飞“智医助理”考了456分,超过录取分数线96分。

展台的相关负责人告诉记者,讯飞的“语音电子病历产品”能随时口录,让医生不用熬夜写病历。而“影像辅助诊断系统”则能够結合医学专家诊断经验和大量样本数据,自动从医学影像中检出病灶并对良恶性作出判断,辅助医生快速、准确地完成影像诊断,让医生拥有一个懂医“孙悟空”,火眼金睛,明察秋毫 。“基于语音电子病历、影像辅助诊断和‘智医助理产品,科大讯飞打造的‘人工智能辅助诊疗平台,将让医疗水平、医生能力都能进一步提升。”

对于普通老百姓而言,最热门的人工智能产品当数智能音箱了。自从2014年11月亚马逊推出基于语音交互的智能音箱Echo,去年销量超过500万台,今年更是逼近1000万台,成为了人工智能消费级产品的爆款,引发各路人马纷纷跟风效仿,谷歌、微软、苹果先后跟进抢占智能家居的语音入口,国内更是一片“血海江湖”,粗略统计玩家不下50家。除了最早进入的京东和科大讯飞之外,BAT以及联想、小米纷纷入局。10月的杭州云栖大会上,阿里云更是和Rokid(若琪)携手宣布了行业重磅消息:共同推出全栈语音开放平台,为业界提供一站式语音解决方案,打造AI时代开放平台的新标配。

这个开放平台还专门为工程师们设计了一个长得挺秀气的硬件装备。它只有一盒润唇膏那么大,可以随时随地装进口袋带走。可是在它身上却包含着:蓝牙、GPU、CPU以及麦克风阵列、信号处理等所有开发所需,最后还有一个3.5毫米的音频输出接口、Micro HDMI接口,可以直接连接电视显示。在软件方面,两套分别搭载了Linux和Android操作系统的开发套件内置其中,语音服务可以选择Rokid或者阿里云,双方还将语音交互和语音技能方面的技术作为并集开放。

Rokid的CEO祝铭明表示:“在AI时代,语音技术开放已经是大势所趋,从此以后,不管是个人还是公司,都能够根据自己的需要去选择自己需要的语音服务,让身边的电视机、冰箱、玩具、汽车甚至机顶盒都能够听懂会说话,让家居生活真正智能起来。”

若琪的最新开脑洞功能是可以充当狼人杀的裁判,让你和朋友在家里就可以轻轻松松“一夜狼人杀”。据说还有一位恶趣味的工程师,利用开放平台专门设计了让智能音箱不停放各种屁的功能……

 ;上海行动

当人工智能在围棋比赛中大放异彩,机器人越来越多地被应用到工业生产和日常生活中,中国的智慧头脑们如何思考人工智能的发展。11月7日,在第十九届中国国际工业博览会院士圆桌会议上,数位院士专家指出,大数据智能、群体智能、跨媒体智能、人机混合增强智能和自主智能系统将是五个重要的方向,而上海拥有丰富的应用场景、深厚的集成电路产业基础,以及对新生事物包容并快速接受的传统,这可说是上海发展人工智能的优势所在。

“不管是阿法狗,还是阿法狗零,都是在人工智能应用方面的成果,如果要让这些成果变成通用的、全局的进步,比如让阿法狗玩扑克,还是要有赖于基础理论的重大突破。如果基础理论不往前进,不能形成通用的人工智能理论,那么应用也走不远。”从1987年开始研究人工智能的北京邮电大学原副校长钟义信指出,“上海在脑神经科学研究方面拥有强大优势,有很好的基础。应该建立京沪优势互补的合作机制,实施通用人工智能基础理论研究。通过联合研究,人工智能基础理论的重大突破完全有可能提前五年左右。”

上海的制造业产值现在是3万多亿,如何把制造业和人工智能相结合?中国工程院院士、华东理工大学副校长钱锋说,发展人工智能有两条路线,一是信息化路线,还有一个就是传统制造,如果把“中国制造2025”加上人工智能,其内涵将远远大于工业4.0。上海的钢铁、石化等传统优势产业,要与新一代的人工智能技术深度融合方能引领国际。

百度云计算事业部首席数据科学家沈志勇则指出,他的老家在绍兴,那里纺织业很发达,想请他帮忙做智能制造。后来一了解,纺织车间里连信息化都还没有完成。“当我们在说人工智能或大数据时,先要信息化,然后才有可能谈数据驱动。”

上海科大讯飞信息科技有限公司董事长程甦说,人工智能是建立在大数据基础上,上海正是一个数据特别丰富的地方。这里移动互联网特别发达,用户乐于接受新事物,这里还有着丰富的应用场景,这都是积累大数据的重要基础。“我们特别希望上海能够建设人工智能相关技术的公共平台,开放标准接口,这样会大大加速人工智能应用的发展。”endprint

猜你喜欢

处理器语音人工智能
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
对方正在输入……
人工智能与就业
Imagination的ClearCallTM VoIP应用现可支持Cavium的OCTEON® Ⅲ多核处理器
ADI推出新一代SigmaDSP处理器
AItera推出Nios II系列软核处理器