向人类思维进化的机器智能
2015-03-27袁文
袁文
在IBM的计划中,沃森要打造的是一个生态系统
如果你认为机器人离人类生活还很遥远,不妨看看以下这些真实的场景:
无聊郁闷时,我在微博上发了一句“不开心,怎么破?”并@微软小冰,20秒后,她就送上了回复:“抱抱?皱着眉头容易长抬头纹哦,不骗你,是真的!”
只要我愿意,聊天就会一直持续下去。看这些机智温暖或逗比的回答,真有点云开雾散的效果。这样会聊天的小冰最近还登上了东航飞机,在无聊的空中飞行时间里为人解闷。
大家都熟悉的Siri和微软Cortana(国内称为“小娜”),则是存活在手机里的小秘书,在你需要时,做些类似查询天气、拨打电话、发短信、查新闻的事情。
就在前不久,我的一些媒体同行在北京享用了一顿特别午餐,大厨是IBM沃森(Watson),它会根据食材特质自主设计菜谱,人类厨师只需要完成加工的简单工作;而在美国的一些医院和研究机构,沃森已经开始帮助医生治疗癌症患者。
1月31日苹果公司发布一季度财报后,美联社在几分钟后就发表文章《苹果打破华尔街第一季度预期》,作者正是熟悉苹果风格的机器人。美联社在半年前开始采用机器人记者,每个季度能产生3000篇这样的稿件。
类似场景之多,大概讲上几天也是没有问题的。小冰、小娜、沃森这样的计算机虚拟人物,虽然没有科幻大片里那样酷炫的实体,但他们可以识别理解人类语义,模仿人类大脑运行,并按照人类习惯的语言方式给出答案,所以也算机器人的一种。
那么问题来了:他们是如何实现向人类进化的?
学习自然语言听懂人类
“芯片是硅做的,人是碳做的,硅与碳在元素周期表上正是同一族。让机器像人一样思考,是顺理成章的事。”IBM全球副总裁王阳在介绍人工智能和沃森技术时,曾经这样表述。
要说机器人技术哪家强,IBM沃森肯定算得上业内翘楚了。它在2007年诞生于IBM研究院的实验室,以IBM创始人Thomas J. Watson命名,首次为世人所熟知,是在2011年参加美国老牌智力竞赛节目“Jeopardy!”(危险边缘),以高比分落差战胜两位人类答题高手。
不过,与电影里机器人拯救或摧毁世界的酷炫场景不同,所谓沃森机器人,其实就是IBM超级计算机沃森所具备的AI技术。它包括数十台IBM Power7服务器,根据不同应用场景进行运算,给出人类需要的答案。
沃森的工作流程大致是:通过语法语义分析问题——搜索知识库,提取备选答案(它可以在不到5秒的时间查看约2亿页内容)——针对备选答案搜寻证据——启动逻辑推理程序,对备选答案进行合并和可信度排名——得出最佳选项。
听起来似乎只是一堆冷冰冰的计算机在跑程序,但IBM研究院苏中博士告诉《时间线》,以《危险边缘》为例,沃森的神奇之处在于,它参赛时并没有联网,所有知识都来自过去四年IBM工作人员的培训。
培训开始前,沃森在开放领域的答题准确率只有20%至30%。期间算法不断完善,类似人类的记忆学习过程,机器在读懂自然语言后,进行自主学习、分析、预测,最后做到3秒中精准回答问题。为了提高准确率,避免答错扣分,这只聪明的家伙还会选择放弃一些不确定答案的问题。
沃森所代表的认知计算,被蓝巨人认为是未来的重要发展方向。2014年1月,IBM为其在纽约成立了专门的业务集团Watson Group,提供10亿美元资金支持。IBM总裁、董事长及首席执行官罗睿兰也在2014年一封致股东的年度信中称,Watson认知计算技术、云计算及互动系统将彻底改变IBM。
在沃森可能带来的这场变革中,苏中认为,其最重要的突破在于理解人类语义——“它首先得明白问题的意思是什么”。
要知道,沃森面临的问题,可不仅仅是“1+1=?”这样的直接提问,比如在《危险边缘》里,沃森需要理解主持人的段子、讽刺、谜语等表达方式。这是此前的计算机很难达到的程度,也是机器向人类进化所要跨越的第一步。
IT 巨头们自然都不会放过参与机器进化的机会。在理解自然语言方面,谷歌、微软也有着各自的动作。
比如《时间线》了解到,奇点大学校长、谷歌工程总监雷·库兹韦尔在最近到访中国,与周鸿祎会面期间,就以Google Tranlsate为例,介绍了机器是如何理解人类语言的:
“在几年前其实就是文字匹配,我们创造一个数据库,然后去寻找跟这个数据库里匹配的翻译。现在我们试图用更深层次的机器学习来打造这个产品,我现在做的工作就是模拟真正人类的翻译模式。比如当你试图理解我在说什么的时候,你是在自己头脑中创造另一种想法,来匹配我的意愿,创造一个阶级状的语义模型,然后用另一种语言诠释出来。”
而微软最近的代表作就是“萌妹子”小冰了。这款智能聊天机器人的资料库包括中国近7亿网民多年积累的全部公开聊天记录,微软从中精炼了1500万条语料库,让小冰可以通过上下文语境进行回复。
不过,小冰的智能程度显然与沃森还不在同一量级。这位“16岁少女”的智商并不稳定,答非所问的表现会不时提醒你:陪你聊天的终究还只是一位虚拟机器人。
建立深度神经网络认识世界
相比沃森,IBM的另一项新技术更加充满未来感。
在2014年8月的《科学》杂志上,IBM公司与康奈尔大学的课题研究人员发表了一项计算机芯片成果——他们模仿人脑结构,制造出一款集成54亿个晶体管、包含4096多个神经突触核心的芯片。
在这款芯片中,每个神经突触都有自己的计算结构,并与人脑生物组成部分相对应。人脑的运作原理被搬进芯片。核心内存相当于脑神经突触,处理器相当于核心的神经元,接线相当于大脑轴突的神经纤维。
芯片兼具高效和节能的优点。根据文章介绍,芯片被设计成类似一种脉冲神经网络。与普通神经网络每隔固定时间处理一次数据不同的是,脉冲神经网络只会在电量超过阕值时才会被激发,被激发的部位再反过来影响其他“神经元”。据此,每触发一次,芯片可以产生100万个可编程的脉冲神经元,和2.56亿个可配置的神经突触。
研究人员用一场实验测试了它的节能程度。提供一段视频,让芯片从背景中找出行人等特定人员或物体,与之做对比的模拟器同样基于人工神经网络,但使用的是多用途微处理器。对比发现,新芯片消耗能量只有模拟器1/176000,解析速度却提高了100倍。
尽管新芯片离真正的人脑还有很远——人脑有800亿个神经元细胞,100万亿个连接,其中信息处理过程也完全不同于电脑程序——但这的确代表机器向人类的进化的又一次尝试。雷·库兹韦尔在畅销书《奇点大学》里提出的那个著名观点:人工智能将在2045年完全超越人类智能,似乎听起来也没有那么癫狂了。
如果说理解自然语言是机器听懂世界的过程,那么计算机神经网络的构建,大概就是一首机器感知并领会世界的舞曲了。
比如谷歌有名的“猫脸识别”实验。Google X实验室用1.6万片CPU核处理器、10亿个内部节点构建了一个当时全球最大的电子模拟神经系统,向其展示来自YouTube的1000万段视频,在没有外界指令的自发条件下,10天后,“大脑”认识了什么是猫,在随后的2万张图片中,准确找出猫的照片。
这个类似小朋友识图认字的过程看起来简单,但基于神经网络的“人工大脑”技术若真正成熟,由此带来的改变却是革命性的。
深度神经网络技术最初受到关注,是在1980年代的大数据预测和分析领域,但当时受到计算机速度限制。直到近几年,计算机开始呈摩尔定律发展,深度神经网络技术“复活”,才开始真正发挥出威力。
目前,神经网络技术的一个重要应用领域就是语音识别。比如,谷歌就正在野心勃勃地想消灭键盘——利用公司海量数据的语音系统,让电脑可以听懂并“思考”人们的语音。新技术使用上下文、物理位置和其他因素进行假设,由此理解语音真正含义。
谷歌工程师约翰·沙尔克维克在接受媒体采访时介绍,3年前,谷歌的语音识别技术还只能认出3/4的口语单词,现在,Google Now已经可以正确识别12/13的单词。想象一下,当未来键盘真正消失,计算机的外型设计也有了更多自由,嗯,至少在外型上,机器有可能变得更加像人。
在云端
如果没有云平台,未来机器人恐怕永远只能停留在科幻小说和影视作品里——总不能家家都腾出一间卧室,安放存储着海量数据和复杂运行程序的计算机吧!
正是云平台的发展,让沃森有机会从实验室走向市场。“参加比赛的沃森已经变成了产品。”苏中告诉《时间线》,Watson Group成立后,通过云平台向企业提供服务,“沃森不是一个封闭系统,而是开放式的创新,投资部门、有灵感的创意公司都可以访问到它。”
比如2014年3月,IBM宣布利用沃森云计算系统与纽约基因组中心合作,帮助后者开发治疗脑胶质瘤的方案。具体做法是,基因组中心对患者进行DNA测序,通过沃森把数据和临床信息结合起来,得出有针对性的治疗方案。
DNA测序产生的大量数据,用人工处理基本不太可能。IBM高级副总裁与研究主管约翰·凯利形容这个过程“像在草垛里寻针,而且这个草垛极为巨大”。借助沃森的云计算系统,人类需要花几年去完成的事情,如今几秒钟就可以搞定。
而实现这一切,纽约基因组中心并没有购置庞大的计算机,而是接入沃森的云服务,所有数据运算工作在云端就可以轻松完成。现在,沃森针对某个特定行业的培训,只需要6个月左右。
在IBM的计划中,沃森要打造的是一个生态系统。IBM全球副总裁王阳曾介绍:“沃森不是只有IBM能够应用和开发,我们会把沃森通过云平台开放给所有人,这对IBM来说也是非常明智的战略选择。”
2014年9月发布的Watson Analytics,就是沃森开放计划的一部分。用户可以通过Web或者移动设备进行访问,享受沃森基于自然语言的认知服务,商务人士还可以将其作为预测和可视化分析的工具。免费测试期间,有超过2000位用户报名参加。
Watson Analytics之外,沃森通过云平台输出的产品还包括Watson Discovery Advisor、Watson Explorer等,都是借助沃森的人工智能技术,帮助企业用户解决实际问题。
公开数据显示,目前沃森的客户已经达到数百位,领域覆盖金融、医疗、零售和日常生活等。在中国,沃森也有望进入更多的应用场景,苏中举例:
“比如老年人照料,中国已经进入老年社会,沃森可以成为医生的个人助手,针对每位老人提供辅助服务;针对知识工程师,沃森可以承担相对基础的工作,比如为记者拟好采访提纲,后期人工润色就可以……沃森可以为很多工作带来变化。”
机器人究竟会给我们带来怎样的未来?技术发展正在让一切变得更富想象空间。比如康奈尔大学机械制造实验室主任霍德·利普森认为,未来机器人可能会写社论、带孩子,甚至自己创造另外一个机器人。而早在2013年年底,谷歌就陆续买下了Boston Dynamics、maker of BigDog、WildCat等8家机器人公司,这也让外界对未来机器人多了一个期待的理由。
看来,可以确定的是,机器人进化的脚步是停不下来了。至于人类将来会成为这场进化的受益者还是受害者,就要取决于我们自己的进化能力了。