人工智能成功的五要素及未来发展方向
2016-03-10
人工智能成功的五要素及未来发展方向
人工智能领域的领军人物,需过人工智能协会首位华人Fellow、第四范式首席科学家、香港科技大学计算机系主任杨强教授在论坛上提了这样一个问题:“现在像Google这样的公司是有人工智能的能力,一些大的银行和机构也开始做人工智能,我们平头老百姓什么时候也可以用起来人工智能呢?”
杨强表示:人工智能的范围很大,问题比较局限,问题的边界非常地清晰,比如说围棋是一个问题,金融是另外一个问题,无人车是下一个问题,这个问题的定义越清晰它的成功概率就越低。为此,他提出了人工智能要成功的5个条件。
人工智能成功的五要素
1.数据量需要有足够的积累。在2000年之后就有不同的网站开始收集人和人之间对弈的数据,经过10年的积累才收集了3000万盘的数据,5年前这种数据很显然是不够的。因此,人工智能并不是说对任何问题都是迎刃而解,马上立竿见影,而是需要有一定的数据积累的过程,也许我们今天看好的某个领域可能是医疗,也许从今天开始收数据,我们收获硕果的时候是10年以后。
2.边界清晰。这也是DIGMIND这样的公司首选做游戏的原因,在这个游戏之前做了很多单人的打飞船的游戏,这些游戏都可以从数学上来定义动作。
3.外部反馈。杨强表示:这个反馈就等于是老师在教我们,如果没有这些老师我们是不是可以学出来?现在有一些学者在研究非接入学习,这是不是可以成功?非常少。我们在诺亚方舟实验室的时候和吴文达的研究小组有一个沟通,他们非常希望在华为得到一些训练数据大家一起合作做一些语音方面的工作,他们的第一个问题是你的数据有没有标注,如果没有标注就完全不感兴趣,所以外部的反馈是非常重要的。
4.庞大的计算资源。杨强举例了AlphaGo所需要的计算资源:如果说李世石一天吃一个汉堡包,AlphaGo需要吃300个,换算成硬件来说就是大概用了300个CPU,普通大学的实验室有6个CPU已经非常不错了,这样一个“土豪型”的实验室的量是必不可少的。之后是顶级的数据科学家了。
5.深度学习。
这五个条件实际上都是门槛,就是说一般的老百姓、一般的公司甚至是大公司没有人工智能积累的公司,如果要进入人工智能取得这样的成功是不可能的。
人工智能的发展方向
未来的人工智能方向是怎样的?杨强表示可以从亮点去看:
1.“强化学习”。首先我们要知道延迟反馈这一概念,举个例子只能在一个学期到学期尾才知道我们期末模式考得好考得坏;在投资股票、在理财产品,过几天才知道这个投资是对还是错,这种现象被称为延迟反馈。得到延迟反馈的时候中间已经有了很多的步骤,我们不清楚哪个步骤是使得我们得到反馈的,因此我们要用到强化学习。
杨强:“说起强化学习我不得不提到Google去年在自然杂志上发表的一篇文章,横向是得到的分数,每一个栏是个人的游戏,这个是个人学习的系统,每一次打游戏学会,再一次再打输再学会是自学习的过程,中间的这条线是humanlevel,2015年5月份已经有一大半超过人类的水平,现在是所有的都超过人类的水平了,而且完全是自学习的,我们在实验室里面也实现了打乒乓的游戏,我们发现拿一个单一的GPU来算花了3天3夜的时间不断地打乒乓,最后可以达到日类的最高水平”。
所以说强化学习是一个在状态空间的搜索,在过去人工智能的研究中,错误地认为一些状态应该是由人来定义的,因此它就一直是止步不前,甚至是有几十年的功夫都没有很大的突破,最近两年通过Google和其他的研究者的研究,发现这些状态原来可以通过深度学习来定义,那么有了深度学习以后,强化学习里面的难题也就迎刃而解了,我们现在不在乎来定义这些状态我只需要来定义输入和输出,这个有一个特别的名词叫端到端的学习,也就是说我们只关心它的输入,比如说Google打游戏的只关心一个屏幕的截图作为输入,它的输出就是赢了为赢,就这么简单叫做端到端的学习。
2.迁移学习。迁移学习里是分两个领域的,假设我们有一个领域已经做得很好了,比如说我们学会了法语,那么我们再学一个新的语言如果说学英语的时候,我们会或多或少地利用法语,因为它们都是拉丁系。
假设现在我们有很多的穿戴式设备,比如说手表,我们希望通过穿戴式数据来知道这个人做什么,比如说是在开车、跑步还是在睡觉还是在听讲,但这样标注数据是非常少的,怎么办呢?我们可以到虚拟世界找更多的数据,比如说微博和微信,我们发现里面有很多大家谈论的行为的数据和地点的数据,我们把这两个数据加关联,我们有大量的虚拟世界的模型迁移到现实世界,就可以有更好的模型来告诉我们这个人到底在做什么,可以帮助穿戴式的硬件公司做一个行为模型。
强化学习加上迁移学习,实际上还可以做另外一件事,除了能够把小数据也用起来,还可以实现个性化。
总之,我们按照现在的方式走下去只是AIFORSOMEONE,我们希望能够达到AIFOREVERYONE,因此我们能够个性化的情况下,让中小公司和非人工智能的公司用起来的话,一定要在技术上努力,包括我们现在推的“先知”平台,包括我们用的迁移学习。
(出自:第一财经)