中国科学院院士、清华大学计算机系教授张钹:人工智能的现状与未来
2019-01-09袁玉凝
张钹 中国科学院院士、清华大学计算机系教授
在CERNET第二十五届学术年会开幕式上,中国科学院院士、清华大学计算机系张钹教授作了题为《人工智能的现状与未来》的报告。
人工智能的定义
人工智能最简练最直接的定义就是研究和设计智能体的技术,人工智能的设计既要重视理论也要重视实践。智能体包含三部分内容,一是物理空间的感知,包括视觉、听觉、触觉等;二是信息空间的思考决策,包括推理决策等,是一种深思熟虑的行为;三是物理空间的动作,包括移动、飞行等。
理性行为的计算模型和深度学习
人工智能模拟人类技能需要将人类的技能行为变成计算模式,但是建立这种计算机模型十分困难,原因就在于现在对人类的大脑知之甚少,对情感、创造等人类高级思维的特点了解的还不够多,在信息有限的基础上,人工智能机器很难模拟人类的思想和行为。事实上,在人工智能领域,关于人类的智能行为能否变成计算机模型一直存在争议。那么抛开人类的思考和情感方面,理性行为如何建立计算模型?人类的理性行为来自知识和经验,例如医生之所以成为医生,与普通人的区别在于医生拥有医疗知识和临床经验,其他工作也是如此。事实上,人类理性思考的过程包括两个步骤,一个是经验,另一个是对经验的推理,通过运用这个办法,就可以把人类的理性行为变成计算模型。目前,人工智能领域的标志性成果之一——IBM深蓝(国际象棋)就是根据这种逻辑建立起来的计算模型。下棋是理性行为,下棋双方需要进行计算分析,根据对方下棋情况做决策;人工智能通过对人类下象棋的行为进行分析和规律总结,通过参数建立决策行为的评估机制,最终计算机战胜了人类。下棋是一种完全信息博弈行为,通过这个案例可以看出,在完全信息博弈条件下,机器有可能战胜人类。人工智能领域第二个标志性成果是人机对话、人机问答;在人机对话的特定领域,机器同样可以战胜人类,比如说智力竞赛。计算机可以储存大量的知识包括百科全书、文学作品、新闻报道等等,而人类很难有如此强大的知识储备,2011年IBM人工智能计算机系统“沃森”在美国热门的电视智力问答节目中战胜了两位人类冠军选手。值得一提的是,网络的发展带来了专家知识和信息的集中呈现,这也推动了基于理性行为的人工智能发展。总而言之,理性行为人工智能是通过知识驱动的方法实现,计算机基于知识和经验的物理符号推理系统,建立基于规则的模型,从而实现符号主义AI。
感性行为不同于理性行为,它无法精确描述,也就很难采用符号模型,目前人工智能主要是数据驱动,通过深度学习、神经网络建立计算模型模拟感性行为。人工智能资源来自于知识和数据,这些知识和数据必须是完全信息、静态信息(或按照一定顺序变化),这样才能做到真正模拟或者战胜人类,然而人类生活中的日常问题并不具备充分的数据,因此只依靠深度学习很难到达真正的智能,通过数据驱动建立起来的系统只是一个机械的分类器,并不是感知系统。
自动驾驶主要是通过数据驱动的学习方法,学习不同场景下的图象分割,判别是车辆还是行人、道路等,基于此建立三维模型,在三维模型上规划行驶路径,但是自动驾驶并不能解决复杂路况下的行驶问题。
后深度学习时代
不少人认为深度学习已经走到尽头,基础研究和技术突破已经不重要,只需要数据就能出成果,这是完全错误的判断和引导,让大众误以为依靠深度学习就能解决一切。人工智能需要进入第三个时代,一个脑知识驱动和数据驱动结合起来的时代,以此克服在不完全信息博弈情况下的机器决策问题。
以自动驾驶为例,目前自动驾驶主要是通过数据驱动的学习方法,学习不同场景下的图象分割,判别是车辆、行人还是道路等,基于此建立三维模型,在三维模型上规划行驶路径,但是自动驾驶并不能解决复杂路况下的行驶问题。计算机可以通过数据驱动方法来训练并了解各种各样车辆和行人的行为,然而一旦遇到行人或者司机破坏交通规则的新情况,计算机决策就会失效。目前的人机对话领域同样如此,人机对话技术基本上停留在关键词检索水平上;人机对话的关键是解决机器与人的互相理解,而机器是根据概率统计了解事物,它类似于一个黑箱服务器,无法做到深层次的理解。后深度学习就是与脑科学结合,以知识加数据驱动,通过常识推理构建机器模型,以此来实现真正的智能决策。
人工智能的发展和应用
从科研方面来讲,人工智能中的所有算法、模型和思路都是外国人提出来的,人工智能的范围非常广泛,统计学习或深度学习只是一小部分,人工智能还有大量问题需要解决,中国的人工智能界对人工智能的理解还不深入,仍然把统计学习和深度学习看成人工智能的主要部分,国内跟国外的研究相比还有很大差距。在最近的一次国际学术交流会议上,机器学习占了1/3,大部分文章都是中国人发表的,因为该领域发展较为成熟;还有2/3是其他方面如知识推理和规划,五六十篇学术论文中只有一两篇是中国人发表的,然而这些才是需要突破的重要问题,以此也能看到国内与国外的差距。
从应用方面来讲,由于国内的数据和市场更大,国内与世界应用水平比较接近;但在技术特别是基础原始创新上,国内与国外仍有很大差距。目前国内的50家人工智能独角兽企业,主要集中在语音识别和图像识别两方面,图像识别里主要是人脸识别,也就是说人工智能的应用领域非常有限。在人工智能应用广泛的机械制造领域中,中国目前已经成为工业机器领域的第一大市场,然而国内目前还没有掌握关键技术,高档机器人以及中低档机器人的关键零部件依赖进口。人工智能机器人的产业化需要保证可靠且成本低,美国生产的达芬奇手术机器人,国内所有的大医院都有购买,但是成本过高;目前市场上有许多三代手术机器人,成本低却无法使用,这是人工智能产业化需要解决的问题。
中国目前的人工智能研究队伍仍在不断扩大,随着科技的发展,会有更多人投入进来,也会带动人工智能的新发展。