“未雨绸缪:语言与下一代人工智能博鳌论坛”综述
2019-03-05刘涛
人工智能自1956年被正式提出以来,在世界范围内经历了三次大的发展浪潮,目前已经进入新一代人工智能阶段,在许多领域都取得了突破性进展。与发达国家相比,我国在新一代人工智能研究中已具备较强的跟跑、并跑能力,并有望在某些应用领域发展起领跑能力。但目前新一代人工智能基础理论和应用领域的红利将在未来十余年基本上释放殆尽,很快会触碰到发展瓶颈,因为根据人工智能发展的规律,每隔十年或二十年就会出现不可预见的、引领整个发展的新因素。因此世界各国在发展新一代人工智能的同时都在抢占下一代人工智能发展的先机。
目前我国人工智能的战略布局仍然是在新一代人工智能的框架内进行,还是以既有的算法、大数据、算力为基础,而这“三大法宝”已有的原创工作和开创性的工作都是国外学者取得的;更重要的是,由于新一代人工智能与人脑工作机制方向不同,未来进一步发展的空间已难以有质的变化。因此,我国人工智能研究要从战略上由跟跑并跑走向领跑,除了开展新一代人工智能研究,还应尽早布局下一代人工智能发展,这也是确保习近平总书记在中央政治局第九次集体学习时所要求的我国“在人工智能发展方向和理论、方法、工具、系统等方面取得变革性、颠覆性突破,确保我国在人工智能这个重要领域的理论研究走在前面、关键核心技术占领制高点”的唯一路径。
在此背景下,2019年1月10日至12日,由江苏师范大学语言科学与艺术学院、江苏高校语言能力协同创新中心、江苏师范大学国家语委语言能力高等研究院、《语言科学》编辑部、《语言智库》编辑部和神经语言学研究会共同发起主办的“未雨绸缪:语言与下一代人工智能博鳌论坛”在海南博鳌召开。来自中国科学院、中国工程院、中国社会科学院、清华大学、北京大学、哈尔滨工业大学、国防科技大学、浙江大学、复旦大学、新疆大学、澳门大学、山西大学、北京外国语大学、北京语言大学、华东师范大学、南京师范大学、湖南师范大学、浙江师范大学、江苏师范大学、南京医科大学、浙江科技学院、西南大学、延边大学、教育部语言文字应用研究所等国内30余家高校和科研院所的70余名人工智能、计算机科学、语言学、神经科学、脑科学等领域的专家学者参加了此次盛会。国家自然科学基金委生命科学部张洪亮主任、江苏省教育厅科技处张兆臣处长、高等教育出版社文科事业部迟宝东主任、江苏省社科规划办李玉波副主任、江苏师范大学副校长钱进教授和张农教授、科研院院长刘莹教授等领导也受邀出席了会议。与会专家和嘉宾就当前人工智能存在的问题,下一代人工智能的发展方向,以及语言与语言脑机制研究在人工智能研究中的重要作用等问题进行了深入地交流、讨论,目的是在下一代人工智能到来之际,确保我们能够在人工智能领域实现变革性、颠覆性突破,特别是使人工智能基础理论研究走在前面。
1月11日上午,论坛在博鳌亚洲国际会议中心隆重开幕,教育部“长江学者”特聘教授、国家“万人计划”教学名师、江苏高校语言能力协同创新中心主任、神经语言学研究会理事长、江苏师范大学国家语委语言能力高等研究院院长、语言科学与艺术学院院长杨亦鸣教授主持开幕式。江苏师范大学副校长张农教授首先代表主办方致欢迎辞,认为此次会议对实现中国人工智能由跟跑、并跑到领跑的跨越式发展,将起到积极的重要的推动作用,并表示将一如既往的支持和推动语言及人工智能相关学科的发展和相关专业的人才培养。张洪亮主任代表国家自然科学基金委生命科学部致辞,鼓励神经科学、语言学、心理科学、脑科学、计算机科学等各类学科交叉融合,希望各个领域的专家能够凝练科学问题,以问题导向助力语言相关的人工智能的发展。江苏省教育厅科技处张兆臣处长致辞,对语言能力协同创新中心建设以来所取得的成绩予以了肯定,并对中心的下一步建设发展提出了建议。北京语言大学校长、教育部中文教指委副主任委员刘利教授在致辞中代表教育部中文教学指导委员会以及主任委员张福贵教授表态,鼓励高校拓宽人工智能专业教育内容,形成“人工智能+X”复合专业培养模式,支持江苏师范大学等高校探索“人工智能+语言学”复合人才的培养工作,培养兼具语言学、语言脑机制与人工智能基础理论、先进方法技术的复合型人才,为我国下一代人工智能研究培养合格的后备人才队伍。
大会共分为主旨演讲、交流发言和自由发言三个部分。主旨演讲分别由国家社科基金语言学科召集人、中国文字学会会长、清华大学黄德宽教授,北京外国语大学王克非教授,浙江大学教育部长江学者特聘教授王云路教授主持。中国科学院院士、清华大学张钹教授,江苏师范大学教育部长江学者特聘教授杨亦鸣教授,中文信息学会名誉理事长、哈尔滨工业大学原党委书记李生教授,北京大学教育部长江学者特聘教授、国家“万人计划”科技创新领军人才袁毓林教授,中国工程院院士、新疆大学吾守尔·斯拉木教授,中国工程院院士、“天河”超算项目总指挥、国防科技大学廖湘科教授依次作主旨演讲。
张钹院士对人工智能和自然语言的关系进行了深刻分析,指出人工智能的终极目标是使机器达到人类理解自然语言的水平。人工智能解决语言问题可以分成三个阶段,第一阶段是传统人工智能时代,基于语言规则来处理语言问题;第二阶段是概念统计学习时代,是应用深度学习处理自然语言,目前虽然取得了很好的处理效果,但深度学习本身具有不可解释性、鲁棒性低容易受噪音影响、依靠大数据等问题;目前是第三代人工智能,被称为后深度学习时代,在机器语言处理上需要解决可解释性、鲁棒性、可理解三大问题,最主要的办法是在深度学习的基础上加上大量的知识,这样才可能使机器理解和生成自然语言达到人类水平。
杨亦鸣教授指出,在人工智能研究领域,人们已经充分认识到人类智力、意识、思维的重要性,但是很少意识到这些都是以语言为基础的,人们对语言的认识只注意到在交流智力、意识、思维时需要运用到语言。语言是人类区别于动物的根本性特征。人类不仅具有形象思维,还有抽象思维和灵感思维,抽象思维以语言为载体,是人类独有的;具备语言能力的人类可以使用与动物一样的视像和音像的形象思维,也可以使用语言来表述形象思维,因此人类的形象思维也远超动物的形象思维;灵感思维是不期而至的创新思维方式,其要素仍包括抽象思维和形象思维。语言作为思维的物质载体参与了整个高级认知功能,以这种颠覆性的观点为基础重新考虑人工智能的基本理论,有可能为人工智能的发展提供新窗口,即在下一代人工智能基础理论研究中,应该突出语言脑机制的研究,加强探索语言脑机制“无人区”。从脑机制角度来看,当前在行为层面对语言机制的研究很丰富,在系统层面对语言相关的脑功能研究与灰质结构方面的研究也较多,语言相关的白质纤维结构基础则是一个新兴领域,而在细胞层面的语言机制研究几乎为零,在分子层面也局限于少量基因与语言障碍的关联研究,不仅各个层面的研究不平衡,当前更未建立从分子到行为对语言的整体解释。因此只有贯通分子到行为的语言机制解释,才可能对语言的脑机制有原创性的发现,为人工智能研究带来颠覆性的变革,并以此为基础重新思考、设计计算机软硬件,使得数学和物理驱动的计算机更新到在数学物理基础上、加入生命元素和语言机制驱动的计算机,从而产生真正的创新。杨教授还强调,要抢占“人工智能+语言学”复合型人才培养的先机,组建能在人工智能、语言学、脑科学、数学、计算机科学、物理学、生物学、心理学、社会学、法学等学科开展前沿交叉、在基础理论等方面有可能产生突破性进展的团队,培育出具有前瞻眼光、贯通语言学及语言脑机制与人工智能基础理论、先进方法技术的复合型人才。
李生教授指出,当前人工智能采用的受脑启发的深度学习算法在感知智能上已经取得了突破性成果,但其认知能力还十分有限,处于感知走向认知的临界点,因此人工智能的进一步发展必须逾越人类大脑思维能力和因果推理的鸿沟,否则真正的认知和通用人工智能难以实现。
袁毓林教授指出,人工智能必须理解自然语言的意义、能够进行常识推理,而通过对词汇知识进行深度挖掘来反映人的常识和语义,再跟计算机的视觉、知识图谱等技术结合起来,有望让人工智能达到一种可理解的、可解释的境界。
吾守尔·斯拉木院士强调,自然语言理解是混合智能的重要领域,使计算机能够具备理解自然语言的能力是认知计算的核心问题,其发展的关键是开展语言认知的脑机制研究。廖湘科院士认为,智能都是由软件来实现的,传统软件只是信息管理,今后的软件则感知多维信息,在感知的基础上要进行包含观察、判断、决策和行动的管理,因此软件是智能经济时代知识的载体。关于智能软件如何发展,廖院士认为,第一,经营生态链,掌控巨大市场的互联网+发展模式;第二,一定要关心并行计算、云计算等新技术;第三,大力加强协同创新和人才培养。
交流发言分为三个阶段,由中国科学院心理研究所原所长杨玉芳研究员,浙江师范大学原党委副书记张先亮教授,中国民族语言学会副会长、江苏师范大学江荻教授分别主持。在交流发言中,浙江省政务新媒体研究院院长、浙江科技学院原党委书记王建华教授认为,要解决人工智能语言理解困难,不仅要加入语言知识,还要考虑加入社会文化知识、情感因素等非语言知识。北京大学常宝宝副教授肯定了深度学习对机器自然语言处理的革命性贡献,但同时指出当前深度学习给自然语言处理带来的变化还只是量变而非质变,深度学习需要以数学和语言学为基础。江苏特聘教授、江苏师范大学人工智能产业研究院院长伍少远教授提出,针对汉语语言的生物信息处理算法及工具化开发可以作为人工智能与语言结合的下一个重点发展领域。《古汉语研究》副主编、湖南师范大学唐贤清教授认为,语言学工作应该主动适应人工智能的革命,同时自然语言处理所面临的问题也应该借助语言学来解决。南京师范大学计算机学院副院长曲维光教授指出,语言学在人工智能研究中具有不可替代的重要性,将语言跟计算机、认知相结合是未来人工智能发展的一个最重要环节。北京大学计算语言学研究所副所长穗志芳教授认为,人工智能从感知计算到认知计算的质的变化就是机器能够真正理解自然语言,并建议搭建多学科融合的平台、多领域联合攻关、协同创新开展人工智能研究。武汉大学教育部长江学者讲座教授、澳门大学徐杰教授认为,理解生物智能和生物语言的本质是促进人工智能发展的关键。南京师范大学张辉教授提出,应当在脑科学基础上,提出语言学或者脑科学的解释模型来弥合脑科学与人工智能之间的裂隙。国家优青、清华大学刘洋副教授认为,下一代人工智能应该在建模上给机器更多的自主性,在训练上让机器具备全面的感知能力,在推断上应该增强人对机器的可控性。南京师范大学文学院副院长梁丹丹教授结合个人的研究领域提出,语言学与人工智能的结合要以问题为导向,并要思考如何将语言学基础研究成果转化为可供机器学习的知识。江苏特聘教授、江苏师范大学朱祖德教授讨论了如何从语言脑机制的角度解决人工智能运算的基本问题。
自由发言阶段由江苏师范大学副校长钱进教授主持。清华大学黄德宽教授提出了如何在人工智能研究过程中解决好语言层面与历史文化层面的问题。浙江大学王云路教授建议归纳总结语言的共性并将之应用到人工智能领域。南京医科大学原副校长张竹繁教授希望借助此次会议实现学科交叉推进语言与下一代人工智能研究。北京外国语大学王克非教授认为,我国人工智能研究要做到“未雨绸缪”,就要有危机意识和预见性;在对语言充分理解的基础上将数据和智能结合起来才能推进机器翻译。华东师范大学胡范铸教授认为,角色身份的确定可能是未来人工智能需要关注的一个方面。复旦大学陈忠敏教授认为,布局下一代人工智能最重要的在于培养具有交叉学科背景的新型人才,重构未来人才培养的知识结构是实现跨领域合作的关键。高等教育出版社文科事业部迟宝东主任建议加快推动人工智能+语言学教材的更新,思考教材与数字技术的融合,关注创新人才的培养。中科院心理所杨玉芳研究员认为,作为人类认知系统核心的语言能力以及对其起支撑作用的认知系统的其他功能,在开展语言智能研究时都必须有所考虑。南京师范大学心理学院副院长陈庆荣教授谈及了语言加工与人工智能的关系。
在会议闭幕上,国家973计划项目首席科学家、清华大学计算机科学与技术系孙茂松教授作大会学术总结,分领域对与会专家的演讲和发言进行了精辟地解读:从计算机专家的角度看,人工智能经历了三个发展阶段,第一阶段符号为主,第二阶段大数据和深度学习为主,目前是第三阶段,是对第一阶段的螺旋性上升,要将大数据的学习能力与符号计算、推理、知识等相结合,才能迎接人工智能面临的挑战;从语言学家的角度看,很多工作已经比较深入地向计算机靠拢了,但还需要具有系统观。孙教授最后指出人工智能研究任重道远,目前的机器还不能像人一样处理自然语言,计算机科学家与语言学家要开展深入地合作交流。
此次会议在如何推进下一代人工智能的研究上达成了共识,与会专家一致认为,基于对人工智能发展中存在的一些问题,以及语言及其脑机制研究是下一代人工智能研究的突破口的分析,要努力在人工智能基础理论上取得变革性、颠覆性突破,建议设立语言与下一代人工智能研究国家科技重大专项,布局下一代人工智能发展,鼓励科学家在“无人区”做探索,为抢占下一代人工智能发展制高点打下基础;要开展面向下一代人工智能的语言脑机制基础原创研究,在此基础上重新思考、设计计算机软硬件,使计算机在数学和物理驱动的基础上,加入生命元素和语言机制驱动,真正实现对人脑的模拟;要设立“人工智能+语言学”相关专业,培养具有前瞻眼光、贯通语言学及语言脑机制与人工智能基础理论、先进方法技术的复合型人才,从根源上领跑人工智能。