对人工智能现在和未来的思考

2021-04-10张文生

广西科学 2021年3期

张文生

(中国科学院自动化研究所)

1956年夏季，在美国达特茅斯(Dartmouth)大学，麦卡锡(McCarthy)和明斯基(Minsky)等人共同组织了用机器模拟人类智能问题的小型研讨会，其学术本质是探讨认知领域的复杂信息处理问题，并首次使用了“人工智能”这一术语[1]。人工智能已经走过了60多年的辉煌历程，期间最吸引人们眼球、引起轰动的就是不同时期的人机大战。纵观其起起伏伏的研究过程，新的研究结果不断出现，同时也有大量的研究成果被摒弃。我们不禁要反思这风风雨雨的60年，人工智能的本质是什么？哪些研究是永恒的主题？哪些研究成果至今还重要？哪些研究成果没有意义？基于此，本文将展望未来人工智能的研究热点和重点，特别是如何开展产业应用，让人工智能造福人类。

1 如火如荼的人工智能现状

自2015年以来，国内外人工智能产业呈现出如火如荼的景象，机器在搜索、计算、存储、优化等方面展现出人类无法比拟的优势，然而在感知、推理、归纳、学习等方面尚无法与人类相比[2]。

纵观人类发展的历史，必须给人工智能一个客观的认识，那就是：人工智能是“人造的智能”[3]，以物化的计算机系统为载体，用于“解脱或者辅助人类脑力劳动”。从人类四次工业革命200多年的过程中不难看出：生产力的发展、工业革命的发展以及社会进步的过程就是人类从体力劳动到脑力劳动中逐步解放的过程。第一、二次工业革命实现了“机械化”和“电气化”，通过制造各种工具/机器替代人进行繁重的体力劳动，将人从体力劳动中解放；第三次工业革命逐步实现了“自动化”，带来了生产效率的飞跃，逐步将人从脑力劳动中解放；第四次工业革命是实现“智能化”，将过去需要人类的脑力劳动才能解决的个性化、柔性生产和产品服务中的复杂问题[4]，通过人造的智能来实现，将人从脑力劳动中进一步解放。

人工智能的长期目标是建立达到人类智能水平的计算机系统，在人工智能学科和应用的发展过程中，设定的人造智能系统研发目标往往与人类智能对标。人工智能研究之初，对比的主要方式是机器与人玩游戏，从20世纪60年代人工智能在西洋跳棋上战胜人类选手，到1997年IBM“深蓝”计算机在国际象棋上战胜世界棋王卡斯帕罗夫，到2006年“浪潮天梭”超级计算机战胜五位中国象棋特级大师，再到2016年3月9-15日谷歌公司研发的人工智能围棋软件AlphaGo与韩国世界冠军李世石九段进行的围棋人机大战，最终AlphaGo围棋软件以总比分4∶1战胜人类代表李世石九段。

经过深入冷静的思考，容易发现：无论人工智能如何强大，比如在博弈游戏中不断地挑战人类，从结果来看这些都是在炫技，即炫耀人工智能阳春白雪的顶级成果，但并没有关注如何将人工智能研究的成果用于创造人类的物质财富，开展真正的实际应用。

人工智能真正造福人类，将人类从脑力劳动中解放，是从智能搜索、工业机器人和电子商务开始的[5]。第一个互联网搜索引擎是1990年在蒙特利尔麦吉尔大学创建的Archie，当时Archie浏览器仅是索引基于文件传输协议(FTP)的档案。真正意义上的智能搜索引擎诞生是随后以对搜索引擎服务进行升级优化为宗旨的Yahoo、Altavista、Inktomi、Google。这里对工业机器人和电子商务的应用不过多赘述，但值得注意的是，在这两个领域人工智能的成功应用完全改变了人工智能炫技的历史定位。

2011年IBM公司推出Watson认知计算系统，用来解决问答系统、医疗、金融、制造业中的复杂问题，使人工智能研究的关注点完全由“游戏娱乐”走向数以亿计寻常百姓的实际生活应用[6]。

目前，人工智能已经渗入到人类的日常生活中，并在逐步改变人类的生活模式[7]。以人类的“出行模式”为例，以人工智能为核心的自动汽车驾驶技术，正在将人类逐步从完全依靠脑力劳动实现驾驶汽车的任务中解放出来。2012年5月7日，内华达车管局为一辆改装版的“丰田普锐斯”型汽车颁发“001”号车牌，这是首辆获得车牌的自动驾驶汽车；2017年6月，130辆通用公司的新一代Bolt自动驾驶测试车正式下线，通用公司成为第一家可以实现自动驾驶测试车辆量产规模的车企，并计划在2021年开始尝试销售自动驾驶汽车；2018年2月，谷歌Waymo获得亚利桑那州交通部门许可，无人驾驶小型货车在亚利桑那州向乘客提供付费交通服务，后续将推出自动驾驶出租车叫车服务。

人工智能一直以来致力于用计算机模拟人类大脑解决问题，让人从脑力劳动中解放出来，让计算机看懂世界，目前已经诞生了谷歌大脑、百度大脑、讯飞超脑、阿里城市大脑等一系列互联网大脑。

谷歌大脑是Google X实验室的一个项目，通过将1.6万台电脑的处理器相连，建造出大型中枢网络系统，能够模拟人脑实现自主学习，有望成为人类社会首个真正意义上的人工智能系统。百度大脑是模拟人脑神经元组成的超大规模神经网络，拥有语音、图像、自然语言理解和用户画像四大核心能力。讯飞超脑模拟人脑神经元构建深度神经网络，旨在实现世界上第一个中文认知智能计算引擎。阿里城市大脑以阿里云弹性计算与大数据处理平台为基础，逐步实现城市海量多源数据的收集、实时处理与智能计算。

2 令人担忧的人工智能繁荣

尽管人工智能已经如火如荼，但是，从事人工智能研究的人为当前媒体过分宣传和民众对人工智能过高期许感到非常担忧。纵观人工智能60多年来“三起两落”的发展历程，我们发现每一次人工智能的热潮都源于长期的人工智能理论积累和关键技术突破，然而，每一次人工智能坠入低谷都是人类对人工智能的期望远远超出其理论和技术水平。

目前，国内外对人工智能炒作有过热的趋势，无论是学术界还是商业界，都低估了大数据时代新出现的认知问题的复杂性和难度，导致后续的技术研发无法支撑任务的推进[8]；与此同时，新技术往往意味着新的投资机会，乘机炒作、骗取资本在所难免，炒得越热，潜在的泡沫就越大。事实上，人工智能繁荣发展的表面之下，存在很多隐患和值得关注的问题，需要全社会科学地理解人工智能，正确地把握人工智能的本质，改正过去和现在对人工智能的片面认识。

2.1 人工智能是人造的智能

人工智能是旨在研究、开发、模拟、延伸、拓展人类的智能的理论、方法、技术与应用系统，可见人工智能就是人造的智能[9]。从智能机器人、无人系统发展的历程深入思考，我们可以认为：智能机器人等只是人工智能成果的一个实物展示，其核心集中在将人类研究出的智能用一种机器作为载体。除了机器人以外，有代表性的人工智能产品包括邮政分拣、文字识别、语音识别、多语种翻译、自动问答、车牌识别、视频智能监控、智能搜索、智能辅助驾驶等等，这些产品的智能水平/应用满意度或高或低，但是，人造的智能系统正在向我们走来。

从上述人工智能成果应用的案例中，我们发现：人类智能主要是从大脑结构和功能两个方向展开研究[10]，因此，研究产生智能载体的途径可以归结为两类：结构派和鸟飞派[11]。然而，人造的智能存在诸多难以逾越的局限，比如认知论机理的局限、智能物化方法与途径的局限、数学方法与工具的局限、计算模型方面的局限、实现技术和途径方面的局限等。

2.2 人造的智能可以精准定义

按照传统的说法，直到今天多数学者赞同“人类的智能”(简称智能、人类智能)难以说清楚，究其原因是无法将人类智能形式化、数学化，但是，人造的智能(简称人工智能)是完全可以形式化、数学化的。

2007年，Legg等[12]指出：人类提出过至少70种人类智能的定义，但是，至今还未有盖棺定论的说法。对“人类智能”定义及界定的模糊，使得度量“人类智能”变得困难。缺少“人类智能”的量化，导致我们无法精确地判断人类智能水平的高低，只能借助某些角度的局部特征来描述。

人工智能不同于人类智能，我们完全可以借助人工智能解决的“问题难易程度”来度量人造的智能高低。众所周知，从1956年夏季麦卡锡和明斯基等组织的用机器模拟人类智能问题的讨论会以来，人工智能公认是解决认知问题复杂信息处理的科学。认知领域复杂信息本质是非线性信息，而非线性信息的难易程度在数学上已经研究多年，积累了大量的研究成果，这些数学成果可以有效地度量非线性的大小[13]。例如：VC维(VC dimension)，可以从函数论/泛函角度衡量某个待研究问题集合的复杂程度；拉德马赫复杂度(Rademacher Complexities)可以结合函数论与随机科学来衡量某个待研究问题集合的数据分布的复杂程度。因此，我们完全可以借助数学上成熟的非线性理论来度量人工智能问题的复杂性，进而用于衡量人工智能的智能水平。

2.3 反馈是实现人工智能的绝招

“反馈”是人类智能的显著特征，是控制科学独到的特色，也是人工智能区别于计算机系统的显著标志。当一个人举杯喝咖啡时，他/她通过视觉反馈可以改变手拿杯的位置，从而更顺利地享受这一杯咖啡。同样，通过将听到的媒体信息或者感觉到的天气温度反馈给大脑，人可以调整穿衣。然而，计算机科学没有“反馈”这一标签，否则，计算机“死机”就不存在了。人工智能就是要把控制科学与计算机科学“混杂”，期待解决用机器(计算机)模拟人类智能的难题。

反馈的思想贯穿于控制理论的整个发展阶段。1943年，Rosenblueth等[14]发表了最早的控制论文章“Behaviour，purpose and teleology”，指出人的行动和目的是从神经系统出发进入肌肉，然后通过感觉再进入神经系统的环形反馈过程。随后一系列控制理论都以反馈作为基本理论，在现代控制理论、大系统控制与智能控制理论中，反馈思想得以扩展[15]。

2.4 必须让大数据说话

人工智能早期主要集中在设计各种简单的线性与非线性模型，但是，随着社会的发展，需要解决的认知问题逐渐复杂化，早期的理论和方法难以处理复杂的非线性问题。对于认知领域的复杂非线性问题，孤立的个体探寻其规律不足以建立可靠的模型，究其原因，在于个体获取的数据/信息不足以认识复杂非线性问题的本质，必须借助大数据，同时结合个体经验，才能解决复杂的人工智能问题。

一方面，大数据样本分布广泛，让机器学习模型很难过拟合，这种优势有助于在受限场景下取得超越人类的学习效果，比如语音识别、图像识别等达到或者超过了人类识别的水平；另一方面，大数据并非唾手可得，一些成本较高的领域数据极为稀少，即便有大数据也不一定能用，例如主观性较强的应用、信息采集的个体差异大且不具备独立同分布规律、优化目标不明或推理路线不清等。

大数据时代数据规模、质量等的改善，使得诸多机器学习算法的建模效果大幅提升，特别是在机器学习算法缺少良好建模方法的情况下，需要大量数据才能拟合[16]。如果直接断言大数据和机器学习的深度结合就可以创造出全能强大的人工智能，则会陷入一种过度依赖数据驱动的方向，换言之就是过度神化数据驱动可能导致方向性错误。

2.5 人工智能最适合用于制造业

从制造业生产线上采集的数据质量非常高，这些数据除了存在随机噪声以外，只有系统噪声，此外，这些数据几乎是以连续方式呈现的。对比从互联网上采集的数据，我们发现制造业数据的质量远远高于互联网数据，互联网上的数据经常存在伪装、突变。由于人工智能不擅长利用伪装、突变数据，因此从寻找制造业规律、减少操作人员脑力劳动、解决网络化制造等角度考虑，人工智能应用到这一领域是非常合适的，遗憾的是中国人工智能界和制造业企业家目前还没有充分认识到这一观点。

人工智能用于制造业能起到事半功倍的效果，工业制造是与国家生产力产出直接相关的行业，在国民经济中的作用举足轻重。美国Softweb Solutions公司首席策略官Vibhu Bhutani表示：建立完整智能制造系统的基础是单体机器可以为人工智能训练收集高质量的数据。制造业的数据有着非常良好的标准和质量积累，对于训练人工智能模型有很大的优势。制造业生产过程流程明确、任务清晰，而人工智能一旦成功应用于制造业，一些复杂脑力劳动完全有望借助机器来完成。例如，2017年，著名人工智能学者、前百度首席科学家Andrew Ng创建的LANDING.AI公司，其近期的机器视觉产品可以对工业产品的微小瑕疵进行超越人类肉眼水平的监测。

未来制造业的一个重要的发展方向是智能工业设备和人工的结合，实现网络化协同制造[17]。工业智能技术的升级并不意味着完全替代人类的作用，2017年麻省理工学院(MIT)和Rochester大学研究人员也正式提出了新的人机协同制造概念，通过简单的语言交互，人类可以即时控制机器完成非预先编程的动态任务。

水力旋流器入口设为速度入口，连续相介质为水，流速为3 m/s，设定颗粒入口处的射流源为面源，颗粒入口速度与液相入口速度相同，离散相密度为2 600 kg/m3，且颗粒粒径分布服从Rosin-Rammler分布[11]；溢流及底流出口均为压力出口，压力设置为0，设置溢流口为逃逸，底流口为捕集；压力-速度耦合方式为SIMPLE，压力离散格式为PRESTO。其他控制方程的离散格式均采用QUICK格式。设置重力加速度为9.81 m/s2。

2.6 对人工智能必须冷思考

尽管人工智能改变了很多领域的商业模式，但是，在“人工智能热”的背后，要进行深度的“冷思考”[18]。我们要清醒地认识到，人工智能并不是万能的。人工智能说到底是掌握在人类手里的技术，是否能够发挥人工智能的能力，取决于人对当前任务和问题的认识程度。

以人机围棋对弈等对抗游戏为例。围棋是一个回合制游戏，局面信息对双方公开，属于完全信息，并且玩家行为边界确定；而以星际争霸为代表的实时战略性游戏中，实时性、对抗性都更强，并且双方都不能完全掌握局面信息，玩家行为边界不确定。可以看到，虽然都是人机对抗，但是应用任务不同，背后的科学问题本质上也不同，一个是有限状态空间中的战术决策问题，另一个是无限状态空间中的战略决策和规划问题。所以，人工智能尽管很强，但是也不能解决所有问题，如果某个问题从理论上讲人工智能无法解决，那么就不要盲目试探[19]。

如何确定人工智能是否适合于当前的任务呢？从理论角度讲，这是可学习理论研究的范畴。明确了问题是否可学习之后，就需要从实践角度思考，如何实现学习？我们提出两个相辅相成的技术路径，一是需要对问题进行合理近似，二是需要发展人机共融的智能技术。

现实世界是非线性复杂系统，往往不能求得最优解，实践中为了得到较为满意的解决方案，需要对复杂系统线性化、离散化。对于求解仍然存在难度的问题，需要加入人类经验和决策，形成人在回路的增强智能。2017年，中国自动化学会成立混合智能专业委员会，在大会上郑南宁院士指出：“协作与认知”需要混合增强智能，解放人的创造力，发挥机器智能的计算力，相互弥补，共融共生[20]。

3 深入思考人工智能未来

纵观人工智能科学、技术和应用的发展历史，可以发现，人工智能从来不缺技术。我们有数不清，至少数以万计的机器学习、模式识别算法，也有不计其数的符号逻辑模型以及符号推理算法。同时，我们也发现：针对一个确定的认知问题，某种算法比较有效的情况下，很快其他大量的算法经过改造和革新，解决这类问题也非常有效。

那么，未来的人工智能究竟缺什么？个人认为，未来我国人工智能发展最值得我国政府关注的是基础理论、产业应用和商业模式。

3.1 引领未来发展的基石是人工智能基础理论

建议我国政府下大力气，投入重金解决符合行业需求的人工智能基础理论问题，实现定向人工智能理论的原始创新。值得注意的是，研究定向人工智能原创理论不需要人海战术，科学史上研究理论的历来是小而精且能做到深耕多年的少数人。

众所周知，“条条大路通罗马”，减轻人类脑力劳动负担的技术途径千差万别，既然人工智能是“人造的智能”，那么对同样一个减轻人类脑力劳动的具体任务，不同的“人工智能工匠”会造出不同的“智能的计算机系统”，这些“系统”会实现“异曲同工”的效果。技术是不断迭代优化的，过去的历史表明任何一种新的人工智能技术总是“各领风骚三五年”。哪怕是深度学习技术，其奇妙之处在于精细的特征提取，这是深度学习的底牌。但在同样的软件和硬件代价下，深度学习能达到的学习效果，其他多种机器学习方法都能达到同等效果；而其他机器学习方法解决不了的人工智能难题，深度学习也不能解决。

3.2 未来值得重点关注的人工智能产业应用

建议我国政府在公共服务、战略安全、国计民生等领域加大投入，强化人工智能产业应用。从国际人工智能的现状和理论技术可用的水平来看，以下5个方面的人工智能产业最有可能产生规模应用，在未来值得重点关注。

3.2.1 智慧医疗

我国作为新兴市场国家的领头羊，人工智能医疗始终保持高速发展态势。目前，我国智慧医疗发展历经计算智能阶段，正处于从感知智能向认知智能过渡的发展阶段，不同细分领域的技术发展情况和落地应用成熟度有所不同。AI医学影像是人工智能在医疗领域应用最为广泛的场景，率先落地、率先应用、率先实现商业化。手术机器人、药物研发、精准医疗等领域已有部分落地应用，但因成本或技术原因，尚未实现规模化普及，未来增长空间较大。受2020年初开始的新冠肺炎疫情影响，人工智能在公共卫生领域，特别是传染病的预防与控制方面发挥重要作用，传染病大数据分析预警系统、疫情排查系统、智能测温机器人、消毒机器人、语音服务机器人等在战“疫”一线被广泛应用。在这一领域，远程医疗、智慧健康、高端医疗设备应重点关注。

3.2.2 智能教育

目前，我国智慧教育尚处于起步发展阶段，截止2020年，中国38家人工智能教育领域的代表企业累计融资金额接近60亿美元。互联网的发展，催生了在线教育多种模式的应用落地，部分解决了教育资源分布不均匀问题，教育趋向于数字化、网络化和智能化。构建数字化的教学环境，旨在将已形成的巨量数字化信息结构化，通过区块链技术支撑的教育信息共享，可在有效整合教育资源的同时，实现跨平台、跨区域优质教育资源共享。此外，通过技术迭代、数据积累和知识图谱、模型算法的完善可以让教育数据流动起来、让教研“活”起来。在这一领域，交互/沉浸式课堂、远程教学应重点关注。

3.2.3 智慧金融

在技术创新的引领下，我国金融行业逐渐迈入智能化时代，智慧金融在证券、银行、保险、理财、支付等领域的实践有效地拓展了金融服务的覆盖面。我国的移动支付每年22万亿以上，是美国市场的20倍。但我国目前尚无完备的电子商务服务、集成平台以及健全的金融科技生态系统，虽然已初步形成涵盖金融基础设施、资本市场投融资、支付清结算体系，但金融科技生态圈智能化水平相对不足。建议重视智慧金融服务，对金融服务进行科技创新和流程再造，加速金融机构的数字化转型，同时对大数据、人工智能、区块链技术进行研究与应用，促进银行企业金融领域的业务创新和发展。在这一领域，金融漏洞挖掘、惠民金融、供应链金融应重点关注。

3.2.4 智能制造

2013年德国政府发布的《实施“工业4.0”战略建议书》中指出，智能制造时代是实体物理世界与虚拟网络世界融合的时代。以德国工业4.0为代表的智能制造技术凸显了人工智能在制造业的奇妙之处，正在颠覆传统制造的理念。智能制造作为制造业发展的方向，也是人工智能的一个重要应用领域，其核心是制造业基于数据分析的转型，用人工智能方法减少人的脑力劳动。目前国内在智能制造领域面临发展模式创新不足、技术能力尚未形成、融合新生态发展不足、核心技术/软件支撑能力薄弱等问题，相应的核心软件、技术标准、支撑平台以及智慧企业需要进一步完善并形成突破，应积极发挥人工智能在“三步走”实现制造强国战略目标中的引领作用。在这一领域，网络协同制造、智能工厂应重点关注。

3.2.5 智能交通

国内智能交通产业处于稳步增长阶段，在国家政策的支持下，随着5G等技术推动，智能硬件产业不断升级优化，智能网联汽车行业方兴未艾。目前，国家层面对智能交通的投入集中在新型车路协同基础设施上，如多模RSU基站和交通流感知设备等。需要指出的是，我国实时交通数据的融合和精确感知技术还不成熟，手机通信数据、停车数据、气象数据等都没有形成有效的大数据。自动驾驶或者辅助驾驶相关技术不够完善，行驶过程中不免因其他非智能汽车的干扰而造成危险。交通信息服务正逐步发展成众包模式，现有交通控制策略急需转变，对于交通系统运行状态安全状态辨识、应急响应与快速联动技术、交通状态的研判和主动安全保障技术仍需要进一步完善。在这一领域，智能路桩、自动驾驶应重点关注。

3.2.6 军事智能

人工智能是赋能增效性“技术群”，对武器装备、指挥控制及作战实验等的效能提升具有联动作用，军事链条中一个环节的增强往往会带来整体军事链条的升级。军事智能研究目前集中在传统监视、侦察、威胁评估、水雷战、网络安全、情报分析、指控、教育和训练等。在新型作战理论、智能作战样式、创新指挥控制方式、军事智能芯片、复杂对抗博弈环境下的军事智能等方面，目前的理论储备和技术发展较为薄弱。此外，在国际范围内人工智能深化应用的大背景下，逆向应用人工智能，辨识并抵御基于人工智能的恶意攻击、网络空间干扰等对捍卫国家战略安全意义重大。在这一领域，博弈对抗、反人工智能、智能武器应重点关注。

3.3 创造价值的关键是人工智能应用的商业模式

建议我国政府集中力量投入引导资金，解决人工智能未来产业化的商业模式问题，要创建或者强化国立研究“创造人工智能产业化的商业模式”的机构[22]。不应该只以中国有“BAT”为荣，要深入思考未来新的人工智能商业模式。通过政府和企业的结合，尽快培育出“中国的GE”“中国的西门子”“中国的IBM”“中国的Google”和“中国的ORACLE”等。