周宏仁:“人类不可能瞬间无处不在但软件可以”
2023-03-09信息化百人会
编者按
信息化百人会顾问、原国家信息化专家咨询委员会常务副主任周宏仁在2022年下一代DNS发展论坛上作了题为《智能技术与智能革命》的演讲。他指出,计算科学和人工智能是新科学革命“一硬一软”的两辆马车,将在发展中不断相互渗透和融合,从而产生科学研究的新范式。计算科学正在改造包括物理学、化学等在内的传统学科。科学家必须责无旁贷地研究怎样利用计算科学和人工智能加快本学科的数字转型,推动全社会的科学革命。本文根据其演讲内容整理。
智能化发展推动专用计算走向前台
1946年第一台电子计算机发明以后,通用计算机一直统治着信息化的整体进程。但2010年前后发生的两次重大技术变革——智能手机的发明和4G技术的普及、应用,促使计算、网络、软件、数据无处不在,为后续的智能化发展提供了基础性支撑,同时带来重大产业变革。
2016年第四季度出现了一个重要转折点,智能手机的销量超过平板电脑,桌面电脑和移动电话的销量比约为4∶6,且差距逐步扩大。
芯片产业随之发生巨变。随着信息化向高端化、智能化发展,通用处理器技术越来越无法满足市场和应用的需求。伴随处理器技术走向5纳米、3纳米甚至1纳米,制造成本急剧增加,融资困难度加大,带来未来收益的不确定性,对产业界造成冲击,从而形成“摩尔第二定律”,即芯片厂的成本每四年翻一番。通用芯片的发展愈加困难。
核心芯片技术面临下一轮变革。目前,芯片的最大需求在物联网。随着物联网向全联网发展,芯片的需求也越来越大。未来25~30年,信息化将聚焦于智能技术的竞争,作为通用技术的计算机处理芯片,也将发生重大变革。其实这种变革已经发生,就是通用处理器技术(CPU)转向以满足智能化和智能技术需求为主的专用处理器技术(GPU+)。
当然,通用芯片还有发展空间。一方面,提高芯片性能的途径很多,例如多核芯片、三维芯片以及各种算法增强技术等,而且通用计算机将不断吸纳、更新、利用人工智能和智能技术的发展成果,使其功能更广、性能更高,比如翻译、语音、图像处理等技术在台式机和平板电脑中已经日渐普及。
无论如何,通用计算机的市场大局已定,市场或将继续萎缩,出货量有可能继续小幅度减少。但是,通用计算机有其不可替代的需求和功能。重要的是,如何应对计算机趋向“专用计算”发展的新方向。
与通用计算技术不同,影响和推动“专用计算”发展的引擎已经不是传统处理器技术或计算机技术本身,而是与推动智能化发展的各种“专用技术”密切相关。
必须认识到,是“专用技术”特定的模型、算法、软件等,催生了特定的“专用计算”功能需求,进而指导“专用芯片”的设计。这种“专用技术”,并非产生于软件技术,而是科学数字化革命的结果,是包括人工智能在内的智能技术发展的结果,是计算科学与各传统科学或学科融合发展的结果。
计算科学与不同学科的融合,正在驱动科学的数字革命
计算科学(Computational Science)与计算机科学(Computer Science)只有一字之差,却是内涵完全不同的两个概念。
计算科学是一种融合性的科学,因为它包含三类不同元素的“融合”。
第一类元素是建模、算法与模拟软件。需要注意的是,这里不是指通用的模型、算法与软件,而是针对特定科学(如生物学、物理学、社会学等)、工程以及人文科学中需要解决的各种问题的模型、算法与软件。
第二类元素是计算机与信息科学。目的是利用计算机与信息科学的成果,发展和优化各种特定的系统硬件、软件、网络及数据管理等要素,以解决计算中需要解决的各种问题。
第三类元素是计算的基础设施,即完成各种科学和工程领域计算的计算机系统和网络。
显然,在这三类元素中,第二和第三类可以被看作与信息(计算机和网络)科学和技术成果密切相关。唯独第一类元素,与特定的学科或工程问题有非常强的相关性和针对性,并不属于信息科学与技术范畴,是计算科学的真正“内核”。
因此,计算科学基于信息科学而发展,但绝不等同于信息科学。特别学科和工程领域的建模,需要对相关的科学或物理系统有非常深刻的认识和理解,要有丰富的知识和经验,这是计算科学真正的难点。
计算科学与不同学科的融合,正在驱动科学的数字革命和数字转型,形成许多新兴的分支学科,即融合学科,如计算物理学、计算化学、计算金融学、计算考古学、计算法律学等。几乎任何一门学科前都可以加上“计算”二字,但内容和方法却发生了重大变化。计算科学正在改造传统科学或学科,包括物理学、化学都有几百年的历史,但一定会被计算科学所改造。
2021年10月5日,瑞典皇家科学院宣布将诺贝尔物理学奖授予三名科学家。其中,有两名科学家——真锅淑郎和克劳斯·哈塞尔曼,因“对地球气候进行物理建模,量化可变性,并可靠地预测了全球变暖”而获奖。这就是融合科学推动物理学发展的典型案例。
2013年10月9日,瑞典皇家科学院将诺贝尔化学奖授予美国科学家马丁·卡普拉斯、迈克尔·莱维特、阿里耶·瓦谢勒,以表彰他们“在开发多尺度复杂化学系统模型方面所做的贡献”。在20世纪70年代,这三位科学家设计的这种多尺度模型让传统的化学实验走上了信息化的快车道。
这些科学家的研究都始于20世纪的六七十年代,那时计算机已经获得广泛应用。他们是走在时代前沿的科学家,直到21世纪一二十年代,他们的成就终于为世人所认识,从而获得诺贝尔奖殊荣。
智能技术正在引起新的科学革命
人工智能的现代发展和人类进入智能化时代的标志性事件,是2016年3月阿尔法围棋(AlphaGo)对弈韩国专业九段棋手李世石,并以4∶1的压倒性优势取得胜利。这个具有里程碑意义的事件,震撼了全球。
中国围棋是一种充满智慧的、复杂的二人博弈系统。据研究,围棋总共有32940种不同的棋路,其中992种被视为较为常见的抢手棋。据估算,变幻莫测的棋局有10172 种不同的最终结果和10768种不同的走法。两位高手对弈,通常在150手之内决定胜负。其间,每一手棋大约有250种不同的选择。显然,围棋博弈是一个非常复杂的物理系统,要构造一个下围棋的深度学习网络,不是一般软件人员能够完成的任务,涉及很多的数学问题。
围绕人工智能的未来发展,大约可分为初级和高级两类。
现在我们看到的所有人工智能成果,基本停留在跟机器学习相当的初级水平上,而高级水平的人工智能如人脑模拟、类脑运算等,可能还需要几十年的发展。
人工智能也可分为应用人工智能和通用人工智能。应用人工智能,也被称为弱人工智能或者窄人工智能。2012年到2013年进行过数次民调,征求业内专家对人工智能未来发展的意见,涉及“何时可以实现通用人工智能”的问题,最乐观的估计是2040年到2050年之间,而专家意见的平均值是2081年,也有16.5%的专家(以90%的自信)认为“永无可能”。
2022年6月,德国科学家布莱恩·麦克马洪发表《人工智能正在引领一场新的科学革命》一文,仔细梳理了基于深度学习算法的人工智能,并基于2020年Google人工智能团队解决的蛋白质折叠问题(AlphaFold),全面分析了人工智能对当代科学革命的影响。主要可以概括为五个方面:快速阅读科学文献、处理海量数据、提升仪器效能、辅助科学实验、辅助建模等。
现在互联网上查询文献涉及如何将数据变成信息、将信息变成知识、再将知识贡献给读者,这是很多人很多年努力的方向。据统计,2021年关于新冠病毒的文献一共有18万份,没有一个学者能够看得全,但Google的算法可以全部读一遍,完成主要趋势的分析、代表性观点文献的整理等;可以利用人工智能技术处理海量数据,提升科学仪器效能,特别是一些重大的科学仪器,并帮助科学家进行实验和辅助建模。在此基础上,麦克马洪认为,人工智能正在引起一场科学革命。
这就涉及一个问题,科学家本身需要数字转型,因为人工智能最后的建模一定是由科学家完成的。如果科学家不懂计算机、不懂网络,想要推动科学的数字化革命就非常困难。
21世纪上半叶的这场科学革命的核心和主角是科学家,不是IT工程师,也不是AI工程师。科学家必须责无旁贷地研究怎样利用计算科学和人工智能加快本学科的数字转型,推动全社会的科学革命。
我感觉,当代科学革命最主要的社会阻力,来自科学家本身,因为多数科学家并不认为数字化属于科学范畴,反而认为融合科学不是正统科学。这种观点是完全错误的,从上面列举的几个诺贝尔奖获奖者可以看出,国际社会对此并不苟同。
“重硬轻软”的倾向不能再持续下去
智能技术可以定义为利用计算科学和人工智能拓展和增强人类智力的技术,涵盖模型、算法、软件和数据,缺一不可。
智能技术的科学基础主要包括两个方面。
一个是计算科学,通常是科学家根据针对各种问题的科学知识和理解以及现有的成果,建立模型(人工建模),然后设计算法,进行仿真模拟,再不断修正、完善,最终得出想要的结果。计算科学是基于现有科学或学科的理论和实践成果构造模型,看似科学性更强,但在很多复杂的大系统场景下,实践难度很大。
另一个是人工智能,主要依赖于统计建模。统计建模是以科学家的认识和判断为基础,充分利用网络空间和科学实验中丰富的大数据,构造关于研究对象的统计模型。这种模型,大多不具有科学建模的原理性和精准性,只是追求统计意义上最终结果的近似性和可接受性。利用大数据和深度学习算法的不断逼近,通过试错和调整而不断完善所收获的结果,直到满意为止。
人工智能通过大量的数据来训练模型。数据质量越高,模型的有效性和准确度就越高。充分利用现有的超算功能,有可能以更短时间、更高效率,揭示很多超巨系统复杂的内在规律。本质上,在计算科学力有不逮的地方,融合科学也完全可能利用人工智能的成果求得发展,并成为智能技术的科学基础。这一点至关重要。
1956年,模糊集之父拉特飞·扎德提出模糊集的数据概念。他认为,人类擅长“软”思维,而计算机通常是“硬”思维。在“硬”计算中,电子计算机需要确定性和精度,否则,计算结果就无法接受。或者说,硬计算不接受“模糊”。与硬计算不同,软计算处理技术因为比较“宽容”,不那么“较真”,可以容忍不精确性、不确定性,接受部分的真实性和近似值,因此比较容易实现可计算性、鲁棒性和低求解成本等。
这一点,在现实生活中可能非常有用,也会催生很多新的学术领域。正因为如此,软计算构成了大量机器学习技术的理论基础。
就智能技术的两个科学基础而言,计算科学属于“硬计算”类,而人工智能则属于“软计算”类。计算科学和人工智能是新科学革命“一硬一软”的两辆马车,将在发展中不断相互渗透和融合,从而产生科学研究的新范式。这一点对未来发展至关重要。本质上,智能革命就是一场科学革命,没有科学革命,就不可能有智能革命。
我们需要完成的最大转变,就是重视软件的科学属性,不要以为软件就是软件人员写出来的。过去70多年的发展是“软件为计算服务”,未来智能化的发展则是“计算为软件服务”——“我设计什么软件,你帮我用芯片做出来”。这是一个重大变革。
软件会驾驶科学与工程两辆“马车”逐渐走向科学技术舞台的中央。“重硬轻软”的倾向,不能再持续下去。
最后,引用美国《人工智能国家安全委员会最终报告》(2021年)中的一句话:“最优秀的人类战士也无法抵御以超音速飞行、由人工智能跨地域组织、每秒机动数千次的多台作战装备。人类不可能瞬间无处不在,但软件可以。”