构建基于模拟的世界观:图灵原理回望
2022-01-15吴俊杰
吴俊杰
编者按:在过去的2021年,身处科技圈的我们,总会多多少少听到“元宇宙”这个词,它是一个庞大的商业计划,但也是一个简单的哲学命题:我们是否可以复制或者超越真实的世界。回望计算机发展史,英国计算机科学家图灵做了一个重要的工作,就是提出了一个假设,相信存在一台抽象的通用计算机可以模拟任何物理过程,这个假设被多次印证之后,被称作是图灵原理。当我们将物理过程推广到生命过程或者智能行为的时候,狭义的图灵原理就被推广到广义的层面,我们可以称其为广义的图灵原理。
本年度的信息技术实验栏目的选题,仍然关注信息技术实验教学、人工智能、基于数据素养的跨学科学习等之前一直受推动和关注的领域,但是我们希望用“真实数据—模拟—仿真数据”这样一个相对统一的过程,最后通过对“真实数据”和“仿真数据”判定的不可区分性来验证图灵原理在狭义和广义层面上的正确性。这可以看作是一种计算机科学的“溯源”,也可以作为信息科技核心素养的另一种表达方式。
相对于图灵测试,很多人对图灵原理更加陌生。图灵原理来自“通用图灵机”,认为存在一种通用的机器,可以运行任意的指令,这些指令可以计算物理问题。二战期间,在处理计算导弹弹道和破译密码这两类不同问题的时候,都可以用同一个计算机来完成,也就是说现代计算机就是一种“通用图灵机”。而对于通用图灵机能够解决的问题,图灵做了大胆的假设,即所有的物理问题都可以用计算机模拟。只要在一定的精度范围内,在人从感官获得数据的层面上,就很难区分真实的过程和虚拟的过程。狭义的图灵原理将物理问题、生命问题和智能问题区分开来,只研究“物质世界”的问题,广义的图灵原理则认为生命和智能现象也是物理问题,也可以进行模拟和仿真。因此,广义图灵原理可以被定义为所有的物理现象、生命现象和智能问题都可以用计算机来仿真,其模拟的数据和真实的数据在统计可接受的范围内不可区分,并且其精度将不断提高。
从图灵原理的角度来看图灵测试,可以得到图灵在设计实验背后的思想来源。图灵测试被表述为“将人与机器隔开,前者通过一些装置(如键盘)向后者随意提问。多次问答后,如果有超过30%的人不能确定被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人类智能”。这个实验设计的第一个要点是给定了一个统计上可接受的误差范围,就是30%,这相当于给定了一个误差的范围,这个范围并不算严苛,以至于图灵曾经乐观地估计在20世纪末就应该有计算机通过该测试。这个实验设计的第二个要点是关于数据的类型,图灵选择了单纯的“文字”,而不是包含更多信息的录音和影像资料,这说明任何模拟在趋近于真实的过程中,都需要设定数据的类型,相当于确定在哪个层面上“不可区分”。
模拟一词,代表着计算机科学发展的终极需求,它能解释万物包括人们自身,同时也动了着计算机技术的不断进步,如:语音层面上的图灵测试,推动了语音识别、语音合成技术的进步;影像层面的图灵测试,推动着机器人技术、计算机图形学、虚拟现实以及现在的元宇宙技术的发展。
从現在主流的科学观念来看,是不存在“原理”一词的,这种观念认为,科学是一种“可证伪”的思考方式,科学来自猜想的“假设”,这些假设可以被实验数据验证,成为“定律”,也可以被后来更精确的实验推翻,而形成新的“定律”。当构建一个类似欧式几何的理论体系的时候,那些只能被承认而无法被验证的基础性假设被称为“公理”,而基于公理推论出来的一系列结论被称为“定理”。所以,“原理”一词在这种科学观念下是没有位置的,甚至有些人会认为“原理”是一种神学概念而非科学概念。但是也有例外,如物理学上的“阿基米德原理”,如今人们仍然在使用这个词汇,而不是将其称作是基于浮力实验数据而得出的一个叫“浮力定律”的规律。其原因是基于下面两点考虑:一是这个定律提出得比较早,经过几千年的实践验证,并没有发现错误,因此有上升为“原理”的价值;二是为了纪念阿基米德在人类科学史上的贡献,因此称其为“阿基米德原理”。而图灵原理提出的时间比较短,将其称作是图灵猜想或者图灵定律似乎更加合适。但是计算机科学的出现,带领人类走向了“指数化”发展的爆发时代,无数的基于计算机仿真的科学计算,都能够证明图灵的假设的正确性,加上图灵在计算机发展史上有其独特的贡献,因此,图灵原理被称作“原理”,还是有其合理性的。
图灵原理是联系计算机科学与其他科学的一座桥梁,通常人们把认识世界的过程理解为归纳和演绎两种方法,分别对应“猜想—定律”模式和“公理—定理”模式,这两种模式都着力于构建一种描述真实世界某个侧面的模型。而图灵原理对一系列具体问题的应用和实验验证的过程,给了人们从计算机的角度来认识客观世界的一种通用的方法,称之为图灵原理验证实验的四个步骤:
①建模:从真实的现象中尽可能多地获取“真实数据”,对数据进行统计,进行猜想的验证,生成理论模型。
②仿真:应用理论模型,在计算机上还原真实现象中的数据或者现象,生成“仿真数据”。
③验证:确定真实数据和仿真数据在验证图灵原理的时候所采用的数据类型和实验精度,确定是否仿真数据和真实数据在什么程度上不可区分,验证“仿真数据”等同于“真实数据”。
④修正:尝试新的方法,改进“建模—仿真”过程中的技术精度和算力水平,使其在更大程度上趋近于图灵原理的理想状态。
图灵原理验证实验是一个通用的实验设计框架,其对信息技术教学设计给出了一种新的教学思路。我们可以将任何的自然科学和社会科学的研究成果和过程,作为信息技术教学的教学资源,从数据的角度重新做一遍,建模和仿真两个步骤则可以合成一个词汇“模拟”,其中的“模”代表建模的过程,“拟”代表仿真的阶段,“真实数据—模拟—仿真数据”的过程提供了一个新的世界观,信息技术不再只是一种工具,而是编程的一种信念,我们需要将现实世界“搬运”到虚拟世界,并不断构建和修正它,使其尽可能地接近现实世界。在“元宇宙”的时代,这种修正行为除了发生在真实世界和虚拟世界之间,在虚拟世界内部还存在着无数次的“棋盘推演”一类的修正行为,这种快速迭代的“智能行为”,将会成为人类社会指数化发展的新动力(如上图)。同时,一个充分修改和验证后的虚拟世界,也会反作用于真实世界,并提供低成本的优化方案,就像通过在线协作文档反复修改电子版文件最后被印成了一本书的过程一样,在虚拟化环境下的协作、交流、宣传都会对这本书的实体价值产生重要影响,况且虚拟文件本身也有其特有的价值,这都是人类萃取其智慧,促进文明发展的过程,也是一种更加理想的“虚实融合”的创客教育的实现方式。这种“基于模拟的世界观”,可以成为信息科技教学在下一个发展阶段具有“超学科”育人价值的一个抓手。
在信息技术实验的框架下,科学探究特别是“数码探究”主要是完成建模的过程,而编程以及可视化的过程则侧重于仿真,为了完成验证的步骤,我们仍然需要通过仿真获取数据,并且不断提高实验的精度。在充分认识真实世界的基础上,还可以在虚拟世界中更广范围和更极端条件下对真实世界可能出现的各种情况进行测试,从而创造一个更为可持续发展的现实环境。
在这个大背景下,“虚拟人”“强人工智能”“数字永生”这些阿兰·图灵先生思想轨迹所涉及或者在其延长线上的里程碑意义的符号节点将一一被实现,或许探索并普及“基于模拟的世界观”,是在元宇宙时代各种“唬人”的噱头之外,构建一种合理的、充满创造的世界所必备的公民知识底色。这个过程从漫长的人类思想史中浮现出来,从纷繁复杂的技术发展过程中提炼出来。当下,站在“元宇宙”的门口,回顾并且总结“图灵原理”,能让我们更深切地理解未来应该是什么,以及作为一个信息技术教师应该怎样看待课程内容和自身工作的教育价值,进而举一反三,创造性地开展工作。