APP下载

从复杂科学视角,追问生命是什么

2024-08-12张江

天涯 2024年4期

什么是生命

生命是什么?这个问题大家可能都思考过。这个问题可以说是“灵魂拷问”,不仅仅是针对每一个生命体都非常重要,它也直接促成了生命科学,特别是引发物理学家、计算机学家、数学家对生命大问题联合的拷问。

最早提出这个问题的人是薛定谔,他是一个典型的物理学家。在他撰写的书《生命是什么?——活细胞的物理观》里把这个问题摆在物理学家和数学家面前,这激励着大量绝顶聪明的人士开始思考这一问题。

当年薛定谔的洞察最重要的是两点:

第一点,生命体一个非常重要的特征就是要保持新陈代谢。新陈代谢是指生命体通过摄取和转化能量、物质来维持自身的生存及功能。从物理的角度来说,新陈代谢实际上是在摄取负熵流,即通过消耗外界的能量来抵抗内部的无序增加,从而维持系统的有序状态。

第二点,生命体要完成自复制。自复制是指生命体能够通过自身的结构和功能产生新的个体。从物理的角度来说,这一过程需要一种准晶体结构来实现,这也就促成了后来DNA双螺旋结构的发现。DNA的双螺旋结构不仅解释了遗传信息的存储和传递机制,还揭示了生命体如何通过自复制来延续自身。

不过,从第一点来说,新陈代谢实际上并没有得到一个像DNA双螺旋结构那样普适的理论。因此,我们的讨论可以从“生命体如何维持一个稳定的结构”这一问题展开。

这就牵扯到一个所谓的个体之迷的问题:当我们看到一只小虫子在地上爬——动动腿就能爬。这样一只虫子和屏幕上动来动去的光标有一个非常本质的不同。因为这只小虫子有一个自我,这只虫子为了达成自我吃食的目的,会主动在环境里向食物蠕动。

这样一种有自我意识的生命主体是怎样起源的?这就是我们所说的个体之迷。

个体之谜的四种解释

这个谜团跟所谓自我涌现其实是紧密不可分的,这也是该问题归属于复杂性科学的重要原因。因为复杂性科学就是要回答涌现从何而来。所以我们就要试图回答,自我这个概念是如何自下而上涌现出来的。

除了传统的生物学视角以外,我们可以从建模的视角去回答这个个体之谜。具体而言又分为了四个方向:图灵机、自创生与自催化、个体信息论、涌现层次问题。

第一是个体之谜的回答,其实可以追溯到图灵机模型。当然,图灵机模型可以回答一部分问题,但是有更多的问题无法回答。

后来就有了圣塔菲学派的斯图亚特·考夫曼,以及马图拉纳和瓦雷拉这两个智利的生物学家,他们开始从另一个角度去考虑主体是如何自下而上涌现出的这种自创生、自催化的组织的。自创生、自催化这个方向走到后期,就会发现研究不得不再次停滞不前。因为自创生、自催化这些组织很神奇,它们是涌现出来的。但是,它们的一个缺点,是很难界定个体的边界。

新的方向是,如何针对这样一种组织,如何通过数学的方式去定量刻画。这也就是个体信息论。

最后,生命是一个多层次的复杂系统。一个层次的生命涌现后并不会停止,存在多层次的涌现,这也是对未来研究的展望。

图灵机:最早的个体模型

说回图灵机模型,1937年图灵就发表了论文《论可计算数及其在判断问题上的应用》,这篇论文直接提出了图灵机模型,它是一个超级简单的冯·诺伊曼的计算机。今天的计算机能做的事图灵机都能做。图灵机如何运作?其实它的元件非常简单,就是一条长长的纸带,这有一个读写头,会根据一个固定的规则表和字母表,在纸带上划来划去,同时也可以改写纸上的内容。图灵机的操作超级简单,但是表现可以非常复杂。通过简单地设置图灵机规则表,就可以让它去近似模拟一些简单的生命体行为。

朗顿的蚂蚁是一个著名的图灵机模型。

这个图灵机是一个二维的方格世界里面游走的蚂蚁。它遵循两条规则:第一,如果遇到当前格子为白,右旋转90°,把格子涂黑,往前移动一个格子。第二,如果遇到当前格子为黑,左旋转90°,把格子涂白,往前移动一个格子。就这么两条简单的规则,它可以绘制出来非常复杂的行为和图形。以此类推,我们可以通过添加简单的规则,利用图灵机去模拟生命现象。

图灵机的优点就是其通用计算能力。这意味着图灵机可以模拟任何其他计算模型,包括现代的人工智能系统,如AlphaZero。只要一个模型是可计算的,我们就可以说它和图灵机是等价的。这一理论被称之为邱奇—图灵猜想,即任何可以被计算的函数都可以由图灵机来计算。这一理论的重要性在于它奠定了计算机科学的基础,使我们能够理解和设计各种计算系统。

当然图灵机也有缺点,首先最大的瓶颈就是,它是一个串行化的模型。因为我们知道它是一只蚂蚁,蚂蚁就相当于一个读写头,这个读写头只能够串行在纸带上走来走去。实际上我们人体是由一堆细胞构成的,每一个细胞都可以看成是一个图灵机,这些细胞都是在并行操作,不是串行。

第二个缺点是具身性问题。图灵机忽略了所有细胞接触到的信息,直接把我们大脑的认知系统看成一个串行单体。只对这个单体来建模,而忽略了身体每一个毛孔都是跟外界进行物质能量信息的交换。这部分输入进来的信息被图灵机舍弃了。因此,它实际上是一个裸大脑的图灵机,不具备所谓的身体。至于是不是能这样抽象,这个要做进一步的讨论了。

第三个缺点是图灵机这样一个个体,它是如何起源的。前文提到的蚂蚁模型或者更复杂的图灵机,都是人类制定规则创造出来的。现实生命中却没有一个上帝创造者,而是一个自发起源的过程。一个图灵机模型是如何去起源的,这个问题没有得到回答。

生命的起源:自创生、自催化

新的研究角度就是科学家开始思考,一个类似于原始细胞的生命个体是如何自下而上的,而且是大量个体互相作用并行化的。从而形成一个组织,而这个组织又是可以被看成是具有自我的主体。

这个问题其实更大,它直接牵扯到了生命起源问题。

生命的起源不是一个单一的过程,而是由若干个阶段组成。首先是化学物质的起源,即简单有机分子的形成,这些分子是生命的基本构建块。接下来是前化学进化阶段,在这个阶段,这些简单分子通过化学反应形成了更复杂的分子和聚合物。然后是细胞的起源阶段,这些复杂分子进一步组装成具有自我复制和新陈代谢功能的原始细胞。这些阶段相互联系,共同构成了生命起源的完整过程。

研究者的关注点在于,假设化学物质已经存在了,那么它如何去构成一个完整的细胞?这也是一个单个的细胞生命体是如何起源问题。对这个现象进行研究的一个最知名的理论,就是所谓的自创生理论,它是由智利的两名生物学家马图拉纳和瓦雷拉在1970年代提出的。

自创生理论认为:生物体就是一个复杂的化学网络,这个化学网络在每一个时刻都在不断地生成自己。

马图拉纳和瓦雷拉给出了自创生系统的两个条件:

一是这个生物组织具有生产闭合性网络中的任意一个元素都被网络中的其他元素生产。换句话说,整个网络所有的零部件全部都是自给自足的,满足一个自我闭环的特性。

二是网络中的化学元素不断地生成自己的边界,存在一个膜,从而使得边界内部的网络系统构成一个独立的整体。

只要满足这两个条件就可以构成一个原始的生命,原始的细胞。在这样一个定义里面,实际上没有关于任何物质构成这方面的限制。换句话说,这个网络可以是由分子构成,也可以是由一个细胞构成,甚至可以由一个人去构成它的一个单元。只要这个网络中这堆人能够相互生成,形成一个闭合系统,这种系统就能被称为生命体。

埃舍尔的画作《画手》是对生产闭合特性最好的表述。以这幅画作而论,互相描摹的手构成了一个生命的闭环。

如果我们把它抽象为一个闭合的生产网络,我们也可以意识到,这样的一个网络是具有自我修复特性的,即使去掉一些节点,也可以再生成出来。

催化反应

自创生理论提出后也引起了学术界非常大的争议,其中最大一个问题是,在考虑原始生命的化学反应的时候,忽略了一个非常重要的条件——化学反应中的催化剂。这是这套理论最大的不足。

在个体理论研究中做了很多前沿工作的圣塔菲学派研究者斯图亚特·考夫曼写了两本非常有想象力的书,一本是《宇宙为家》,另一本是《科学新领域的探索》。

在书中,斯图亚特·考夫曼就表达了一个观点:要构成一个能涌现出多个个体的最原始的个体,就要构成一个催化闭合网络。生成生命的化学反应要被闭合圈里面其他物质所催化而出,而不仅仅是简单生产出来。只有加上催化剂,才能提高生产的速度,才会出现生命的相变。

为了验证自催化闭合的网络是如何产生类生命组织的,沃尔特·方塔纳提出了算法化学(AlChemy)。

算法化学用一些图灵机作为化学细胞构成的分子,当图灵机分子两两互碰的时候,一个图灵机可以把另外一个图灵机当成数据,当成纸带上的符号来进行读写,从而生成另外一个图灵机,这就完成了所谓的化学反应。所以,这一锅图灵机就形成了所谓的图灵器,这些图灵机在分子汤里面碰撞,又会生成新的图灵机、新的分子。

经过多次反应迭代就出现了有趣的自催化闭合圈。

这样一个模型不仅具备前面提到的自修复特性,也包括共生、竞争的关系。

渗流相变

直觉上,我们会觉得一锅分子汤随机碰撞,产生生命组织的概率似乎很小,但是实际上,如果你把每一个化学反应看成是一个链边,每个分子看成是一个节点,从复杂网络里面的渗流相变特性得知,一个自闭合组织的产生是存在临界相变的现象的。当化学反应足够复杂、足够多时,产生一个自我闭合圈是一个大概率事件,这就使得生命的起源,在某种程度上得到了解释。

对生命定义的延伸

斯图亚特·考夫曼在《科学新领域的探索》中对生命的定义做了进一步的延伸。他认为真正的生命个体不仅仅要满足一个自催化闭合,还有一个非常必要的条件,就是一定要能够包含至少一个卡诺循环。汽车发动机的四个冲程,其实就是卡诺循环。首先,物质要获取能量,同时这个能量获得完成以后能做功,而且做完功以后就像马达一样恢复原状,同时进一步吸收能量再一次做功,因此构成了一个时间上的闭合圈。所以这个自催化闭环是一个空间上的闭合圈,卡诺循环是一个时间上的闭合圈。因此,只有把时空上的闭合圈组合在一起才是一个真正的自主体。

从个体信息论到整合信息论

回过头去看我们研究过的模型,可以清晰地看到一个脉络:最早的图灵机模型是自上而下的对这个主体进行建模的方式,也就是说不涉及内部组成是怎么长出来的,只分析行为。由此建立的一种图灵机模型是第一代的主体模型。

第二代模型一个鲜明特点是不研究个体的行为,而关注它的构成。去分析一个自下而上长出来的模糊的组织,连边界都可能不是很清晰的组织。

第三代模型是一种对最原始生命模式的回归,借助个体信息论这样的工具,描述那些难以刻画边界、定义不清楚的生命。

戴维·克拉考尔最大的贡献是他找到一种描述的手段,描绘了生命主体和环境中间的互动,这是一个时刻按照时间去演化的过程。

无论二者间的互动多么复杂,总是可以把它抽象成一个描述不确定性的随机过程。其中就可以用互信息来刻画主体性——也就是互相联系的紧密程度。对于一个组织来说它的个体性就体现在让这一时刻的自己和下一时刻的自己紧密相关——互信息最大化。

以细胞代谢为例,人体内部的细胞不断地经历着新陈代谢过程,包括细胞的诞生、成长、分裂和衰老。尽管细胞在不断更新,但通过新陈代谢,细胞能够维持体内环境的稳定性和功能的连续性。正是这种稳定性和连续性,使得“我”在前后两个时刻是紧密相关的。因此,我们可以说“我”是一个具备个体性的存在,因为新陈代谢过程确保了个体在时间上的连续性和一致性。

涌现的层级

我们经常看到的生命体实际上具备非常强大层级的结构,它是一层一层地不断去生成、不断涌现。在空间上:这种涌现从单细胞到多细胞,从多细胞到器官,从器官再到组织,接下来到人体甚至社会。每一个复杂的结构都是一层一层涌现出来的。

同时,还存在着一个虚拟的层级,比如我们的大脑就“内嵌”了整个世界,整个世界都在我们的意识中有一个映射。这个层级性非常有趣,它是两个层级展开,而且这两个层级密切相关。很多研究发现,如果要承载更大空间尺度上的层级,就必须让虚拟的层级、内在的层级足够深。这就是为什么《人类简史》的作者赫拉利说:人类之所以有庞大的数百万人的组织,就是因为我们头脑具有虚构的能力。这说明了这两个层级是密切相关的。

在虚拟层级、复杂性科学领域,冯·诺伊曼其实做出了巨大的贡献。在他的书《自复制自动机理论》中就提到自复制的概念。

我们可以看到人造的机器和真实生命存在着一个鲜明的差异,这个差异就是说真实的生命它可以自复制,存在着演化的时间箭头。

但是人造的系统、机器非常容易出错。所有的复杂系统存在一个所谓复杂度的阈值,就像我们人造的机器一样,不停地运行就会自然而然受到热力学第二定律制约而衰败。这就是汽车长时间不维修就会出现各种问题的原因。

但是生命系统一旦超过这个复杂度的阈值,生命就会不断抵抗熵增,抵抗衰败,而演变得更加复杂,更加高等,这是冯·诺伊曼研究自复制的最原始的出发点。实际上,也就是说自复制这个问题是跟熵增这个深刻的问题是密切相关的。

我们可以说,复杂性存在着一个分水岭,即一个阈值。超过这个阈值,系统便可以不断进化和发展,达不到则会逐渐衰败。这个阈值的关键在于自复制的能力。自复制是指系统能够通过自身的结构和功能产生新的个体,从而延续和扩展自身。对于生命系统来说,自复制能力不仅使得个体能够繁衍后代,还使得整个种群能够在不断变化的环境中生存和进化。因此,自复制能力是生命系统能够跨越复杂性阈值、实现持续进化的关键因素。

为什么说自复制可以跨越这个阈值呢?因为所有单个个体的生命都死亡,生命体自复制就是为了让它进一步延伸。我们可以说,生物体内部的DNA,这一段信息其实就是对整个细胞的一个编码,一个压缩映射。在内部的世界里,必须自己包含自己的全部信息。有了生命的全部信息,生命自己就可以实现自复制。在种群上,生命体超越了个体的年龄,从而抵抗热力学第二定律给它的熵增。

同时在生命体的信息自复制的时候,热力学干扰也时刻存在,这样的干扰就类似于基因突变,能够创造崭新的生命。形成一个新的代码以后,这个新代码又会在细胞里面完成自复制。这样可以反过来把热力学的干扰变成一个动力来源。

生命是一个多层次的复杂系统,其涌现的特性和自复制的能力是其核心特征。未来的研究需要进一步探索生命在不同层级上的涌现机制,以及这些层级如何相互作用,共同构成生命这一复杂现象。

张江,学者,现居北京。主要著作有《科学的极致:漫谈人工智能》(合著)等。