进化论系列讲座(二十一)从生物统计到群体遗传
2021-03-16郭建崴
郭建崴
生物统计学派的不屈
前文提到,孟德尔之所以能够发现两大遗传定律,一个重要的原因是他运用了统计学等数学手段来分析生物学上的杂交问题。从这个意义上来说,他也是一位出色的生物统计学家、甚至是先驱之一。只是在他发表《植物杂交试验》那篇论文的时候,生物统计学的系统方法还没有建立起来。
最早试图把统计学的理论应用于解决生物学、医学和社会学领域的有关问题,从而提出生物统计思想的学者是比利时数学家凯特莱(Lambert Adolphe Quételet,1796~1874)。
随后,达尔文的表弟高尔顿(Francis Galton,1822-1911)最早进行了系统、定量统计生物性状的工作。1859年《物种起源》一书的出版引起了他对人类遗传的兴趣,高尔顿随即兴致勃勃地将表兄的理论应用于人类身上,并且创立了“优生学”(在1883年《人类才能及其发展的研究》一书中首创“优生学”这一术语)。受当时科学水平及西方政治思潮的影响,高尔顿的许多观念和结论在今天看来错误百出,但是他在多个领域所作出的开创性的巨大成就,使其得到世界公认并获得许多奖励与荣誉——例如,他虽非出身于心理学,但是对心理学早期发展的影响力却一般被公认比同时期任何一位心理学家都要巨大而深远;他在1884年创设了人类测量实验室;1889年,他在《自然的遗传》一书中通过对人体身高的研究,指出子代的身高不仅与亲代的身高相关,而且有向平均值“回归”的趋势,因而提出了“回归”和“相关”的概念和算法,奠定了生物统计学的基础;1901年,他与其弟子皮尔逊(Karl Pearson,1857-1936)以及生物学家威尔顿(Raphael Weldon,1860-1906)共同创办了《生物测量学》(Biometrika)期刊,该刊时至今日依然是统计学理论的首要刊物;他在1904年捐赠基金在伦敦创办优生学实验室;1909年他获授爵士封号。
作为统计学家,皮尔逊拥有超越于高尔顿的数学技巧,在发明了许多统计分析方法的基础上,从理论层面证明自然选择对动物群体会产生持久的影响。威尔顿则从多项野外研究中为皮尔逊提供佐证。例如,他对螃蟹体型与死亡率的相关性作了统计,发现在沉积物含量比较高的水体里较大体型的个体比较小体型的个体更易于存活;而且经过若干代之后,积累下来的选择作用会使螃蟹群体的平均体型变大。而在此之前,他曾经测量过不同地区虾的各种性状,发现数据呈现出正态分布的连续曲线——这被许多同行认为是奠定生物统计学基础的一项实验性研究。
即使到了孟德尔定律被重新发现、由不连续突变引起进化的突变论思想兴起之时,皮尔逊和威尔顿以及他们所代表的生物统计学派仍坚持达尔文“微小的、连续的变异是进化的基础,自然选择建立在连续变异基础上”的观点,因而与孟德尔主义针锋相对,认为不连续变异是没有意义的异常现象,连续变异才是重要的。不过很快,皮尔逊的同行好友犹勒(George Udny Yule,1871-1951)就在1902年的一篇论文里提出,生物统计学派所测量的连续变异与孟德尔定律并非水火不容。
遗传学随后的蓬勃发展逐渐显示出,遗传规律实际上比孟德尔主义者最初设想的状况要复杂得多。到了1909年,瑞典育种学家尼尔森(Herman Nilsson Ehle,1873-1949)首次用实验证实了接近连续变异的性状可以按孟德尔方式遗传下去。
尼尔森利用小麦的两个品种进行杂交,其一是红色种子,另一是白色种子。杂交后代出现的红/白比例不是按孟德尔第一定律所预期的3比1而是63比1;并且后代的种子颜色从深红至浅红、到白里透红、最后直至白色——虽然颜色的变化仍然不完全连续,但相邻两种颜色的差别已经不明显。尼尔森根据实验结果推测,小麦种子的颜色是由3对分离的、独立遗传的因子遵循孟德尔定律同时控制的。他进一步推断,如果某个性状被10对遗传因子控制,那么该性状就会有6万种不同的表现型出现,它们之间的差异将会小到忽略不计,因而呈现出连续变异的状态。
几乎同时,伊斯特(Edward Murray East,1879-1938)和爱莫森(Rollins Adams Emerson,1873-1947)通过研究玉米的连续变异性状的遗传,以及其他学者通过对烟草的连续变异性状遗传以及对人体肤色遗传等方面的研究,同样得出了单一性状可以由多对遗传因子(基因)控制的结论。这样,就为解决连续变异性状的遗传与孟德尔式的遗传之间的矛盾打开了一个关键性的突破口。
随后,科学家又发现了有关基因之间存在相互作用,并影响到生物的外部性状的情况,其中最特殊的一种相互作用是基因的多效性,即一种特定的基因能够直接或间接地影响若干不同的性状。这样,通过发现多基因遗传——多个基因同时控制单一性状,以及基因的多效性,科学家相信一切遗传现象都能够从可分离的、不连续的基因角度去解释。从而,连续变异现象找到了符合孟德尔原理的遗传学基础,也使达尔文主义的进化论拥有了坚实的遗传学支撑。
自此,在短短的几十年内,形成了一种基于渐进化、自然选择和种群思想,同时又符合已知的遗传学机制,此外还考虑到随机因素和环境因素影响的综合的进化理论。这一综合的过程,群体遗传学至关重要。
群体遗传学
群体遗传学的创建离不开三个人:费雪(Ronald Fisher,1890-1962)、莱特(Sewall Green Wright,1889-1988)和霍尔丹(1892-1964,Haldane,John Burdon Sanderson)。
1909年,费雪进入剑桥大学,3年后获得数学学士学位毕业。期间,他学习到了孟德尔遗传学,同时受到当时两位著名的统计学家皮尔逊和戈塞(William Gosset,笔名“Student”)的影响,也感受到生物统计与发展中的各种统计方法具有的潜力——能够将“不连续”的孟德尔定律(例如人类的ABO血型)与“连续”的多基因遗传(例如人类的肤色)以及“渐进式”的达尔文进化论结合起来。
费雪在1916年写出《根据孟德尔遗传方式的亲属间的相关性》这篇论文并在1918年发表,建立了以生物统计为基础的遗传学,提出了著名的统计学方法——变异数分析(也称方差分析)。这篇论文还揭示,一些具有连续性变异的遗传特征可以符合孟德尔遗传定律。1930年他出版了《自然选择的遗传学理论》一书,将达尔文的进化论与孟德尔的遗传学理论统一起来,这种统一后来被称为“现代综合论”(modern synthesis)。方方面面的科学贡献让费雪从当时到现代均盛名远扬,理查德·道金斯(Richard Dawkins)在2011年甚至将他赞誉为“达尔文最伟大的继承者”。
由于深受物理学影响,费雪在构建自然选择的数学模型时作了一些抽象的简单化假设,认定只有大种群里才能发生有意义的进化,过小的种群由于缺少足够多的遗传变异而容易导致灭绝;从长远来看对于一个大种群的进化来说,自然选择的作用是决定性的,随机因素的作用很小。他还假设,新的基因突变产生的性状变异通常很小,一般都处于一个物种的正常变异范围;经过自然选择,优势突变的基因频率才能够在种群里逐渐增加,进而实现进化。
生物学科班出身的莱特1915年毕业于哈佛大学,随后几年在美国农业部工作,分析豚鼠近亲繁殖研究方面的数据以便指导牲畜改良。期间他研究出来的通径系数法成为后来在行为遗传学、社会学和经济学等领域得到广泛应用的一种统计方法。1926年受聘芝加哥大学遗传学教授的前一年,他已经完成了《孟德尔群体中的进化》一文,不过这篇经典性的长篇论文直到1931年才发表。
与费雪不同的是,莱特更加重视随机因素在小种群中的作用,因为他在动物育种实践中意识到,小种群中不同的基因常常会发生复杂的相互作用,尤其是近亲繁殖可以产生在大种群里难以出现的基因组合,由此形成的变异有可能被随机地保留和固定下来,这种状况被称为遗传漂变。莱特认为,在自然环境中大种群也可以被分隔为一些局部的小种群,遗传漂变会在这些小种群里产生新的基因组合;进而,自然选择的作用决定这些新组合的命运——优胜劣汰,结果产生比费雪所设想的快得多的进化速率。
霍尔丹(图片选自互联网)
霍尔丹的主要贡献同样是把遗传学和数学直接应用于进化论的研究,1932年他将多年的研究成果总结为《进化的原因》一书出版。此外,他还发表了一系列人类遗传学的论文,最早使用了“克隆”这一术语;他曾以实验证明酶反应服从热力学定律,并在1930年出版了概括当时酶学研究成果的著作《酶学》。霍尔丹影响最为深远的研究是关于生命起源的理论探索,他在1929年发表了《生命的起源》一文,认为地球之初的自然环境与达尔文曾经推测的截然不同,在达尔文认为是“温暖的小池塘”存在的地方,实际上存在的是“原始汤”——他与前苏联生物化学家奥巴林(Oparin Alexander Ivanovich,1894~1980)先后独立地提出了非常相近的生命起源的化学发生观点,认为早期地球有一个还原性大气圈,会有极少量的氧而富含碳与氢以及与氢容易结合的甲烷和氨,在闪电或火山的高热量作用下,这些分子可以形成不同的有机分子,如烃类化合物和氨基酸,溶解在海洋中形成原始汤。随着时间的推移,这些有机分子发生反应形成复合物。一些有机分子及复合物被封闭在“油膜”中,形成最初的生命体。这种生命起源的原始汤假说,被称为“奥巴林-霍尔丹假说”;对于最初的生命体,奥巴林将其命名为“团聚体”,而霍尔丹则称其为“半生命体”。当然,奥巴林与霍尔丹的分歧不仅仅是对最初生命体的称谓。前者认为生命活动最重要的过程是细胞代谢,蛋白质是这个过程中最重要的组成部分,因此他及其追随者也被称为“代谢优先”学派;而后者则认为生命的关键在于基因。——这种状况也从一个侧面反映了当时遗传学在西方和前苏联所面临的不同境遇。
回到群体遗传学。霍尔丹在一些具体问题上所持的观点基本上是处于费雪和莱特之间。例如他创建的数学模型针对的是大种群以及单个基因的变化,与费雪相似,但同时他又认为自然选择对单个基因的作用过程有时会比费雪的推测快得多。他引用的最经典案例就是英国桦尺蛾的工业黑化现象——1848年,英国的昆虫学家在工业城市曼彻斯特附近采集到了第一只黑色翅膀的桦尺蛾,而此前所有这种昆虫的翅膀都是浅灰色的;霍尔丹假设此时黑色桦尺蛾在整个种群中的比例是1%,到了1902年,53代之后的桦尺蛾黑色个体的比例已经几乎是100%,计算结果显示,这样的进化过程意味着每一代黑色个体的存活率比浅灰色个体平均高1.5倍,如此高的选择强度在费雪的模型中是不可想象的。后来,霍尔丹也独立地产生了对基因之间相互作用重要性的认识,但是他认为大多数种群在通常情况下不分隔为小种群,因此遗传漂变的作用从长远来看是有限的,这一点又区别于莱特的观点。
桦尺蛾的黑(上图)与灰(下图)(图片选自互联网)
除却这些具体问题,群体遗传学家们在总体认识上一致认为,生物进化实质上是一个种群内部基因频率改变的过程。如果产生了一个对生物体有利的基因突变,不论优势多么微弱,只要时间足够长,其都会经自然选择的作用而逐渐积累并最终扩散至整个种群;如果知道了这个优势的适应度大小,就能够计算出这个基因频率的增长速率。同时,自然选择也不会像摩尔根所认为的那样必然淘汰有害的基因突变,如果有害基因突变是隐性的,自然选择只能降低这个基因频率而不会彻底消灭它;尤其是在杂合体比纯合体具有更大生存优势的情况下,自然选择会使两个等位基因保持某种平衡的比例——这被称为平衡选择。再者,基因突变是以某一速率随机发生的,即使没有优势也会以很低的频率在种群中出现并流通;当环境发生了改变,这些本无优势可言的基因突变有可能成为适应于新环境的优势者,受到自然选择的“青睐”。因此,遗传多样性的保持对于一个种群的长期生存是有利的——这一点不仅对进化论来说非常重要,而且也是现代保护生物学的重要理论基础之一。
遗传学发展至此,进化论的一个新的篇章即将揭开。请关注下期——现代达尔文主义。