解读中国人自己的基因故事
2020-07-13张田勘
张田勘
千万年来人类一直想要解答几个终极之问:我是谁?我从哪里来?我将向哪里去?然而迄今无法给出圆满答案。不过,个体、族群和整个人类基因(组)的研究为回答这几个问题提供了线索。
基因承载了人类的文明和未来,既有形而上的意义,也有形而下的实际意义。中国代谢解析计划(ChinaMAP)的研究结果就有这样的作用。4月30日,上海交通大学医学院附属瑞金医院内分泌科领衔的ChinaMAP联盟携全国29家研究机构和医院,在《细胞研究》(Cell Research)杂志上发表研究报告,首次公布了对覆盖中国27个省份和直辖市、8个民族、10588人的高深度全基因组测序数据和表型的系统性分析。这是中国首次通过自己的仪器、平台、分析方法,对中国人的基因组特征进行深入、广泛的研究,并获得一定成果,包括中国人群遗传变异数据构建、中国人群体结构分析、基因组特征比较以及变异频谱和致病性变异解析的结果。
ChinaMAP的初步成果在形而上的意义是,为中国人来自哪里提供了一些线索。过去,科学家对人类来自何处有两种主要的假说,一种是单地起源说,即人类都是从非洲的南方古猿演化而来。另一种假说是,人类是多地起源。如果承认单地起源,就得认同中国人来自非洲;如果要承认多地起源,就会认同中国人是在自己的地域上单独起源,并演化成今天的中国人。无论是单地起源还是多地起源,都需要两方面的证据:一是基因的,二是化石的。但是,在很多时候,两者不可兼得,难以圆满解释我们来自哪里。
作为个体的人,当然来源于父母,但是作为群体的人也应该有最早的母亲,但在溯源母亲时,就出现了两种证据难以统一的现象。
1974年,美国人类学家唐纳德·约翰森等人在非洲的埃塞俄比亚发现了一具相对完整的阿尔法南方古猿化石,并取名为露西。生活于约320万年之前的露西,也被视为人类共同的母亲。这副古猿骨架具有类似猿的脑容量和类似人类的二足直立行走方式,为人类演化提供了另一个证据:人类在脑容量扩大之前,就已经直立行走了。但是,把露西看作人类最早的母亲只是从化石上获得证明,没有基因上的证据予以佐证。
此后,通过基因证据,研究者又提出了新的假说。1987年,美国人类学家威尔逊等人提出,所有现代人的基因都可以追溯到一位生活在20万年前的非洲女性,证据就是线粒体基因。线粒体基因只能通过母亲和女儿代代相传,如果某一代没有女儿,线粒体基因就会失传。
对147位来自世界各地的女性的线粒体基因进行统计分析后,对于线粒体基因无中断的跟踪表明,所有现代人都是同一位非洲女性的后代,研究者将其称为夏娃。人们推测夏娃的后代大约经过7万年的繁衍生息之后,有了大量子孙,在约13万年以前,夏娃的后代走出非洲,并在地球的各大洲不断迁徙和繁衍,最终取代了世界各地的所有土著人类,演化成了现在的人类。不过,这个假说除了线粒体基因证据的不完全外(缺少细胞核DNA证据),还缺少化石证据。
中国古人类学家吴新智认为,中国人的起源是“连续进化附带杂交”,这实际上就是一种人类的多地起源说。他认为,中国人属于多地起源。这个假说虽然并未得到确证,但也有一些化石证据,如许昌人、大荔人等新的化石证据,显示出现代东亚人的祖先可能既包括非洲智人,也包括不同时期进入东亚的其他人群以及更早的东亚人。同时,多地起源也有一部分基因证据。不过,以近年来获得的证据,无论是通过化石,还是基因,追溯人类来自哪里都还存在困难。现在ChinaMAP为中国人“连续进化附带杂交”的起源假说又提供了一些线索。ChinaMAP覆盖中国七大地理区域,涉及族群包括人口排名前10的汉族、壮族、回族、满族、苗族、彝族、藏族和蒙古族等。与全世界其他人群相比,中国人的遗传特征与欧洲、非洲、南亚和拉丁美洲人群之间存在着巨大差异,与非洲人群差距最大,而与东亚人群非常相似,尤其是中国北方汉族人与日本人的基因重叠较多。
ChinaMAP也反映了中国国内各个族群的交融。从最大的族群汉族来看,可分成7个亚群:北方汉族、西北汉族、东部汉族、中部汉族、南方汉族、东南汉族和岭南汉族。另一方面,从中国的少数民族看,各民族的独特性也是显著的,藏族、彝族、蒙古族、苗族和壮族都有着独特的人群聚类。但是,从共性来看,满族和北方汉族相近,回族和西北、北方汉族相近。这说明,在漫长的岁月中,中国国内各民族之间的交流和融合绵延不绝,体现为不同地域人群的变异特征与中国历史上的人口迁徙和变迁相关。
尽管历史学、社会学、民族学和文学等能提供中国各民族交流和融合的社会层面的宏观证明,但ChinaMAP能提供民族交融的分子生物学证据,以证明各民族的交融和共同演化。同样,ChinaMAP也展现了基因研究的形而下意义,有利于中国人的疾病预防和治疗。
该研究对10588人的DNA样本进行深度全基因组测序,获得了包含1.36亿个基因多态性位点SNP和1000万个插入或缺失位点(NDEL)的数据库(其中一半是在国际通用的多个数据库中均没有的新位点),这既能解释一些生命现象,也能揭示一些疾病的发病原因。
尽管很多疾病的发生有共同的机制,但是由于人群和基因的不同,需要不同的诊治方式。2型糖尿病是中国和世界范围内发病率极高的重大慢病。ChinaMAP提示,欧洲人群中最显著的2型糖尿病遗传风险TCF7L2基因变异(如rs7903146位点变异)在中国人的基因中出现概率很低,而靠近CDKAL1基因的rs7756992位点变异才是中国人患糖尿病的风险因素。这说明对糖尿病的预防和治疗不能只参考欧美人群的指征和标准,而应当研发中国人自己的标准和治疗方法。
对保健和疾病预防来说,ChinaMAP同样会提供一些有益的视角。饮酒導致的疾病很多,如肝病、癌症、心血管病等,改变生活方式固然是最好的方法,但从基因上揭示原因也能坚定人们改变生活方式的信心,并获得其他有益的预防措施。
ChinaMAP研究表明,乙醛脱氢酶2基因的rs671位点变异是导致喝酒脸红和酒精代谢能力差的重要原因,而且这种基因变异在东亚人中具有特异性,在中国人群中的携带者数量远高于全球其他地区人群。rs671位点变异也是诱发食管癌的重要风险因素。这种疾病的内因再次向公众表明,不胜酒力者(喝酒脸红者)应少喝酒,但是那些所谓酒量大的人也需要少喝,因为中国人的基因注定比其他种族的人更易因为饮酒而诱发食管癌和肝癌。
无论是对人类演化问题的解答,还是为疾病预防和治疗提供科学证据,基因研究都不可或缺。科学家和医学工作者研究中国人群体的相关问题,若以中国人的基因组大数据为准,便能更精准、更有效地服务于中国人。