基因检测新造物者的盛宴
2019-04-18王燕青孟依依
王燕青 孟依依
好奇心打开了人类本源魔盒。
白晓海点开手机上那个白底彩字的图标,里面躺着一份关于他的基因检测报告。报告的第一项是“祖源”,可以告知他的民族血统,也意味着窥见祖先的繁衍、迁徙和发展史。此前他对自己的祖源没有任何了解,并且很难了解。他看到在男性特有的家族溯源那一项中写着“你可能是赵匡胤家族的后裔或同宗”。
“自己生得有点晚了。”白晓海想。
他花一个多小时看完了报告中所有基因信息,内向、能喝酒、沉稳抗压力、学习能力强被印证,担心的事情最终也被印证——和姥爷、妈妈一样,他有极大的风险会患上糖尿病。
去年4月,他在网上购买了一份基因检测服务,在一个邮寄过来的透明收集管中留下2毫升唾液,然后寄回四川。
这是近两年在市场上逐渐兴起的消费级基因检测,提供唾液后十天左右会为消费者反馈包括祖源、遗传风险、营养需求、运动健身或个性特点等在内的个人报告。按照各色DNA创始人郭婷婷的定义,消费级基因检测应该是经过充分互联网化并且可以形成持续更新报告的检测,2006年创办的美国基因检测公司23andMe是其中典型。
唾液来到实验室,从唾液中的上皮细胞和白细胞中提取 DNA后,检测中心使用基因芯片检测 75 万个基因位点,机器将完成芯片的杂交、洗涤、扫描基因信号,然后你会看到一张蜂窝状的荧光数据图,将同一位点的荧光数据进行聚类分析,最后得到分型数据——原始基因数据,一份英语字母和数字密密麻麻排列的txt文档,包含每个人与生俱来的所有编码。
更被人关心的则是对数据的解码。
27岁的销售总监梁宵在各色DNA做过一次检测,最近更新的一项数据显示,在八个更易感到社交恐惧的基因中,他占据了五个。中学时代一直内向和不善与人相处的梁宵,曾经在自责的情绪中花了很大力气试图让自己变得外向。直到十天前,他看到报告上的“重度社恐”四个字才突然释怀。
但是,人类在更加深入掌握了基因技术后,正逐渐向半神的方向演化。最近,俄罗斯和日本科学家正试图通过基因技术复活猛犸象。
早在2018年,俄罗斯就投资590万美元在世界上最寒冷的城市雅库茨克建设克隆中心,支持科学家克隆冰河期灭绝的远古巨兽们。一旦猛犸象被复活,大自然循环法则将被人为打破,人或将超越自然。
在这些耸人听闻的事件背后,不可否认的事实是,人类掌握基因技术的深度已到了令人惊讶的地步。同时,基因技术在现实生活中的应用也越来越广泛,各式基因检测成为人们探寻生命本源的主要用途之一。
至本医疗科技创始人兼CEO王凯 图/受访者提供
美国是基因检测最发达的国家,早在十多年前,就出现了23andMe、Ancestry、Helix和Human Longevity等为大众提供消费级基因检测的创业公司。美国一些知名人物也都是最早尝试基因检测的人。苹果公司创始人斯蒂夫·乔布斯在罹患胰腺癌后曾花费10万美元做了基因检测,好莱坞明星安吉丽娜·朱莉也曾在2013年通过基因检测切除了乳房,避免生乳腺癌的风险。
2013年,中国也迎来了基因检测行业发展的浪潮,尤其是面向个体消费者的基因检测产品。有两百多家创业公司如雨后春笋般兴起,上海至本医疗科技、23魔方、药明康德等创业公司都是其中的头部创业公司。而华大基因(300676.SZ)和贝瑞和康(000710.SZ)则是基因检测行业里的龙头企业。
2017年至2018年,美国FDA批准了一系列面向消费者的消费基因检测产品,包括10种遗传疾病的易感性测试产品和癌症风险基因检测项目,推动了整个行业的纵深发展。
推开基因检测大门
王凯是上海至本医疗科技创始人,也是中国最早接触基因检测行业、并且持续投身于这个领域进行深入研究的从业者。从2001年至今,他在18年的时间里见证了全球基因检测行业的发展,亲身经历了从一代到二代测序技术的跨越,也见证了基因检测技术从实验室走向大眾社会的全过程。
2001年,王凯从白求恩医科大学临床专业毕业,在中国科学院院士、中国科学院生物物理研究所研究员陈润生的引领下,进入基因检测领域,加入了华大基因公司。他也因此接触到Sanger一代测序仪和生物信息学。
那时的生物信息学,完全是一门全新的学科,甚至在国内它还不能称为一门学科。事实上,生物信息学是非常体现人类创造性的学科之一。在这门学科的逻辑框架下,可以用最基本的编程逻辑,通过程序去探测人类基因密码。
华大基因为王凯打开了基因检测世界的大门。在华大基因工作期间,他参与了“人类基因组计划”的收尾工作,这个计划于1990年启动,由美、英、日、德、法、中六国共同参与,2000年公布了人类基因组草图。
成立于1999年的华大基因是当时中国参加人类基因组计划的主要力量之一。曾任北京华大基因研究中心总工程师的胡松年用“生命之书”来比喻人类基因组计划,基因组测序相当于把字印在了书上,基因的功能与表达方式形成了词句,但能不能读懂这本书则取决于阅读者自己的理解。“破译生命之书”成为科学家、研究者的毕生追求。
这也在王凯的心中埋下了一颗种子。他想,有一天,基因研究会改变整个人类的进程和历史。在人类浩瀚无穷的自我探索中,这将是意义非凡的一刻。他也由此坚定了自己在生物信息学方面深造的决心。
2003年人类基因组计划公布了更为精细的人类基因图谱,该项目研究结束后,王凯从华大基因辞职,到世界生物信息学最权威的丹麦科技大学生物序列分析中心(CBS)攻读生物信息学研究生。
王凯的导师Soren Brunak教授是生物信息学的早期奠基人之一,曾任著名的Ensemble数据库主席、ISMB主席,以及欧洲生物信息学中心主席等。王凯也是当时为数不多的中国学生之一。在导师的指导下,王凯把癌症基因分析作为自己的研究方向。这也是后来在中国基因检测市场成为最具商业价值和现实意义的领域之一。
在CBS读书期间,王凯接触了全球最为前沿的基因检测项目。他参与了DNA元件百科全书计划(Encyclopedia of DNA Elements,简称ENCODE计划)。ENCODE计划是美国国家人类基因组研究所在2003年9月发起的项目,也是继“人类基因组计划”后,全球最重要的基因检测项目,在人类基因测序基础上,研究序列的基因结构和功能的识别。
商业化启蒙
2007年,基因二代测序(Next Generation Sequencing,以下简称NGS)技术逐渐成熟, Illumina推出了第二代测序平台,王凯有机会接触到最先进的基因测序技术。与此同时,基因检测的价格也显著下降,23andMe消费基因检测的价格已经下降到了999美元,消费者只需要提供一管口水就可以检测。
到2008年,基因检测的成本进一步下降,全基因组检测成本从2007年初的1000万美元下降到10万美元,降幅达到99%。价格的下降催生了美国消费基因检测行业创业浪潮的兴起。
此时,王雯静正在德国攻读商业战略管理硕士。她对基因检测的了解仅限于科研文献。那一年,家人罹患肺癌正在寻医问诊,心急如焚的她听说易瑞沙能延长肺癌患者的生命周期。王雯静向一些专家学者、医生打听怎么用药,一位在德国马普实验室工作的学长告诉她这个药可能有效,但服用前最好做一下EGFR检测,看看是阴性还是阳性。
王雯静一听懵了,“去医院问,很多医生也不知道”。后来学长就跟她说了一个适用人群的范畴:亚洲人、女性、不吸烟、小细胞癌,“如果符合这几种特性的话,先试试易瑞沙。”
她后来才知道,从基因检测角度来看,以上几点是易瑞沙药物反应的不同亚组的患者所具有的普遍特征,他们高度敏感的腫瘤中多数含有体细胞突变的EGFR基因。试过之后病情很快得到了控制,延长了26个月的生存期,达到了这个药当时能延长的最长生存期。
王雯静内心一直有一个情结。她本人是药物不良反应的受害者,小时候因为急性肺炎打庆大霉素产生药物毒性导致右耳完全失聪,这种药物性致聋是不可逆的。王雯静后来想,很多基于欧美人群基因数据库研究的药物对中国患者会不会产生疗效上的差异甚至药物毒性?有没有属于中国人的药物基因组学数据库来支撑研发新药并指导临床用药?
此时的王凯也还没有感受到校园外的这股创业潮,他获得资助进入美国加州洛杉矶分校(UCLA)生物信息学系主任克里斯托弗·李(Christopher Lee)教授的实验室专注做癌症NGS项目。这也是他的博士课题。
王凯的追求已经不满足于基础性的科学研究,而是更进一步探索科研与实践的转化关系。他的研究对于癌症研究的涉及越来越深。他想从突变的层面解决更为本质的探索,“DNA到RNA有一个剪辑、转录的过程,RNA再翻译才能变成蛋白质”,王凯把垂直领域的研究集中在前端,“DNA和RNA之间”,“我想搞清楚,蛋白质之间是怎么样的(关系),谁和谁亲,到什么程度,形成什么功能?”更重要的是,“这个功能对于癌症有什么作用,偏预测性。”
2010年,博士毕业后,王凯进入哈佛大学的Dana Farber癌症研究所,开始博士后学习阶段。他加入了牛人李程教授的实验室。李程是生物信息学的传奇人物,他所在的研究组开发了DCHIP软件,主要用于基因表达和SNP生物芯片的数据剖析和可视化。
王凯选择继续从事癌症和NGS的相关临床研究。虽然当时研究生物信息的人越来越多了,但总体上仍然偏少,尤其是中国人。
王凯研究的二代测序成为基因检测商业化的基础。二代测序从2006年左右开始出现,取代之前主流的一代测序,整体的通量、准确性都有了非常大的提高。王凯是二代测序资深研究人员,他称之为“一个跨越性的变化”,这个大胆的突破成为人类自由探索基因奥秘的重要工具,“虽然一代、二代都叫测序,但是原理上、产能上和效率上已经不是一个概念了。”
李程教授一直致力于研究高通量基因组学数据处理算法、软件开发和在癌症基因组学研究中的应用。2013年,李程教授全职加入北京大学生命科学学院后,建立了干湿结合的癌症基因组学实验室。
2011年秋天,王凯结束了哈佛大学的博士后研究工作,加入到Foundation Medicine公司(简称FMI),在生信组负责优化基因拷贝数分析流程和建设数据可视化,FMI是世界级基因检测领域的明星公司。
FMI成立后,微软创始人比尔·盖茨、Google Ventures、俄罗斯亿万富翁尤里·米纳尔和美国诊断界的传奇人物埃文·琼斯都是首轮投资者。
王凯本就出生在一个医学世家。他自然而然地选择上医学院、治病救人,又自然而然地想要通过技术的精进解决更多人类无能为力的时刻。在FMI工作期间,王凯最后的成就感和最感到无能为力的都是同一件事——救人。他亲眼见证了NGS测序结果挽救了一个垂危病人生命的案例。
当时,一位不到36岁的骨肉瘤患者已经出现肺部转移病症,大部分时间昏迷在ICU,无法吞咽。家人接到了他的病危通知书。他的两个女儿一个四岁、一个两岁,他的爱人是一名老师。当医生都要放弃他时,FMI决定给他做NGS测序,“病人家属说无论如何要尝试一下,不然人就没有了。”
在家属的坚持下,NGS测序结果提示针对某个基因扩增的用药,但由于没有任何先例,医生一开始是反对这样治疗的。后来病人尝试用药后48小时就出了ICU,两周后出院。
基因检测技术能成功挽救生命,这让王凯体会到了前所未有的成就感,他用了“震撼”二字形容當时的心情。但基因检测的进一步纵深化是无穷无尽的,至今为止我们对此还有太多未能解决的难题。
有时候,即使作为最前沿的研究者,王凯也不得不接受一些事实,那就是基因检测不管在中国还是在美国都会有假阳性和假阴性的问题,“任何医学检测都是如此的,没有人能做到100%”,“如果回到二代测序对癌症这块,又有更高的质量和算法的要求,这个准确性可能就要下来一些,这个是一个客观的问题,在人类历史上,医学的检验和病理这块是没有100%的,但我们的目标肯定是往这个方向去努力。”
至本医疗获得CAP和CLIA双认证的NGS测序实验室
好奇心驱动
王凯在美国求学、工作的时候,国内基因检测行业的发展也迎来了春天。2012年,23andMe推出了99美元的消费级基因检测产品,随后,家谱公司Ancestry也推出了类似价格的产品,在行业头部公司的推动下,美国消费基因检测市场进入发展的高潮期。
美国市场刮起的这股风潮漫卷过宽阔的太平洋,在彼岸的中国创投圈激起一股很大的浪花。从2013年开始,大量资本和创业者进入这个领域,阿里巴巴、软银中国等顶尖投资者纷纷布局这个市场。
2014年,Illumina进一步降低了基因测序的成本,它推出了新系统 HiSeq X Ten,将全基因组的测序成本降到了1000美元,这个成本包括了仪器折旧、DNA 提取、文库制备以及典型的高通量基因组学实验室的预计劳动力成本等各类开支,低廉的成本让中国创业者看到了基因检测市场风口正在起来,当年底,微基因、23 魔方、水母基因等中国基因检测公司相继成立。
祖源分析、运动基因、皮肤特质、天赋基因、个性天赋、药物反应、营养代谢等各种消费娱乐级别的基因检测产品也频频出现。到目前为止,中国从事此类基因检测应用的创业公司数量超过200家。
“(各个机构对基因的解读)各有侧重,有的擅长祖源和人类学,有的擅长疾病的检测,像我们更擅长心理和行为,因为可解读的项目实在是太多了。”郭婷婷偏瘦,讲一口不那么标准的普通话,她从事心理学研究十多年,带有某种使命感。
2015年,她就拿到过一份自己的基因数据,那时候已经能够找到科研外包实验室或者医疗检验所获得基因原始数据,“好玩,我想搞清楚这些对人来说意味着什么。”
同一年,她创办了各色科技有限公司,初创团队都是来自于生物工程、心理测评、认知科学、行为遗传学等领域的年轻研究者。
各色DNA创始人郭婷婷 图/受访者提供
COMT基因,这是她几年前最先关注到的基因。这个经典的心理学研究基因位于 22 号染色体,参与多巴胺和去甲肾上腺素降解的过程,跟注意力、学习能力、疼痛和情绪稳定性都有关系。
继续解码需要借助大量研究文献,比如COMT中关注较多的变异位点rs4680,有研究将这个位点的两种表达总结成:warrior(战士)和worrier(担忧者),各约占人群的50%。前者迟钝、神经大条,但能更好地处理压力与合作;后者灵活、有创意,但总是焦虑和敏感。
对照基因数据后,郭婷婷属于前者。“这些特征都是多基因影响的,其他的基因位点也有待挖掘。”复杂性正是郭婷婷觉得有意思的地方。
这样做的生物学基础是基因的重要作用,有时候它对我们的影响超出我们的想象,郭婷婷在一次演讲中提到,研究表明数学能力的遗传率大概是40%-60%,语言是50%-70%,离婚的遗传率是30%-0%,烟瘾是50%,所以几乎一切人类的特征都和遗传有关系。
尽管如此,基因并不能告诉你全部,它只是一个了解自己的起点,“基因检测告诉你一个概率,了解基因和生活经历的影响,可以知道像你这样的人应该用什么样的生活方式去提升自己。”
目前已经有将近三万人在各色DNA上做过基因检测,他们大多是22-32岁,居住在北上广深杭,拥有本科及以上的学历。“(基因检测)的认知门槛是很高的,对用户来说产生影响的前提是,他/她对这个事儿投入得足够多。”了解自己是件漫长又费力的事情,需要有足够的对人的好奇心,以及勇气。
“这个东西对普通人来说有什么用,以及提供的这份解读在数据解释率各个层面上达到了一个什么样的水平,我觉得可以很好地回答这两个问题才是成熟的适用于大众的产品。”郭婷婷说,“现在只是一个好奇心驱动的生意,只有突破了好奇心层面,才能有更实际的用途。”
中国无创产检火爆
2014年左右,中国也开始逐步规范基因检测行业的发展,原卫计委和原国家食品药品监管总局加强基因测序行业监管,无创产检和肿瘤测序等临床级别的基因测序产品和服务开始逐步走向规范。
在这些基因检测类型中,产前与母婴诊断中的NIPT(无创产前基因检测)业务是最先火爆的一个领域。
中国是新生儿出生缺陷率较高的国家,约为5.6%。随着国家放开二胎政策,每年将比政策放开前增加400万新生儿,高龄孕妇由于年龄增加,其所怀胎儿罹患多种染色体综合症的风险也在加大。基因检测相比于传统检测更加安全高效。