APP下载

突破物理限制!十吨DNA即可存储人类所有信息

2019-04-01王新凯

海外星云 2019年23期
关键词:埃利测序试管

王新凯

2019年12月10日,MyHeritage首席科学家、哥伦比亚大学副教授雅尼夫·埃利克在《自然- 生物技术》期刊上发表了一项最新成果,研究团队通过3D打印制作了一只兔子,并且将这只兔子三维结构的数据以双链DNA结构的形式内置在打印材料中。也就是说,通过编码和解码,这只兔子模型实现了其自身数据的DNA存储和传递。

雅尼夫·埃利克表示,这项研究最大的突破在于实证了万物皆可实现DNA存储的理论,且不受任何形状限制,从存储密度来看,10吨DNA即可存储人类已经创造出的所有信息!在2019年12月13日第三届EmTechChina 全球新兴科技峰会的“赛博未来”版块,雅尼夫·埃利克以“The DNA of Things”为题,为观众讲述了DNA存储技术的潜在应用,并且在演讲现场向观众展示这只DNA存储数据的兔子。

作为MyHeritage.com的首席科学家,雅尼夫·埃利克在基因隐私与众包基因组数据领域的基础研究工作方面做出了巨大贡献,曾因发现公开基因数据中存在的隐私漏洞被Nature称为“基因黑客”。此外,他还创建了包含1300万人口的家谱,是目前史上最大的谱系图。

我们到底可以通过基因数据了解到哪些信息?我们还可以拿这些信息做些什么?还有哪些潜在的应用?以下为埃利克在EmTech China现场的演讲内容(有删减)。

在过去的70年中,我们看到了技术不断快速的发展,比如说在20世纪50年代,你需要6个身强力壮的人去推一个大的设备,但是现在,智能手机的芯片可以搭载更多的信息,不会再需要这么多人来推动这么一个巨大的设备。除此之外,我们还有很多挑战,尤其是针对数据存储方面。首先,我们不再像以前一样享受一个狂欢的时代了,比如说现在存储的量以及它成本之间的比例,是在不断变化的,我们看到现在有很多不同创新的方法,基本上每年这个成本都可以降低30%。

但是,在2010年,我们发现创新的速度在变缓,主要原因是我们很难把这些设备的成本变得更优。另外一个是数字技术的演进,有些时候每一个设备搭建的架构是不一样的,你可能需要完全做一个数据和技术的迁徙。比如说我很喜欢的一个20世纪70年代的影片,可能是在一张光碟上,但是现在的设备已经放不出来了,所以它可能是格式不对,或者是硬件不支持,有很多内容已经无法再读取了。

接下来我想给大家解释,是不是DNA才是我们真正的存储技术?首先可以看一下,在过去35亿年中DNA都是存在的,而且在未来也会继续存在着。我相信未来我们还是需要去借助DNA的力量,它是任何生命物质的组成部分,我们可以通过了解自己的DNA来了解自己的组成。

20世纪90年代的一个光盘,可以看到上面的擦痕非常明显,而且没有办法修复,任何的数字技术都存在这样的问题,你过了10年之后,基本上这种硬件损毁就让你没有办法去读取它的信息。但DNA,你哪怕发掘出来了一个几千年前的残骸,都可以通过DNA来了解当时的情况。所以,我们就在思考DNA 是不是可以存储信息,但怎么去打造基于这种DNA的文件呢?每一个文件其实都是一个序列(二进制的组成),可能是0和1,不管是文本,还是歌曲,都可以用这种形式存储。DNA其实也是一个序列,它是ATCG几种不同碱基的组合。我们可以给每一个字母去赋值,比如A 是00,C是01,这样就可以通过二进制来描述这个DNA的编码,我们也可以利用合成化学技术做到这一点。

其中一个方法是用喷墨式打印机,它其实是有不同喷墨针的,你可以把ATCG放到喷头上,它可以利用一些化学物质来打印,生成一个DNA的序列,最终的结果是我们可以拿到一个像试管一样的物品,它是以液体的形式存在。如果你想读取的话就可以放到一个序列仪上,通过测序仪来读取出存储的数据。现在我和我的团队也是希望能够实践这个理念,我们用了一个计算机操作系统,读取了一个早年的电影,我们把所有的数据都放在了小的试管当中,我其实就带在了身上,你如果看不清楚,觉得什么都没有,我其实就是这个意思,真的特别小,小到几乎看不见。这个DNA是存在于小的试管当中,你可以通过测序仪去读取它,这里面不会有任何的损失。

当然这个技术有一个缺点,每一次你想去读取这个文件的话,你就需要提取出这个液体中的一部分,如果你要是想无数次地去测序的话,可能最终样本量会越来越少。我的女儿非常喜欢一部电影中的主题歌,你们可以想象,如果把这个歌的信息存储在DNA上,而你一直在测序的话,可能最后这个片段就剩的越来越少了,那该怎么办呢?我们现在在想,人体内的细胞其实是可以不断地进行DNA的复制,我们其实可以通过PCR做一个类似的扩增,这是可以在实验室内完成的。这个文件我們能不能正确读取呢?答案是可以的,我们经过多次拷贝之后,可以看到两个电影一模一样,没有任何的差别,是因为我们有非常好的纠错代码,虽然在复制过程中会出现错误,但是我们可以很好地把错误纠正过来。

雅尼夫·埃利克在演讲中

另外我们做了一个实验,也希望看一下在DNA当中我们的信息密度可以达到多少,一个DNA最多可以储存多少比特的信息。为了这个实验,我们拿了这个试管,每一次我们拿出一滴,我们都会把它的浓度稀释成过去的1/10,然后我们再拿一滴,再去稀释它,再拿一滴,再去不停地稀释,一直在重复,直到我们没有办法再从一滴的液体当中读取到任何信息为止。我们最后得到的结论,我们最大的密度,在每一个DNA上,上面可以有125“艾”字节的信息,所以说我们可以想象,基本上这么一个房间里面,全都是笔记本电脑的话,所有这些信息都可以储存到一个DNA 上。大家可以想象一下,人类所创造的数据总量应当是10到24次方,我们只需要10吨的DNA就可以储存我们所有的电影、微信聊天记录,所有人类创造出的数字信息,所有数字信息都可以在10吨的DNA上存储,这10吨的DNA直接可以装到一个大卡车上。

猜你喜欢

埃利测序试管
新一代高通量二代测序技术诊断耐药结核病的临床意义
宏基因组测序辅助诊断原发性肺隐球菌
生物测序走在前
基因测序技术研究进展
最有效的药方
最有效的药方
最有效的药方
试管难题
冬季的故事
异型试管在微型化学实验中的应用