APP下载

DNA Tile 计算简述

2019-08-19赵海燕1石晓龙2

关键词:双螺旋折纸分子

赵海燕1, 石晓龙2

(1.华中科技大学 人工智能与自动化学院, 湖北 武汉 430074; 2.广州大学 计算科技研究院, 广东 广州 510006)

DNA 纳米技术,由Seeman 于 20 世纪 90 年代开创性提出,即以 DNA 为纳米材料自组装成特定结构.Seeman 最初的设想是利用 DNA 形成空间构象的六臂结,相邻臂之间成 90°在空间中张开,所有的六臂结组合连接成空间中重复排列的 DNA 晶格结构,并且可以用于排列蛋白质等生物分子,如图 1 所示.当时,自然界中交叉的 DNA 结构已经被知晓,如可移动的霍利迪交叉,缺点是其结点处并不稳定.但是,Seeman 通过改变序列的设计、消除组合分子的对称性实现了不可移动的结点.随后,Seeman 等设计并实验了多种DNA 交叉结构也称为 DNA Tiles[注]Tile 也是瓦片,指形成特定结构的一些小的单元,这些小的单元内部的链之间紧密连接形成单元结构,通常 Tile 会保留粘性末端以便不同的 Tiles 之间衔接形成大的周期性结构.,为 Tile 自组装成周期性的稳定结构奠定了坚实的基础.

图1 DNA 三维周期排列结构Fig.1 DNA three-dimensional periodic array

由不同的 Tile 单元组成的重复性 DNA 结构也被不断地设计并实现,从简单到复杂,从二维结构到三维结构,这些复杂而有序的结构的大量形成,推动了其在应用领域的发展.

1982 年,Seeman 首次提出 DNA 的纳米材料属性后,DNA Tiles 在结构方面的设计和实现有了长足的发展,并打开了 DNA 在纳米结构领域和计算领域发展的大门.1994 年,Adleman[1]首次提出 DNA 可以用于解决城市路径问题.Adleman 证明了在一滴 DNA 溶液中的亿万分子所包含的计算能力是硅芯片所不能匹敌的.然而对 DNA 的操作并不能像微电子领域那么精确,所以 DNA 计算并不能用于取代传统的硅片计算机做大量的数字逻辑运算,而应另辟蹊径去解决一些计算问题.1998 年,Erick Winfree 最早在其博士论文中为 DNA 在计算领域的应用指明了新的方向,他认为可以使用由 DNA 构建的块(blocks,Tiles)作为“Wang”Tile 来存储或者表示数据,并为不同的块设计特定的连接方式,按照预先设计的特定方式组合起来描述相应的计算模型,这种组装方式也称为“程式自组装”.通常 DNA 之间的碱基配对为 A-T,G-C,而采用 Tile 进行连接之后粘性末端的编码多种多样,大大提高了其编码的能力[2].“Wang” Tile 的提出为 Tile 在计算领域的应用提供了新的思路.

如今,通过 Tile 程式自组装实现的结构及其在计算领域的研究成果已然举不胜举,本文简单地梳理了现有的研究成果.文章将分为两个部分:首先详细地介绍 DNA Tile 的典型结构及其应用,再着重阐述其在计算领域的一些重要工作.

1 DNA Tile 的典型结构及其应用

作为纳米材料,DNA 具有其得天独厚的优势.首先是其确定的纳米级几何结构,DNA 双螺旋的一个螺旋的长度为 3.4 nm,半径约为 2 nm.其两个螺旋约为 21 个碱基,即 21 个碱基转过 720°,相邻碱基间转过的角度约为 34.3°.DNA 双螺旋结构在 50 nm 的长度内具有刚性,因此,实际上是非常柔软的纳米结构,可以用于形成环状或者其它具有曲度的不规则结构.其次,DNA 双螺旋内通过 A-T,C-G 的碱基对连接,双螺旋间可以通过粘性末端连接,部分 DNA 纳米结构之间可以通过碱基间的堆积力连接.而且,DNA 序列可以人工合成,具有可编码性和可寻址性,可用于程式自组装.因此,利用 DNA 可以设计组装成基本的 DNA 纳米单元结构即 DNA Tiles,进而将 Tiles 程式自组装成更复杂的结构并实现一定的功能.

1.1 DNA Tile发展历程及早期构建的周期结构

DNA Tile,顾名思义为 DNA 瓦片,是实现多种多样的复杂结构的基本组成单元.其基本单元结构有四、六、八、十二臂结等多臂结 Tile[3-5]、Double-crossover Tile(DX Tile)[6]、triple-crossover Tile (TX Tile)[7]、4×4 Tile[8]、单链 Tile[9]、DNA 折纸 Tile[10]等.其中,由 Seeman 等设计的结点稳定的多臂结结构形成后结点处较为灵活[3-5],结点处的臂之间的角度各异,难以用于构建具有重复单元的网格结构.多臂结的结构见图2.

图2 多臂结图Fig.2 Multi-armed junction Tiles

为了解决多臂结过于灵活的缺陷,Seeman 等设计了 DX Tile,在双螺旋结构之间引入交叉结构,类似于双螺旋重组过程中交叉连接的中间态结构,形成了具有平行或反平行结构的两种交叉结构.而研究表明,交叉结构中的反平行结构比平行结构要稳定得多.因此, 在随后的 DNA 交叉结构中多采用反平行交叉结构[6].1998 年,Winfree等[11]利用 DX Tile 首次自组装形成二维的晶体网格,并在 AFM 下成像观察,见图3.

图3 DX Tile 和二维晶格网格AFM 图像Fig.3 DX Tile and two-dimensional lattice AFM image

结合 DX Tile 的四条链形成两列双螺旋的设计思想,LaBean 等[7]于 2000 年设计了 TX Tile,如图4所示,由四条链形成三列双螺旋.改变 TX Tile 中四条链的绕行方式可使其结构特征发生变化,从而得到两种不同的结构对应两种不同的状态,通过设计粘性末端的序列使其特异性连接并重复排列形成有凸起的二维晶格结构.另外,通过设计不同的 TX Tile 的结构(如在 TX Tile 中引入哑铃结构)并组合不同的粘性末端序列形成各异的 Tile 单元,每一个单元可以代表一个特定的状态,将特定的状态按照一定的顺序结合起来即可实现一定的计算功能——异或[12].

Yan等[8]则在 DX Tile 的基础上,将其应用于构建一种 4×4 Tile,形成的稳定的 4×4 Tile 可重复自组装成具有重复单元的二维晶格结构.通过改变 Tile 的臂结的长度(包含的碱基对的个数)可以控制结构的曲度,进而控制形成的结构的形状,如纳米带或者平面纳米网格.在 4×4 Tile 的中间的空洞上可以放置蛋白分子,可组装成 DNA 蛋白阵列.将形成的纳米带金属化可以构建纳米导线并测量其导电性,如图5所示.之后,毛承德实验室连续设计了三点星[13]、六点星[14]和六螺旋束[15]结构,并形成了周期性的二维结构.

图5 4×4 Tile 及其应用Fig.5 4×4 Tile and its applications

在 DNA Tile 重复自组装的过程中,Tile 之间的连接主要依靠的是粘性末端的匹配,而Tile 中本身的双螺旋构成的交叉结构只是一个刚性的模块.于是,研究者们希望可以将粘性末端组合起来,减去双螺旋构成的刚性,形成更简洁的 Tile 模块.因此,Liu等[16]在 2006 年利用单链构建了 DX Tile 结构,将 Tile 结构简化到了只包含一条链,并将单链金属化构成 DNA 纳米导线.尹鹏等提出了单链 DNA Tile(SST)简化并代替之前的有交叉结构的 Tile 结构,自组装形成重复排列的大尺寸结构.但是,以单链 DNA Tile 形成的双螺旋之间的连接更自由,不如传统交叉 Tile 紧固,使得形成的结构具有曲度、易卷曲,不能像 Tile 一样平铺,而热力学陷阱会使得卷曲的结构含有最少的重复单元.因此,在不加入边界限制的情况下,单链 DNA Tile 只能形成管状结构[9].SST 的结构如图6(a)所示.Liu等[10]于 2011 年以折纸作为 Tile 自组装成大尺寸的平面,将 4×4 Tile 的 4 个臂结替换成两个十字交叉结合的 DNA 折纸,并在每个方向的末端留出粘性末端.并把折纸Tile 正反交替结合消除曲度问题,形成平面上的重复排列的二维结构.折纸 Tile 的结构如图6(b)所示.

图6 Single Strand Tile 及 DNA 折纸 TileFig.6 Single Strand Tile and DNA origami Tile

1.2 DNA Tile 形成的复杂结构及现状

除了上述的典型 Tile 模块及由 Tile 模块形成的二维周期结构,还有由 DNA Tile 形成的三维的 DNA 纳米结构以及其他具有特殊功能的 DNA 纳米结构.2004 年,Liu等[17]利用灵活的四臂 DNA Tile 设计形成了纳米尺度的具有张拉特性的三角形.Sherman 等[18]则实现了分子行走机器,使二足分子机器按照预先设定的轨道实现行走.Lund 等[19]特异性地编码粘性末端,使得九个四臂结连接形成 3×3 的纳米网格.Park 等使用 16 种不同的四臂结 Tile 连接成 4×4 的纳米网格,并在四臂结 Tile 上修饰 Biotin,构成“DNA”的英文字符.2007 年,Sleiman 等[20]构建了不同形状的 DNA 棱柱用于载药.2009 年,Zheng等[21]设计形成了张拉三角形结构,并连接成三维的 DNA 晶格.2012 年,Wei等[22]使用序列特异单链 DNA 形成了如数字、汉字等复杂的平面结构.Shi等[23]设计了由三、四和六臂的 Tile 自组装成二维的网格结构和三维的纳米管.随后,在原有工作的基础之上,结合分步构建的 sub-tiles 组装了不同半径、不同图案的 DNA 纳米管[24].基于类似的思想,使用不同臂结的 Tiles,Tian等[25]设计了多种 Tiles,并组合成不同的 DNA 纳米笼,如图7(a)所示.而Zhang等[26]则将图案一致的多臂结设计成角度各异的 DNA Tile 模块,排列出不同的网格结构图案,如图7(b)所示.

图7 多臂结 Tile 及其构建的 DNA 纳米结构Fig.7 Multi-armed junction Tile and its self-assembled DNA nanostructures

Ke等[27]利用合成的序列特异的 DNA 短链,设计了一种简单而稳定的构建复杂三维结构,称为“DNA bricks”.研究者将其抽象成为乐高积木,每个“DNA bricks”就对应一个乐高基础模块,数个“DNA bricks”可以用来构建形状各异的 DNA 纳米结构.Xie等[28]则设计了一种新颖的 DNA 模块,并自组装成了三维的 DNA 晶体网格.Tikhomirov等[29]则利用DNA 折纸的高精度的可寻址能力,在折纸的表面上修饰不同的图案,并将呈现不同图案的 DNA 折纸 Tile 通过粘性末端连接,实现图案的拼接,组装成诸如蒙娜丽莎、公鸡等复杂的平面图案,如图8所示.Liu等[30]则构建周期性的二维阵列,平面上含有周期性排列的空腔,通过 DNA 双螺旋配对结合将纳米颗粒绑定到特定的位置上,并固定在空腔内,可以实现纳米颗粒的图案排列.

利用简单的 DNA Tile 构建出如此多较复杂的 DNA 纳米结构,不仅需要深入研究 DNA 结构特性,更需要研究者们投入大量的精力和时间.结构是 DNA Tile 发展的基础,其繁杂的结构构建工作的实现可以极大地促进 DNA Tile 在其他领域的发展和应用.

2 DNA Tile 在计算等领域的发展与应用

DNA 分子计算主要利用分子的物理化学功能、反应的并行性,以及其在纳米尺度的特性和低能耗的特点,设计实现计算模型.而在工程或实验方面的计算模型的实现,主要是利用 DNA 分子与其他分子的相互作用以及 DNA 分子自身形成的结构之间的特异性组合.

2.1 DNA 解决的大型计算问题

1994 年,Adleman[1]利用 DNA 分子解决了七顶点有向图的哈密顿路径问题,并在试管中进行了实验验证.该研究将反应前的 DNA 序列编码为已知的城市,然后将 DNA 序列置于溶液之中,在酶的作用下发生反应相当于运算的过程,再从反应后的体系中利用生物检测技术,筛选出目标 DNA 生成物,即得到问题的解.这一计算方法的新颖之处在于首次用DNA 分子作为计算工具,且所有的解可以同时得到,具有高度的并行性,也突破了传统计算机的存储限制,并大大缩短了计算的时间.

1995年,Lipton[31]采用类似的方法,解决了另外一个 NP 完全问题——SAT(Boolean satisfiability problem)问题.同样地,利用生物技术检测符合的 DNA 链得到问题的解.1996 年,Oliver[32]提出了一种使用 DNA 计算实现布尔矩阵和市属矩阵相乘的方法.2002 年,Braich等[33]解决了 20 变量的 3-SAT 问题,找到了特定的满足条件的 DNA 序列,即合适的解.在这一问题中,有 220≈106 个可能的解.由于选取用于解决问题的特定的图较小,得到的解的数量没有过多,因此,可以延伸到解决 30 个变量的相同问题,而此计算问题也是当时使用非电子手段解决的最大的计算问题.

2.2 DNA Tile 在计算领域的发展及其他方面的研究

尽管利用 DNA 分子本身的可编码性和强大的信息存储能力可用于解决特定的大型计算问题,但是其体系的复杂度之高使得实际中难以进行定量的分析处理.1998 年,Winfree[2]结合“Wang”Tile 的思想,在其博士论文中提出了另外一种使用 DNA 进行计算的思想.利用数条 DNA 链形成一个“Wang”Tile,此 Tile 有四条粘性末端分别有特异性的序列和标识(例如二进制 0 或者 1).可设计构建有限的 Tile 的类型和无限多个重复的 Tile.自主装的过程通常开始于一个“种子”Tile,依次根据粘性末端配对生长下去,类似晶体的形成过程.将计算的数据映射到粘性末端上,运算映射到自组装的连接方式上,可以实现信息的处理及计算.依靠 Tile 可以稳定地实现基本的逻辑运算,且结果可预测甚至直观地显示出来.

2000 年,Mao等[12]首次利用 TX Tile 实现了一维的程式自组装,执行了一个四步的逻辑操作,实现或门运算.2003年,Yan等[8]利用一条长 DNA 链作为脚手架链,DX Tile 中哑铃状结构的有无分别表示为“1”或“0”两种状态,长链 DNA 由穿过 DX Tile 的短链合成,可以编码对应的段为“1”或者“0”,最终由长链和 Tile 结合而成的结构可以在 AFM 下读取,解码其标记的信息.2004 年,Rothemund等[34]使用 DNA Tile 的二维程式自组装实现分子级的细胞自动机,其更新规则为逻辑或,随着图案的增长可以生成一个谢尔拼三角形.2005 年,Winfree等[35]实现了复制和计数的功能.使用 16 条寡核甘酸形成四个“Wang”Tile,分别标识不同的二进制状态, “Wang” Tile 的黏性末端经过特殊的编码之后会特异性结合长成大尺寸的 DNA 晶体,晶体上的 “Wang” Tile 按照二进制计数的方式特异性结合排列,从而实现计数的功能.2009年,Zhang等[36]依据之前成功实现的二进制算数和逻辑运算的实验设计,从理论上提出了比较器、存储器、减法器和除法器系统.2011 年,Qian等[37]设计了一种 Seesaw 门作为合成大尺度电路的基本电路元件.Seesaw 门可以用于有上千个门的大型电路,其缺点是每个门都只能作用一次且功能单一,没有缓存、重置等较复杂的功能.随后,Zhang等[38]又在另一工作中将 DNA Tile 的自组装和 DNA 链置换结合起来,早期的计算工作集中在实现简单的逻辑运算.2017年,Hao等[39]在张拉三角形结构的基础之上改变了组成的链的结构,并在不同的链上添加染料,得到了三种不同的颜色,即三种状态,并实现了状态之间的转换.上述研究工作成功地将 DNA Tile 应用于复杂算法的实现,而也有研究者一直致力于利用 DNA Tile 构建纳米级别的电路,并从不同的方面做出了相应的贡献.

Kolpashchikov组Bayrak等[40]则将金属颗粒包围在 DNA 模块中,并将包含有金属颗粒的 DNA 纳米结构堆积连接成纳米导线,如图9所示.Aryal等[41]则将 DNA tiles 金属化成为纳米导线,采用四点测量技术,利用电子束诱导金属沉积形成探针电极,纳米导线的阻值较低.Joseph等[42]则实现了在富勒烯团簇的辅助下,DNA 短链自组装而成的半导体纳米导线.

图9 DNA 折纸 Tile 组装而成的 DNA 纳米导线[41]Fig.9 Self-assembled DNA nanowire with DNA origami Tile[41]

DNA Tile 的纳米级别的自组装能力和可寻址能力,使其在纳米成像领域同样具备应用潜力.结合 DNA Tile 组装成的纳米结构的高精度的空间排列能力,DNA Tile 组装结构常常被用作分子脚手架引导光学元件的自组装.Sleiman等[43]将金纳米颗粒 AuNPs 修饰在三维 DNA“梯级”结构的表面构成 DNA-AuNPs 的组装模块,重复组装形成的模块阵列实现了 AuNPs 的精确排列,如图10所示.

图10 纳米金颗粒和 DNA 结构复合物[44]Fig.10 Complexes of nano gold particles and DNA structures[44]

Shen等[44]通过螺旋式地排列金纳米颗粒,产生了圆二色性反应.Shen等[45]则利用折纸可以形成形状精确的纳米结构的特性,将 DNA 折纸结构作为模板形成具有等离子特性的完全金属化的纳米结构.Xie等[28]则将金纳米颗粒包含在 DNA Tile 构建的笼子里,笼子中的 DNA 链绕到纳米金的表面,当笼子打开时, 纳米金上留下的不同的来自笼子的链,使得纳米金具备特异性,可以用于纳米成像甚至生物医药.另一种常用于研究的纳米颗粒是荧光半导体量子点,其广泛的光谱吸收范围、光致发光特性、高量子产率、优异的光稳定性和抗化学降解性,使其被广泛应用于生物成像、标记和传感等领域.常用的荧光半导体量子点的排布主要有两种方式:一种是量子点结合在链霉素(streptavidin)上,生物素(biotin)修饰在 DNA 纳米结构上,通过 biotin-streptavidin的结合,将量子点绑定到纳米结构上,但是通常得到的结构会比较大;另外一种方式是将量子点结合到 DNA 单链上,将链接有量子点的 DNA 链结合到 DNA 纳米结构上,这种方式可以得到较高分辨率的发光成像,但是实验步骤比较复杂.有些研究工作则将多种纳米颗粒结合到一个 DNA 纳米结构上,Schreiber 等则将金纳米颗粒和量子点结合到 DNA 折纸结构上,通过设计其空间位置证明了相互之间不存在光子相互作用.Samanta等[46]则通过控制修饰的金纳米颗粒和量子点之间的距离,证明了大的金纳米颗粒在特定的距离内可以增强量子点的荧光效应.Linuma等[47]将量子点固定到 DNA多面体的棱角上,可以用于超分辨三维立体成像,其分辨率轻易就达到了纳米级别,如图11所示.

图11 DNA 多面体成像[48]Fig.11 DNA polyhedron imaging[48]

DNA Tile 构建的纳米结构同样是非常完美的纳米载体,其精细的纳米尺寸、优秀的可寻址能力、无毒性和可降解,使其在众多的纳米材料中脱颖而出,并被应用到生物化学等其他领域,在生物医学领域具有巨大的潜力.Göpfrich等[49]将DNA Tile 自组装形成的纳米棒,用于构建人造脂质双分子层的跨膜通道.由于构建的纳米棒使用了很少的 DNA tile,最终结构外周长只有 5 nm,螺旋间的空腔达到了亚纳米的级别,可以与生物离子通道的大小相比拟.而对其伏安特性的测量,则证明了其具备离子传导特性.Amir等[48]更是证明了 DNA 纳米结构在活体动物体内进行动态计算的能力,并且实现了与门、或门、异或门、半加器等各种各样的逻辑门,成功证明了 DNA纳米结构的生物相容性以及体内稳定性.在医学方面应用同样五花八门,Liu等[50]将 DNA 纳米平台用于肿瘤治疗研究之中,Aryal等[41]将乳糖修饰过的 DNA Tile 纳米结构用于载药,Mela等[51]则以 DNA 折纸 Tile 为载体,以特定的方式投递药物攻击消灭细菌.

DNA Tile 纳米结构的应用涉及到了众多的学科领域,如分子计算、纳米排布、分子操纵、纳米机器人、载药、超分辨等.但是,DNA 纳米技术本身依然存在很多基础的科学问题有待解决,DNA 在实验中表现的部分特性、其结构形成的过程以及部分纳米结构形成的机理等仍处于未知的阶段.

3 总结与趋势展望

经过三十多年的积累,有关 Tile 结构的研究工作非常丰富,从二维结构到三维结构,从周期结构到非周期结构.与 Rothemund 提出的 DNA 折纸相比,DNA Tile 自组装具有以下特点:DNA Tile 可以重复利用几种链自组装成大面积的纳米结构,而折纸的大小则非常有限且使用的链种类随着面积的增大增多,对序列的特异性要求较高;对于同样的结构,Tile 的序列设计更为简洁,但 DNA 折纸由于特应性序列较多则更具有可寻址性.

另一方面,关于 Tile 计算的研究,尤其是复杂运算尚处于理论可行的阶段,而现有的理论计算的设计思想主要基于 Winfree 提出的将 Tile 作为“Wang”Tile 这一基本思想,由此设计的复杂运算会给实验设计带来难以克服的挑战.因为此类复杂运算会由于在实验上对结构设计的要求过高或者实验步骤太多、反应体系过于复杂等,进而导致实验体系过于复杂,结果无法预测,无法精确地实现计算功能.

假使将 Tile 与折纸的各自的优点结合起来构建大尺寸、丰富可寻址的结构,复杂运算在实验设计方面的问题将可能得到解决,已有的复杂理论计算模型则可在实验层面同样可行.或者未来 DNA 纳米技术取得更多突破性进展,足以克服实验设计中的问题时,有关Tile 的计算研究也将会得到进一步的发展.

此外,DNA 计算是一个多学科交叉的研究领域,其涉及生物化学、数学、计算科学、材料等多个学科,显然 DNA 分子特点决定了它无法取代硅芯片.但是,如果可以精确控制各个细胞中的 DNA 分子机器,那么将可以更高效、精确地控制微电子系统.DNA 分子反应过程中存在的错误率和不稳定性使得其同样具备模拟复杂系统的条件.DNA 分子强大的信息存储能力,预示着其在信息领域和密码学上不可小觑的前景.而 DNA 分子反应的并行性也意味着 DNA 计算也许可以用于解决 NP 完全计算问题以及一些传统电子计算机无法完成的计算问题.

尽管在不远的未来,DNA 计算并不能组建或者取代传统的计算,但是 DNA 分子本身具备的特性决定了其在生命科学和计算科学上不可估量的应用前景.

猜你喜欢

双螺旋折纸分子
马尔斯克双螺旋瞭望塔
分子的扩散
health
疯狂大堵车
I Love the Mountains
“精日”分子到底是什么?
米和米中的危险分子
折纸鹦鹉
折纸
折纸图形