侧翼序列获取技术研究进展

2022-04-24徐纪明朱建树李梦真胡晗毛传澡

遗传 2022年4期

徐纪明，朱建树，李梦真，胡晗，毛传澡

侧翼序列获取技术研究进展

徐纪明，朱建树，李梦真，胡晗，毛传澡

浙江大学生命科学学院植物生物学研究所，杭州 310058

侧翼序列是指染色体中特定位点两侧的DNA序列，包含着候选基因、转录调控、染色体结构、生物安全等信息，在基因组学研究中具有重要的作用。侧翼序列获取技术主要应用于启动子和增强子等调控序列的克隆、鉴定T-DNA或转座子插入位点、染色体步移、全基因组空隙填补等，是结构基因组研究以及功能基因组研究的重要手段，在转基因动植物鉴定及安全管理等方面具有重要应用。随着分子生物学的发展，目前已经建立了许多侧翼序列的获取方法，依据技术原理可以分为质粒拯救法、反向PCR法、外源接头介导PCR法、半随机引物PCR法和基因组重测序法等5大类。本文系统总结了近年来侧翼序列获取技术的研究进展，并对这些技术的原理以及应用情况进行了较为系统的综述，为侧翼序列信息的获取提供参考。

侧翼序列；质粒拯救；反向PCR；外源接头PCR；半随机引物PCR；基因组重测序

侧翼序列是指染色体中特定DNA序列位点两侧的未知DNA序列。侧翼序列包括目的基因的启动子、增强子等调控序列、T-DNA或转座子插入位点等，在许多植物及动物功能基因组学研究中，确定侧翼序列是开展后续研究的前提。例如在筛选鉴定T-DNA激活标签群体及T-DNA插入失活群体时，最关键的步骤是通过分析T-DNA插入位点信息，锁定目标基因；在转基因研究中特别是转基因应用方面，外源序列插入位点是每个转基因新材料的特定标签，在进行转基因材料安全性评估及环境释放申请时，必须按要求提供每个转基因材料的T-DNA插入位点精确信息[1]。另外侧翼序列获取技术还应用于染色体步移、全基因组空隙填补等，在现代分子生物学研究方法中占有举足轻重的地位，是结构基因组研究以及功能基因组研究的重要手段[2]。

目前有多种方法可获得侧翼序列，其基本原理都是基于已知外源或者内源序列信息，通过PCR扩增来获得未知的侧翼序列。根据是否需要酶切处理可以分为两类：第一类方法先使用合适的限制性内切酶酶切处理基因组DNA，进行回收连接后再通过PCR扩增、测序获得目标序列，如质粒拯救法、反向PCR法、外源接头介导PCR法属于这类方法；另一类方法无需酶切处理，直接通过PCR扩增侧翼序列，如半随机引物PCR法。近年来，随着高质量基因组重测序技术的快速发展和成本的降低，使用基因组重测序技术获得DNA侧翼序列已成为基因组较小的物种获得侧翼未知序列的主要手段。然而，基因组较大的物种侧翼序列的获得仍以前述技术为主。本文系统总结了不同侧翼序列获取技术的原理，对各种方法进行了深入的分析比较，同时结合目前的技术，进一步探讨并展望该技术领域的未来发展趋势。

1 质粒拯救法

质粒拯救法是一种获取侧翼序列的经典分子生物学方法，由Perucho[3]在1980年首创。其基本原理是利用合适的限制性内切酶消化基因组DNA后，连入克隆载体并转化大肠杆菌()，利用已知序列设计引物，通过PCR筛选阳性克隆后测序获得侧翼序列。质粒拯救法比较直接，不受分离侧翼序列长短的制约，其目的性和准确性都很强，但是酶切位点的选择受到载体与已知序列的限制，需要大量的连接、转化和后期目标克隆的筛选等工作，实验操作流程繁琐、假阳性高，限制因素较多。为克服该缺点，在转基因载体中加入大肠杆菌的复制起始位点和抗性位点，将基因组DNA酶切后自身连接环化，转化大肠杆菌，使用抗性位点筛选阳性克隆后进行测序，大大提高了该方法的成功率[4](图1)。早期拟南芥()、水稻(L.)等模式植物T-DNA插入突变体侧翼序列的获得大都是基于质粒拯救法来实现。如李志邈等[5]通过质粒拯救法获得了拟南芥激活标记突变体库的T-DNA插入位点；Li等[6]通过质粒拯救法分离到了水稻T-DNA插入突变体库的插入位点序列。质粒拯救法在动物中也有应用，如Mizobuchi等[7]通过质粒拯救法扩增了小鼠()下丘脑和胎盘的生长释放激素基因5′侧翼序列。

2 反向PCR法

反向PCR法应用于克隆侧翼序列可追溯到1988年，Ochman等[8]利用该方法首次成功克隆了已知序列的侧翼序列，并报道了具体研究方法。其原理是使用一种在已知序列中没有识别序列的限制性内切酶消化基因组DNA后，进行片段自身环化连接，然后用环化的DNA作为模板，利用PCR的方法向已知序列的外侧进行扩增。由于环化后的片段在PCR退火过程中难以解链，研究者在经典的反向PCR方法的基础上，对环化序列在已知序列的位置进行一步酶切，使片段线性化，从而提高了PCR效率。另外通过优化PCR反应体系，提高了PCR的灵敏度并降低了非特异性(图2)。为解决反向PCR得到的侧翼序列较短的问题，Kohda和Taira[9]发展出Bridged inverse PCR方法，该方法使用一段已知序列的“bridge DNA”与DNA连接环化，再用已知序列和桥式序列设计的引物进行PCR，部分解决了限制性酶切位点和已知序列距离过大无法扩增的问题。

图1 质粒拯救法原理

根据参考文献[4]总结绘制。

反向PCR法是基于PCR技术克隆侧翼序列的基础。与质粒拯救法相比，反向PCR省去了载体连接、克隆等操作步骤。但是在具体实施过程中，除目标片段环化外，其他不同片段之间也存在随机连接而形成多连体，导致PCR假阳性的产生，需要通过后续繁琐的Southern blot技术进一步鉴定[8]，这在一定程度上限制了反向PCR的发展与应用。

利用反向PCR法在不同物种中获得侧翼序列信息的实例很多。例如Chen等[10]克隆了小麦(L.)花粉特异性基因启动子序列；Forester等[11]克隆了豌豆()种子脂肪加氧酶基因启动子约800 bp片段；韩志勇等[12]克隆了转基因水稻的T-DNA侧翼序列；Ohshima等[13]成功克隆了人() T淋巴病毒(human T-cell lymphotropic virus, HTLV)的插入位点。

图2 反向PCR方法原理

根据参考文献[8, 11]总结绘制。

3 外源接头PCR法

外源接头PCR法利用酶切消化基因组DNA后，使用连接酶在片段末端加入接头，根据接头序列和已知序列设计引物进行PCR扩增来获得未知序列。外源接头既可以是单链接头，也可以是双链接头，根据接头的不同，后续的实验方法也有很大的不同。

为解决反向PCR法扩增片段太短的问题，Jones[14]报道了单链接头PCR-锅柄PCR法(panhandle PCR)：在消化后的基因组DNA的3′端连上与已知序列反向互补的单链寡核苷序列，在后续实验中只有含有已知序列的片段才能与寡核苷酸序列退火形成一个锅柄状结构，使用酶将锅柄状结构末端补平后，利用已知序列设计巢式引物通过PCR得到侧翼序列。该方法中要形成合适的锅柄状结构难度较大，实验成功率低。Myrick和Gelbart[15]报道了改进的Universal fast walking (UFW)方法，该方法无需酶切、连接反应，先用特异性引物序列进行线性扩增得到产物后，使用5′端与已知序列反向互补，3′端带有简并核苷酸N10的简并引物进行第二轮线性扩增，扩增产物补平、变性后简并引物与已知序列形成锅柄结构，再通过巢式PCR得到侧翼序列(图3)。该方法速度、可靠性提高，但是简并引物的PCR扩增效率不高。Wang等[16]报道了Self-formed adaptor PCR (SEFA PCR)方法，使用低温(35℃)促进简并引物与模板结合，特异性引物扩增时使用高温条件(70℃)，然后再使用较低退火温度(55℃)，经过几轮扩增，形成锅柄状的茎环结构，从而扩增出未知侧翼序列。总之，单链接头受限于锅柄状的茎环结构的形成，限制了该方法的应用。

双链接头PCR法用能够产生粘性末端的限制性内切酶切割基因组DNA，通过DNA连接酶将与末端配对的接头与DNA片段相连，最后通过一条特异性引物和一条根据接头序列设计的引物进行PCR扩增，即可得到包含侧翼序列的片段。由于基因组DNA两端都会与接头相连，因此PCR过程中与接头配对的引物会产生大量非特异性扩增，如何排除接头引物PCR产物污染成为该类方法主要解决的问题。Shyamala等[17]使用两个限制性内切酶切割后的载体作为接头，与经过相同双酶切的基因组DNA片段连接，用载体通用引物和根据已知片段设计的特异引物进行扩增，得到了已知序列的侧翼序列。该方法由于通用引物只与载体一侧结合，特异性较好，但实验操作步骤繁琐，成功率低，而且用合适的人工接头替代载体，使得该方法应用较窄。Lagerstrom等[18]使用根据已知序列设计的生物素标记特异引物，进行PCR单链扩增，通过链霉亲和素包被的磁珠分离捕捉带有生物素标记的单链产物来提高特异性；对接头末端进行修饰或者去磷酸化，抑制第一轮PCR过程中与接头配对的引物与模板的结合，也能够达到提高特异性的目的[19,20]。Siebert等[21]提出了抑制PCR法(suppression PCR)，该方法将接头设计成一种反向互补序列，在Touch-down PCR过程中，较低退火温度下，接头引物PCR形成的非特异性产物会因为反向互补序列而形成类似反向PCR的锅柄状结构无法继续扩增，只有包含有目标片段的连接产物(一端是特异性引物序列，另一端是接头序列的片段) PCR反应才能正常进行，从而达到提高特异性的目的。Tan等[22]对该方法进行了改良，利用简并引物PCR代替基因组酶切连接过程，低温条件下简并引物和目标片段特异性引物进行PCR扩增，接着进行巢式PCR反应，非特异扩增由于茎环结构的形成被抑制，从而得到目标片段。Wang等[23]在此原理基础上，设计了Fusion primer and nested integrated PCR (FPNI-PCR)，开发了一套包含有巢式引物的简并引物。具体方法如下：在第一轮PCR反应中，先高退火温度下对目标片段进行线性扩增，提高目标片段模板量，然后低退火温度下简并引物和特异性引物进行指数扩增得到的PCR产物进行二轮巢式PCR，扩增出所需的侧翼序列。该方法具有扩增片段长、耗时短、特异性高等优点。另外对接头连接过程进行控制，只有包含目标片段的PCR产物才能与接头连接，如T接头连接的PCR等，也能达到提高特异性的目的。

图3 Universal fast walking(UFW)方法原理

根据参考文献[15]总结绘制。

外源接头介导PCR法在分离基因启动子与T-DNA插入位点等研究上得到广泛应用。Garcia- Cerdan等[24]利用外源接头PCR成功克隆了衣藻()叶绿体发育异常T-DNA突变体的插入位点。Hsu等[25]筛选到1个拟南芥发育异常T-DNA突变体，并利用抑制PCR技术克隆了其突变基因。Currall等[26]通过抑制PCR技术确认了1个与人前列腺癌和听力相关的基因，并对该基因功能进行了研究。Liu等[27]使用FPNI-PCR分离得到蒲公英()基因启动子。

4 半随机引物PCR法

依赖限制性酶切消化基因组DNA的方法在获得侧翼序列过程中得到了广泛的应用，但受到限制性内切酶种类和酶切效率的限制，使得实验步骤复杂而且成功率不高，半随机引物PCR法的发明克服了上述问题。

Parker等[28]提出可以通过已知序列的特异引物与一系列随机引物来获得T-DNA侧翼序列。理论上只要随机引物足够多，就能够与特异引物一起扩增出需要的产物序列，但是不可避免的是该方法会产生大量的假阳性片段，如何在得到需要的片段的同时尽可能的降低假阳性是该方法首先要解决的问题。Liu和Whittier[29]报道了一种利用引物退火温度不同来减少非特异扩增，并利用位于已知序列片段的巢式引物来提高产物特异性的方法，即：热不对称交错PCR法(TAIL-PCR)。由于特异引物与随机引物的退火温度不同，因此在PCR的前几个循环使用高的退火温度时，只有特异引物退火延伸，如该特异片段可以在PCR的前期得到富集，在经过几轮低特异性循环和较低特异性循环得到的PCR产物后，经过稀释，再使用巢式引物进行第二轮、第三轮PCR扩增，从而达到特异性扩增的目的(图4)。该方法由于操作简单、成功率高，在启动子、T-DNA插入位点扩增方面得到了广泛应用。Gong等[30]成功克隆了2个水稻转基因群体的T-DNA插入位点；Jaser等[31]成功得到了鲤鱼()基因5′端873 bp启动子序列；Feng等[32]通过该方法获得家蚕()蚕茧异常突变体的外源序列插入位点，成功克隆了蚕丝合成关键基因；Guan等[33]成功获得了烟曲霉() T-DNA插入突变体的侧翼序列。

由于TAIL-PCR使用短的随机引物，随机引物自身会产生大量的非特异性扩增，而且TAIL-PCR产生的产物一般小于500 bp，难以实现大片段扩增。为此，Liu等[34]对TAIL-PCR方法进行了改进，产生了(hi) TAIL-PCR法(high-efficiency (hi) TAIL-PCR)。该方法重新设计了随机引物，在随机引物3′端加入4个固定的碱基，使得随机引物在染色体上的匹配随机性降低，增加了PCR的产物长度，并利用抑制PCR的原理，在随机引物5′端加入16 bp与特异引物5′端一致的序列，在第二轮PCR的过程中，短片段由于自身环化无法得到扩增。使用该方法，侯娜等[35]获得了抗虫棉() 06N-119的外源DNA插入位点的侧翼序列；Chen等[36]从大豆()基因组中分离出了干旱应答元件结合蛋白基因的启动子序列。

图4 TAIL-PCR方法原理

根据参考文献[29]总结绘制。

5 基因组重测序法

基于PCR技术获得侧翼序列的方法由于步骤多、效率低，对实验操作人员的技术和熟练程度要求较高，并且无法批量获取侧翼未知DNA序列。此外，由于转基因过程中T-DNA序列有一定概率发生缺失，可能导致无法基于已知序列信息获得插入位点侧翼序列[37]。因此，迫切需要应用新的技术来克服上述技术体系的不足。近年来，随着高通量测序技术的发展，测序通量提高、成本大幅降低，使得全基因组测序成为了常规的技术，于是利用全基因组重测序技术获得侧翼序列的方法应运而生并得到广泛应用。

转基因株系基因组DNA经超声破碎后，建库进行全基因组双端测序。含有插入位点侧翼信息的序列经测序，以基因组序列和载体序列作为参照，使用常规的基因组比对软件如BWA(Burrows-Wheeler Aligner)MEM软件[38]等进行比对。可以将测序产生的pair read分成3种类型：基因组/基因组，T-DNA/ T-DNA，基因组/T-DNA，T-DNA侧翼序列信息存在于第三种类型中。利用基因组/T-DNA序列信息，通过PCR验证和一代测序即可得到插入位点信息(图5)。该方法步骤简单，只需要提取DNA，后续的生物信息学分析算法也已成熟，而且可以批量获取，大大提高了研究效率。Guo等[39]对2个转基因大豆株系分别进行重测序，测序深度为21×，经过分析成功获得了2个株系的插入位点，并使用PCR技术进行了确认。Polko等[40]将4个不同拟南芥转基因株系DNA混合后，进行全基因组重测序，由于测序深度不够，只得到了其中3个株系的插入位点，作者认为测序深度是影响实验结果的重要因素。徐纪明等[41]对该方法进行了改良，将3份水稻转基因材料基因组DNA混池重测序后，直接使用载体序列作为参照序列，并对软件参数进行了优化，成功获得了3份转基因材料的全部T-DNA插入位点，而且发现其中1份材料为2拷贝插入。由于载体序列很小(10 kb左右)，序列结构简单，分析时间大大减少，准确度也得到提高。Sun等[42]首先用载体序列作为参考基因组进行分析筛选，得到的reads再用转化体基因组参考序列进行第二轮分析，根据比对结果确定插入位点的侧翼序列和位置信息，并对位置信息进行了注释，最后将分析软件封装做成了可以一站式分析插入位点侧翼序列的软件——TDNAscan，并使用该软件成功得到了一系列拟南芥T-DNA突变体的插入位点。

图5 基因组重测序确定侧翼序列方法原理

根据参考文献[39～41]总结绘制。

除了测序深度对插入位点侧翼序列获得有一定影响外，双向二代测序长度的限制(双向测序长度一般为300 bp左右)会对插入位点的获得造成极大困难(如果插入位点位于基因组中的长重复序列区)。Peng等[43]使用TAIL-PCR和二代测序技术对转基因玉米(L.)SK12-5的插入位点进行了分析，虽然得到了T-DNA侧翼序列，但是由于该序列位于长重复序列区，无法确定插入位点的染色体位置。三代测序方法虽然准确率较低，但是测序长度最长可以达到100 kb，在确定长重复序列区位置时具有很大的优势。Peng等[43]使用Nanopore测序技术顺利得到了SK12-5的插入位点位于9号染色体82,329,568～82,379,296 bp之间。Li等[44]先纯化不同转基因大豆株系基因组中含有插入序列的片段，PCR扩增后混合，使用一次三代测序成功获得了所有株系的插入位点。Nicholls等[45]也利用Nanopore测序技术成功得到了鼠生殖细胞系中Oct4:EGFP在基因组上的插入位点，并对转基因拷贝数和转基因产生的基因组结构变异进行了分析。

6 侧翼序列获取技术比较与展望

随着分子生物学的发展，侧翼序列的获取方法也不断进步，且效率越来越高，但不同方法各有优势和不足，不同方法的比较见表1。质粒拯救、反向PCR、接头PCR等方法在发明之初在侧翼序列获取方面发挥了关键作用，但是由于这些方法操作复杂，非特异性产物较多，获取片段长度有限等问题，应用范围越来越小；半随机引物PCR法自动化程度高，操作简单，特异性高，需要时间短等特点，在一些复杂基因组或无参考基因组物种侧翼序列获取中仍具有无可替代的作用；基因组重测序方法由于门槛低、成本低、成功率高，逐渐成为获得侧翼序列的主要方法，并在相关研究中发挥越来越重要的作用[39,40,41]。

表1 侧翼序列获取技术比较

随着基因组学的发展和测序技术的进步，基因组重测序方法在侧翼序列获取上体现出了极大的优势，但仍有许多方面需要改进。首先，已有研究证明水稻T-DNA插入位点可以只使用载体序列作为参考序列分析得到[41]，暗示无参考基因组物种的T-DNA插入位点也可以使用基因组重测序方法得到，但仍需要进一步实验验证。其次，流程化的分析软件或网站的使用极大方便了侧翼序列的获取，但是到目前为止，使用基因组重测序获取侧翼序列的方法仍缺乏相关的分析软件或网站，TDNAscan仅可用于模式植物拟南芥[42]，因此其他物种相关的软件或网站应是未来研究的方向。最后，使用基因组重测序方法获取侧翼序列的实例中未发现有基因组重排、大片段缺失及载体骨架序列信息等报道，可能目前的分析方法无法获得这些类型的插入位点，需要开发新的生物信息学算法，以更精确、全面的获取插入位点信息。

[1] Wei Q, Ao Y, Yang MM, Chen T, Han H, Zhang XJ, Wang R, Xia QJ, Jiang FF, Li Y. Identification of genomic insertion of dominant-negativemutation transgenes in Wuzhishan pig using whole genome sequencing method., 2021, 43(12): 1149–1158.

魏强, 奥岩, 杨漫漫, 陈涛, 韩虎, 张兴举, 王然, 夏秋菊, 姜芳芳, 李勇. 利用全基因组重测序技术鉴定五指山猪突变体转基因插入位点. 遗传, 2021, 43(12): 1149–1158.

[2] Liu B, Su Q, Tang MQ, Yuan XD, An LJ. Progress of the PCR amplification techniques for chromosome walking., 2006, 28(5): 587–595.

刘博, 苏乔, 汤敏谦, 袁晓东, 安利佳. 应用于染色体步移的PCR扩增技术的研究进展. 遗传, 2006, 28(5): 587–595.

[3] Perucho M, Hanahan D, Lipsich L, Wigler M. Isolation of the chicken thymidine kinase gene by plasmid rescue., 1980, 285(5762): 207–210.

[4] Zhang JC, Zhang XW, Dai XZ. Construction of rescue plasmid with T-DNA tag., 2007, 35(34): 11016–11018.

张金谌, 张学文, 戴雄泽. 质粒拯救型T-DNA标签质粒的构建. 安徽农业科学, 2007, 35(34): 11016–11018.

[5] Li ZM, Zhang HK, Cao JS, He ZH. Construction of an activation tagging library ofand cloning for mutant genes., 2005, 31(5): 499–506.

李志邈, 张海扩, 曹家树, 何祖华. 拟南芥激活标记突变体库的构建及突变体基因的克隆. 植物生理与分子生物学学报, 2005, 31(5): 499–506.

[6] Li AH, Zhang YF, Wu CY, Tang W, Wu R, Dai ZY, Liu GQ, Zhang HX, Pan XB. Screening for and genetic analysis on T-DNA-inserted mutant pool in rice., 2006, 33(4): 319–329.

[7] Mizobuchi M, Frohman LA. Rapid amplification of genomic DNA ends., 1993, 15(2): 214–216.

[8] Ochman H, Gerber AS, Hartl DL. Genetic applications of an inverse polymerase chain reaction., 1988, 120(3): 621–623.

[9] Kohda T, Taira K. A simple and efficient method to determine the terminal sequences of restriction fragments containing known sequences., 2000, 7(2): 151–155.

[10] Chen L, Tu ZM, Hussain J, Cong L, Yan YJ, Jin L, Yang GX, He GY. Isolation and heterologous transformation analysis of a pollen-specific promoter from wheat (L.)., 2010, 37(2): 737–744.

[11] Forster C, Arthur E, Crespi S, Hobbs SL, Mullineaux P, Casey R. Isolation of a pea () seed lipoxygenase promoter by inverse polymerase chain reaction and characterization of its expression in transgenic tobacco., 1994, 26(1): 235–248.

[12] Han ZY, Wang XQ, Shen GZ. Cloning of foreign gene's flanking sequences in transgenic rice by inverse PCR., 2001, 17(2): 27–32.

韩志勇, 王新其, 沈革志. 反向PCR克隆转基因水稻的外源基因旁侧序列. 上海农业学报, 2001, 17(2): 27–32.

[13] Ohshima K, Mukai Y, Shiraki H, Suzumiya J, Tashiro K, Kikuchi M. Clonal integration and expression of human T-cell lymphotropic virus type I in carriers detected by polymerase chain reaction and inverse PCR., 1997, 54(4): 306–312.

[14] Jones DH. Panhandle PCR., 1995, 4(5): S195–S201.

[15] Myrick KV, Gelbart WM. Universal fast walking for direct and versatile determination of flanking sequence., 2002, 284(1–2): 125–131.

[16] Wang SM, He J, Cui ZL, Li SP. Self-formed adaptor PCR: A simple and efficient method for chromosome walking., 2007, 73(15): 5048–5051.

[17] Shyamala V, Ames GF. Genome walking by single- specific-primer polymerase chain reaction: SSP-PCR., 1989, 84(1): 1–8.

[18] Lagerström M, Parik J, Malmgren H, Stewart J, Pettersson U, Landegren U. Capture PCR: efficient amplification of DNA fragments adjacent to a known sequence in human and YAC DNA., 1991, 1(2): 111–119.

[19] Arnold C, Hodgson IJ. Vectorette PCR: a novel approach to genomic walking., 1991, 1(1): 39–42.

[20] Kilstrup M, Kristiansen KN. Rapid genome walking: a simplified oligo-cassette mediated polymerase chain reaction using a single genome-specific primer., 2000, 28(11): E55.

[21] Siebert PD, Chenchik A, Kellogg DE, Lukyanov KA, Lukyanov SA. An improved PCR method for walking in uncloned genomic DNA., 1995, 23(6): 1087–1088.

[22] Tan GH, Gao Y, Shi M, Zhang XY, He SP, Chen ZL, An CC. SiteFinding-PCR: a simple and efficient PCR method for chromosome walking., 2005, 33(13): e122.

[23] Wang Z, Ye SF, Li JJ, Zheng B, Bao MZ, Ning GG. Fusion primer and nested integrated PCR (FPNI-PCR): a new high-efficiency strategy for rapid chromosome walking or flanking sequence cloning., 2011, 11: 109.

[24] García-Cerdán JG, Schmid EM, Takeuchi T, McRae I, McDonald KL, Yordduangjun N, Hassan AM, Grob P, Xu CS, Hess HF, Fletcher DA, Nogales E, Niyogi KK. Chloroplast Sec14-like 1 (CPSFL1) is essential for normal chloroplast development and affects carotenoid accumulation in., 2020, 117(22): 12452–12463.

[25] Hsu PJ, Tan MC, Shen HL, Chen YH, Wang YY, Hwang SG, Chiang MH, Le QV, Kuo WS, Chou YC, Lin SY, Jauh GY, Cheng WH. The nucleolar protein SAHY1 is involved in pre-rRNA processing and normal plant growth., 2021, 185(3): 1039–1058.

[26] Currall BB, Chen M, Sallari RC, Cotter M, Wong KE, Robertson NG, Penney KL, Lunardi A, Reschke M, Hickox AE, Yin YB, Wong GT, Fung J, Brown KK, Williamson RE, Sinnott-Armstrong NA, Kammin T, Ivanov A, Zepeda-Mendoza CJ, Shen J, Quade BJ, Signoretti S, Arnos KS, Banks AS, Patsopoulos N, Liberman MC, Kellis M, Pandolfi PP, Morton CC. Loss of LDAH associated with prostate cancer and hearing loss., 2018, 27(24): 4194–4203.

[27] Liu Q, Li L, Cheng HT, Yao LX, Wu J, Huang H, Ning W, Kai GY. The basic helix-loop-helix transcription factor TabHLH1 increases chlorogenic acid and luteolin biosynthesis inKitag., 2021, 8(1): 195.

[28] Parker JD, Rabinovitch PS, Burmer GC. Targeted gene walking polymerase chain reaction., 1991, 19(11): 3055–3060.

[29] Liu YG, Whittier RF. Thermal asymmetric interlaced PCR: automatable amplification and sequencing of insert end fragments from P1 and YAC clones for chromosome walking., 1995, 25(3): 674–681.

[30] Gong WK, Zhou Y, Wang R, Wei XL, Zhang L, Dai Y, Zhu Z. Analysis of T-DNA integration events in transgenic rice., 2021, 266: 153527.

[31] Jaser SKK, Perazza CA, Fávaro LCL, Goto MA, de Oliveira AM, Hallerman E, Hilsdorf AWS. Identification and analysis of a novel microsatellite marker within the growth hormone gene promoter of(Characiformes: Characidae) detected by TAIL-PCR., 2021, 37(3): 439–448.

[32] Feng XB, Zheng ZW, Zhang X, Gu J, Feng QL, Huang LH. Discovering genes responsible for silk synthesis inby piggyBac-based random insertional mutagenesis., 2019, 26(5): 821–830.

[33] Guan LY, Lu RY, Wu ZJ, Zhong GW, Zhang SZ. Precise expression ofis crucial for asexual development, virulence, and survival of aspergillus fumigatus., 2020, 5(5): e00771–20.

[34] Liu YG, Chen YL. High-efficiency thermal asymmetric interlaced PCR for amplification of unknown flanking sequences., 2007, 43(5): 649–650, 652, 654 passim.

[35] Hou N, He HQ, Dong M, Xu RQ, Wan YS, Jin WJ, Liu HB. The exogenous gene integrated structure and event-specific detection of insect resistant transgenic cotton., 2012, 10(3): 317–323.

侯娜, 贺辉群, 董美, 徐荣旗, 宛煜嵩, 金芜军, 刘好宝. 转基因抗虫棉外源DNA插入整合结构分析和转化事件特异性检测方法的建立. 分子植物育种, 2012, 10(3): 317–323.

[36] Chen M, Xu ZS, Xia LQ, Li LC, Cheng XG, Dong JH, Wang QY, Ma YZ. Cold-induced modulation and functional analyses of the DRE-binding transcription factor gene,, in soybean (L.)., 2009, 60(1): 121–135.

[37] Schouten HJ, Vande Geest H, Papadimitriou S, Bemer M, Schaart JG, Smulders MJM, Perez GS, Schijlen E. Re-sequencing transgenic plants revealed rearrangements at T-DNA inserts, and integration of a short T-DNA fragment, but no increase of small mutations elsewhere., 2017, 36(3): 493–504.

[38] Li H, Durbin R. Fast and accurate short read alignment with Burrows-Wheeler transform., 2009, 25(14): 1754–1760.

[39] Guo BF, Guo Y, Hong HL, Qiu LJ. Identification of genomic insertion and flanking sequence ofandtransgenes in soybean using whole genome sequencing method., 2016, 7: 1009.

[40] Polko JK, Temanni MR, van Zanten M, van Workum W, Iburg S, Pierik R, Voesenek LACJ, Peeters AJM. Illumina sequencing technology as a method of identifying T-DNA insertion loci in activation-taggedplants., 2012, 5(4): 948–950.

[41] Xu JM, Hu H, Mao WX, Mao CZ. Identifying T-DNA insertion site(s) of transgenic plants by whole-genome resequencing., 2018, 40(8): 676–682.

徐纪明, 胡晗, 毛文轩, 毛传澡. 利用重测序技术获取转基因植物T-DNA插入位点. 遗传, 2018, 40(8): 676–682.

[42] Sun L, Ge YB, Sparks JA, Robinson ZT, Cheng XF, Wen JQ. TDNAscan: a software to identify complete and truncated T-DNA insertions., 2019, 10: 685.

[43] Peng C, Mei YT, Ding L, Wang XF, Chen XY, Wang JM, Xu JF. Using combined methods of genetic mapping and nanopore-based sequencing technology to analyze the insertion positions ofandtransgenes in maize., 2021, 12: 690951.

[44] Li SJ, Jia SG, Hou LL, Nguyen H, Sato S, Holding D, Cahoon E, Zhang C, Clemente T, Yu B. Mapping of transgenic alleles in soybean using a nanopore-based sequencing strategy., 2019, 70(15): 3825–3833.

[45] Nicholls PK, Bellott DW, Cho TJ, Pyntikova T, Page DC. Locating and characterizing a transgene integration site by Nanopore sequencing., 2019, 9(5): 1481– 1486.

Progress on methods for acquiring flanking genomic sequence

Jiming Xu, Jianshu Zhu, Mengzhen Li, Han Hu, Chuanzao Mao

Flanking genomic sequences refer to the DNA sequences flanking specific sites of known sequences in chromosome, which contain information such as candidate genes, transcriptional regulation, chromosome structure, and biosafety, and play an important role in genomics research. Flanking sequence acquisition technologies are mainly used in the cloning of regulatory sequences such as promoters and enhancers, identification of T-DNA or transposon insertion sites, chromosome walking, genome-wide gap filling, etc. It is an important means of structural genomics research and functional genomics research. It is applied in the identification of transgenic plants and animals and their safety management. With the development of molecular biology, many methods for obtaining flanking sequences have been established, including plasmid rescue, inverse PCR, ligation-mediated PCR, semi-random primer PCR, whole-genome resequencing etc. In this review, wesummarize and compared different methods for acquiring flanking genomic sequence. The principles and research progress of each approach are discussed.

flanking sequence; plasmid rescue; inverse PCR; ligation-mediated PCR; semi-random primer PCR; whole-genome resequencing

2021-12-02;

2022-03-08;

2022-03-25

国家自然科学基金项目(编号：32002121)资助[Supported by the National Natural Science Foundation of China (No. 32002121)]

徐纪明，博士，助理研究员，研究方向：作物磷高效分子机制。E-mail: xujiming@zju.edu.cn

毛传澡，博士，教授，博士生导师，研究方向：作物养分高效利用的生理及分子机制。E-mail: mcz@zju.edu.cn

10.16288/j.yczz.21-415

(责任编委: 宿振起)