转基因高通量检测技术研究进展
2019-08-13李夏莹陈锐刘鹏程
李夏莹 陈锐 刘鹏程
摘要:转基因技术在农业领域的应用与发展日新月异,转基因检测的需求日趋多样化、复杂化,现有的转基因检测技术体系已经很难满足转基因产业快速发展的需要。近年来,以PCR阵列技术、芯片技术、DNA测序技术为代表的转基因高通量检测技术发展迅猛。本文就这一领域的研究进展作一简要概述。
关键词:转基因;高通量;芯片;DNA测序
中图分类号: S188 文献标志码: A 文章编号:1002-1302(2019)01-0027-04
以基因工程为核心的现代生物技术不仅在资源、环境和医药等方面日益发挥着重要作用,在农业领域的应用与发展也十分迅猛。2016年是转基因作物商业化的第21年,转基因作物的种植面积从1996年的170万hm2迅速上升到至2016年的1.851亿hm2,实现了近110倍的增長。2016年也是转基因水果和蔬菜的商业化快速发展元年,美国与加拿大先后批准了改善营养指标的转基因马铃薯和耐储存的转基因苹果的市场销售。2016年,全球26个国家种植了转基因作物,其中包括19个发展中国家和7个发达国家。发展中国家种植的转基因作物占总面积的54%,而发达国家占46%。包括中国和印度在内的8个亚太地区国家,在2016年种植了 1 860万hm2 转基因作物。2016年转基因作物的最大种植国仍然是美国、巴西、阿根廷、加拿大和印度。这5个国家加起来的种植面积达到了全球转基因作物种植面积的91%[1]。截至目前,我国共批准发放7种转基因作物安全证书,分别是耐储存番茄、抗虫棉花、改变花色矮牵牛、抗病辣椒、抗病番木瓜、转植酸酶玉米和抗虫水稻,但只有抗虫棉和抗病毒木瓜实现了大规模商业化生产。二十多年来转基因商业化进程带来的巨大经济、社会效益和显著的生态效益已充分显现,它的推广应用速度之快创造了近代农业科技发展的奇迹。
伴随转基因作物种植面积的激增以及转基因技术研发的日益加速,以及转基因标志制度与监管需求,现有的转基因检测技术体系已经很难满足转基因产业快速发展的需要,影响到转基因产品的安全评价、身份验证、国内监管、进出口检验、企业自控和国际贸易互认,进而影响到国际贸易和国家利益。因此,开发快速、精准、高通量的转基因检测方法,建立相应的检测技术体系是当务之急。现有的高通量转基因检测技术主要包括PCR阵列技术、芯片技术、DNA测序技术。本研究就当前该领域的研究现状做一简要概述。
1 PCR阵列技术
聚合酶链式扩增技术(polymerase chain reaction,PCR)是目前应用最广的转基因方法,包括定性PCR和定量PCR(quantitative PCR,qPCR)。多重PCR(multiplex PCR)可在同一个反应中同时扩增检测2个或多个目标基因序列,具备高通量检测的潜质。但由于多重qPCR之间的引物干扰,同时在1个反应管中设计的多重qPCR最多5~6重,很难满足实际检测需求。
随着转基因农作物种植面积的激增和品种的日益丰富,检测需求也随之扩大,现有的检测方法通量低、过程繁杂,很难满足转基因检测需求。近年来基于qPCR的另一种策略逐步被关注和报道,即利用内含特定引物组合的96孔或384孔预制板用于高通量转基因筛查。预制板内含有指定浓度的特异引物,形成规律性的矩阵,可同时用于同一模板DNA的多重检测。该方法也被称为实时定量PCR阵列/芯片法(real-time PCR array),结合已知的转基因信息列表,这种转基因检测策略能够有效地简化试验操作,增加检测通量。
PCR阵列技术最早由欧盟联合研究中心的研究人员于2009年建立。针对欧盟转基因法规与检测需求,依据Decision Support System与JRC GMO-Matrix中的信息,将各转化体、外源基因与元件设计成最简化的检测组合,利用欧盟验证的事件特异性定量PCR方法,可同时在7种作物中检测39种转化事件。这种策略能够有效地增加检测通量同时降低人为犯错的风险。后续的研究证明这种策略能够有效地检测加工食品与饲料产品的转基因成分,在转基因检测实验室中被迅速推广和使用。
Mano等基于96孔预制板设计了可同时检测15种转基因玉米、4种转基因大豆和2种转基因油菜的qPCR阵列,共计包含21个事件特异性、13个外源插入基因和5个内源基因,检测低限LOD在0.01%~0.25%之间[2]。
Cottenet等基于384孔板整合了47套qPCR引物和探针,每个孔中进行3重qPCR反应,可同时检测7个样本中的47个靶标基因,方法特异性良好,检测低限LOD低于0.045%[3]。
欧盟联合实验室基于96孔板开发了最新版本的转基因检测qPCR阵列,包含7个内源基因、5个元件、1个构建特异性和3个事件特异性,涵盖80多个转基因品系,可满足同时检测欧盟授权的全部转基因农作物[4]。其中,96孔预制板由Eurogentec SA公司制作,检测特异性由Life Technologies公司完成。该方法相对老版本有很大改进,进一步满足了转基因检测需求[5-7]。
2 芯片技术
基因芯片(microarray)又称DNA芯片(DNA microarray),是芯片技术中研究最早、最为成熟、应用最广泛的产品。基因芯片技术通过固体在基质表面的上千个特定探针,能够一次性准确地对样品中不同种类的DNA序列进行定性、定量筛查,具有高通量、集成化和自动化的特点。相对核酸印迹杂交技术,基因芯片技术操作简单、自动化程度高、检测效率高,可应用于基因突变检测、多态性分析、基因表达谱测定、功能基因组研究等领域。
基因芯片技术应用于转基因检测的报道很多,相对PCR技术,芯片检测的成本较高,但在检测通量方面具备巨大优势。
Leimanis等开发了Silverquant芯片检测方法用于转基因检测,该方法利用硝酸盐沉淀来检测生物素化的扩增产物,在灵敏度和可信度方面要优于荧光染料;该方法覆盖7个事件特异性、4个转基因元件和5种内源基因,LOD在0.03%~0.3%之间[8]。Tengs等设计了包含了约4万个探针的Tilling芯片,涵盖绝大多数植物转化用的载体序列,可用于筛查未知转化事件[9]。Hamels等评价了Eppendorf公司的DualChip转基因检测芯片,该产品可一次性进行3个平行试验,包含12个元件、7个植物内源基因、11个事件特异性和6个control对照。该芯片可检测到1%的植物成分、0.1%的GMO,准确率大于95%[10]。Kim等针对19个转化事件开发了DNA芯片,包含27个探针用于检测内源基因、35S启动子、事件特异性和内源基因;其中事件特异性检测包括2个GM大豆、13个GM玉米、3个GM油菜和1个GM棉花,方法检测低限约为0.5%[11]。Lee开发的转基因检测芯片包含4个植物内源基因、2个元件和7个外源基因(P35S、tNOS、pat、bar、epsps1、epsps2、pmi、cry1Ac和cry3B),方法特异性良好,灵敏度均可达到0.5%[12]。Turkec等针对3个GM大豆和9个GM玉米开发检测芯片,共计设计了1 830个60 nt的探针,最终筛选出33个探针可用于区分12个GMO事件,并开发了1套数据算法来实现最大的检测通量和灵敏度。作者利用该芯片可直接对土耳其市场流通的食品进行转基因定量检测,检测灵敏度小于1%[13]。
3 高通量测序技术
近年来,以Roche/454、Illumina/Solexa和ABI/SOLiD为代表的高通量测序技术(next-generation sequencing,NGS)极大地推动了以动物、植物和微生物为研究对象的生命科学研究[14-17]。相对于传统DNA测序方法(Sanger法),NGS因其革命性的技术进步,可在很短的时间内产出千万倍的测序数据,从而实现对一个物种的基因组或转录组的整体覆盖和全貌精细研究。目前以NGS技术为基础的全基因组测序、基因组重测序、微生物宏基因组测序、转录组测序、小分子RNA测序和表观基因组测序等手段已广泛应用于医学、农业、食品、生态等多个研究领域。NGS技术革新了以基因为研究对象的分子生物学及相关学科研究,策略上实现了由钓鱼式到撒网式的点到面的升级,极大地推动了以基因組学与转录组学为代表的“组学”技术发展,使从全基因组尺度开展生命科学研究常态化[18-20]。
目前国内外基于NGS技术开展转基因检测的研究报道还比较少。Tengs等利用转录组测序与差减计算的方法,在转基因拟南芥中发现了外源插入片段,理论上证明了NGS技术能够实现转基因检测[21]。但由于RNA的时空特异性表达与可变剪接等问题,使RNA的序列复杂度极高,直接导致该研究中基于RNA序列的差减分析存在大量的假阳性结果。Yang等利用NGS技术对转基因水稻T1c-19和TT51-1进行的分子特征鉴定研究中指出,基于盲检模型与20倍全基因组测序深度,只能部分识别外源DNA插入片段,并且结果中存在转基因元件的假阳性判定[22]。
对于大片段转基因的分子鉴定试验中,染色体步移策略是无法获取全长信息的,而NGS技术在转基因分子鉴定领域具备强大优势。Zhang等利用NGS技术对转基因牛中的1个150 kb的人类乳铁蛋白进行了分子鉴定,一步获得外源基因全长序列、整合位点和拷贝数等信息,结果通过了事件性PCR和FISH试验杂交验证[23]。
Barbau-piednoir等利用NGS技术对1个未授权的GM枯草杆菌进行测序,通过Blast比对发现目的序列,然后设计引物用于事件性qPCR检测。结果证明,这是有效的针对未授权GMO的检测策略[24]。Fritsch等利用NGS技术检测转基因玉米的纯合性,结果证实NGS策略与qPCR相比更具优势,不需要试验步骤的优化,统计学上也更加可靠[25]。Sahebi等对NGS技术在植物遗传育种中的应用进行了综述指出,NGS能够解决很多传统办法不能解决的问题,但同时大数据的安全存储和繁杂的数据分析是对研究者的极大挑战[26]。Willems等对NGS技术应用于转基因检测中的数据分析方法进行了讨论,作者以转基因水稻为例进行了测序和分析,提出了用于计算P值的公式和用于阳性结果认定的算法,为NGS技术在GMO检测中的应用提供了量化标准[27]。
由于主流转基因农作物的基因组较大(例如大豆、玉米等),全基因组无差别测序需要很高的数据量才能实现有效的全基因组覆盖深度,这直接导致了昂贵的测序成本、较高的生物信息学计算负荷和大量无法避免的假阳性结果。所以,全基因组无差别重测序策略很难实现有效的转基因检测,在测序之前增加特异性富集步骤十分必要。特异性的富集指定区段的DNA序列,而后再进行深度测序能够对特定的基因组区域或感兴趣的位点进行针对性研究,相比于全基因组无差别测序,测序目的性更强,测序成本更低,是高效的NGS研究手段[28]。近年来逐步发展并不断成熟的相关测序技术包括:外显子组测序(whole exome sequencing,WES)[29]、染色质免疫共沉淀技术(chromatin immunoprecipitaion,ChIP)[30]、降解组测序(degradome seuqencing)[31]、DNA甲基化测序(methylated DNA sequencing)[32]和酶切位点相关DNA测序(restriction-site associated DNA sequencing,RAD-seq)[33]等等。
在NGS测序之前先采取目的片段富集的策略,已在微生物和医学领域存在很多报道[34-36]。在转基因检测领域,针对已知元件或外源基因的上下游序列进行特异性富集,是利用NGS技术检测(未授权)GMO的主要策略。目前按起始基因组DNA的打断方式可分为3类:直接扩增、随机打断和酶切特异性打断。具体方法包括:(1)长模版快速扩增基因组DNA末端法(long template-rapid amplification of genomic DNA ends,LT-RADE),该方法由RACE技术演化而来,先利用特异性引物单向外扩,PolyC加尾后再用巢式引物扩增,可获得插入位点的上下文序列[37];(2)线性扩增介导的PCR法(linear amplification-mediated PCR,LAM-PCR),该方法利用生物素标记特异探针,可以利用磁珠富集一链cDNA,使用随机引物获得二链cDNA后,连接接头再进行巢式PCR扩增可获得目标片段[38];(3)非限制性线性扩增介导的PCR法(nonrestrictive linear amplification-mediated PCR,nrLAM-PCR),该方法是LAM-PCR的变种,其中二链cDNA并不合成,直接使用单链DNA接头连接一链cDNA后进行扩增,该方法的缺点是单链DNA连接效率较低[35];(4)位点特异PCR法(SiteFinding-PCR),该方法属于半随机引物扩增策略,直接利用基因组上的特异序列与基因特异引物配对,可直接扩增获得目的片段,一般获得序列长短不一[39];(5)座位特异PCR法(locus-finding PCR,LF PCR),该方法与SiteFinding-PCR方法类似,但在巢式PCR富集步骤中利用已知序列设计接头用于磁珠富集以提高效率,缺点是该方法只能单向扩增获得一侧序列,一般序列长度小于500 bp[40];(6)高通量的插入追踪测序法(high-throughput insertion tracking by deep sequencing,HITS),该方法先片段化基因组DNA,经末端修复后连接测序接头,再结合基因特异引物可扩增插入位点的边界序列[36];(7)随机片段PCR扩增法(randomly broken fragment PCR,RBF-PCR),该方法与HITS类似,基因组DNA片段化后加PolyA尾,全部连接测序“Y”形接头,再经巢式PCR扩增后可获得目标序列[41];(8)AT接头法(AT-linker PCR),基因组DNA经酶切片段化后加A尾,再利用特异引物与OligodT复合引物配对可扩增目的片段[42];(9)环状接头法(loop-linker PCR),该方法与AT接头法类似,酶解基因组DNA后直接使用带黏性末端的环状接头与之连接,再经巢式PCR扩增可获得目的片段[43];(10)TOPO载体连接PCR法(TOPO vector ligation PCR),该方法与A-T linker法类似,但使用一个平末端载体来代替A-T linker,使用载体的上引物与目的基因特异引物配对,可扩增目的片段[44];(11)探针杂交测序法(Southern-by-Sequencing,SbS),利用已知目标序列设计~70 nt探针,用于杂交富集DNA片段再测序,该方法不需要PCR扩增,但必须要预制插入位点附近的序列,不适用于未知转基因检测[45-46]。
總的来说,目前NGS技术在GMO检测上的应用还很有限,DNA富集策略必须依赖预知元件,还没有非常便捷、低成本的靶标富集方法。GM检测一般需要0.1%的灵敏度和高通量需求,最好能够分析混合物种样本(例如玉米和大豆混样),要想实现上述技术要求,NGS技术还需要在低成本、高效和宽靶标等方向有所进步。NGS技术为GM检测打开了新的大门,虽然还存在很多技术瓶颈,但可以预见在不久的未来,随着测序成本的不断下降,NGS技术必将成为转基因检测领域的主流技术。
参考文献:
[1]ISAAA. Global status of commercialized Biotech/GM crops:2016[J]. ISAAA Brief,2016(52).
[2]Mano J,Harada M,Takabatake R,et al. Comprehensive GMO detection using real-time PCR array:single-laboratory validation[J]. Journal of AOAC International,2012,95(2):508-516.
[3]Cottenet G,Blancpain C,Sonnard V,et al. Development and validation of a multiplex real-time PCR method to simultaneously detect 47 targets for the identification of genetically modified organisms[J]. Analytical and Bioanalytical Chemistry,2013,405(21):6831-6844.
[4]Rosa S F,Gatto F,Angers-Loustau A,et al. Development and applicability of a ready-to-use PCR system for GMO screening[J]. Food Chemistry,2016,201(1):110-119.
[5]Querci M,Foti N,Bogni A,et al. Real-time PCR-based ready-to-use multi-target analytical system for GMO detection[J]. Food Analytical Methods,2009,2(4):325-336.
[6]Kluga L,Bulcke M V D,Folloni S,et al. A ready-to-use multi-target analytical system for GM soy and maize detection for enforcement laboratories:INTECH Open Access Publisher[J]. Soybean-Applications,2011,3(4):225-240
[7]Kluga L,Folloni S,Bulcke M V D,et al. Applicability of the “real-time PCR-based ready-to-use multi-target analytical system for GMO detection” in processed maize matrices[J]. European Food Research and Technology,2012,234(1):109-118.
[8]Leimanis S,Hernandez M,Fernandez S,et al. A microarray-based detection system for genetically modified (GM) food ingredients[J]. Plant Molecular Biology,2006,61(1/2):123-139.
[9]Tengs T,Kristoffersen AB,Berdal KG,et al. Microarray-based method for detection of unknown genetic modifications[J]. BMC biotechnology,2007,7(1):91.
[10]Hamels S,Leimanis S,Mazzara M,et al. Microarray method for the screening of EU approved GMOs by identification of their genetic elements[R/OL]. Eurpean Commission:Joint Research Centre. Italia,2007[2017-08-20]. http://biotech jrc it/home/docs htm.
[11]Kim J H,Kim S Y,Lee H,et al. An event-specific DNA microarray to identify genetically modified organisms in processed foods[J]. Journal of Agricultural and Food Chemistry,2010,58(10):6018-6026.
[12]Lee S H. Screening DNA chip and event‐specific multiplex PCR detection methods for biotech crops[J]. Journal of the Science of Food and Agriculture,2014,94(14):2856-2862.
[13]Turkec A,Lucas S J,Karacanli B,et al. Assessment of a direct hybridization microarray strategy for comprehensive monitoring of genetically modified organisms(GMOs)[J]. Food Chemistry,2016,194(3):399-409.
[14]Meyer M,Stenzel U,Hofreiter M. Parallel tagged sequencing on the 454 platform[J]. Nature Protocols,2008,3(2):267-278.
[15]Quail M A,Kozarewa I,Smith F,et al. A large genome centers improvements to the Illumina sequencing system[J]. Nature Methods,2008,5(12):1005-1010.
[16]Turcatti G,Romieu A,Fedurco M,et al. A new class of cleavable fluorescent nucleotides:synthesis and optimization as reversible terminators for DNA sequencing by synthesis[J]. Nucleic Acids Research,2008,36(4):26-40.
[17]Housby J N,Southern E M. Fidelity of DNA ligation:a novel experimental approach based on the polymerisation of libraries of oligonucleotides[J]. Nucleic Acids Res,1998,26(18):4259-4266.
[18]Mardis E R. The impact of next-generation sequencing technology on genetics[J]. Trends in Genetics,2008,24(3):133-141.
[19]Schuster S C. Next-generation sequencing transforms todays biology[J]. Nature Methods,2008,5(1):16-18.
[20]Shendure J,Ji H. Next-generation DNA sequencing[J]. Nature Biotechnology,2008,26(10):1135-1145.
[21]Butenko M A,Jon B,Arne H J,et al. Characterization of unknown genetic modifications using high throughput sequencing and computational subtraction[J]. BMC Biotechnology,2009,9(1):87.
[22]Yang L,Wang C,Holst-Jensen A,et al. Characterization of GM events by insert knowledge adapted re-sequencing approaches[J]. Scientific Reports,2013,3(5):115-131.
[23]Zhang R,Yin Y,Zhang Y,et al. Molecular characterization of transgene integration by next-generation sequencing in transgenic cattle[J]. PLoS One,2012,7(11):50348-50368.
[24]Barbau-piednoir E,de Keersmaecker S C,Delvoye M,et al. Use of next generation sequencing data to develop a qPCR method for specific detection of EU-unauthorized genetically modified Bacillus subtilis overproducing riboflavin[J]. BMC Biotechnology,2015,15(1):103.
[25]Fritsch L,Fischer R,Wambach C,et al. Next-generation sequencing is a robust strategy for the high-throughput detection of zygosity in transgenic maize[J]. Transgenic Research,2015,24(4):615-623.
[26]Sahebi M,Hanafi M M,Azizi P,et al. Suppression subtractive hybridization versus next-generation sequencing in plant genetic engineering:challenges and perspectives[J]. Molecular Biotechnology,2015,57(10):880-903.
[27]Willems S,Fraiture M A,Deforce D,et al. Statistical framework for detection of genetically modified organisms based on next generation sequencing[J]. Food Chemistry,2016,192:788-798.
[28]Metzker M L. Sequencing technologies - the next generation[J]. Nature Reviews Genetics,2010,11(1):31-46.
[29]Ng S B,Turner E H,Robertson P D,et al. Targeted capture and massively parallel sequencing of 12 human exomes[J]. Nature,2009,461(7261):272-306.
[30]Wang X,Elling A A,Li X,et al. Genome-wide and organ-specific landscapes of epigenetic modifications and their relationships to mRNA and small RNA transcriptomes in maize[J]. The Plant Cell Online,2009,21(4):1053-1069.
[31]German M A,Pillay M,Jeong D H,et al. Global identification of microRNA-target RNA pairs by parallel analysis of RNA ends[J]. Nature Biotechnology,2008,26(8):941-946.
[32]Li N,Ye M,Li Y,et al. Whole genome DNA methylation analysis based on high throughput sequencing technology[J]. Methods,2010,52(3):203-212.
[33]Baird N A,Etter P D,Atwood T S,et al. Rapid SNP discovery and genetic mapping using sequenced RAD markers[J]. PLoS One,2008,3(10):e3376.
[34]Volpicella M,Leoni C,Costanza A,et al. Genome walking by next generation sequencing approaches[J]. Biology,2012,1(3):495-507.
[35]Gabriel R,Eckenberg R,Paruzynski A,et al. Comprehensive genomic access to vector integration in clinical gene therapy[J]. Nature Medicine,2009,15(12):1431-1456.
[36]Gawronski J D,Wong S M,Giannoukos G,et al. Tracking insertion mutants within libraries by deep sequencing and a genome-wide screen for Haemophilus genes required in the lung[J]. Proceedings of the National Academy of Sciences,2009,106(38):16422-16467.
[37]Spalinskas R,van den Bulcke M,van den Eede G,et al. LT-RADE:an efficient user-friendly genome walking method applied to the molecular characterization of the insertion site of genetically modified maize MON810 and rice LLRICE62[J]. Food Analytical Methods,2013,6(2):705-755.
[38]Schmidt M,Zickler P,Hoffmann G,et al. Polyclonal long-term repopulating stem cell clones in a primate model[J]. Blood,2002,100(8):2737-2774.
[39]Tan G,Gao Y,Shi M,et al. SiteFinding-PCR:a simple and efficient PCR method for chromosome walking[J]. Nucleic Acids research,2005,33(13):122-145.
[40]Thirulogachandar V,Pandey P,Vaishnavi C S,et al. An affinity-based genome walking method to find transgene integration loci in transgenic genome[J]. Analytical Biochemistry,2011,416(2):196-201.
[41]Xu W,Shang Y,Zhu P,et al. Randomly broken fragment PCR with 5′ end-directed adaptor for genome walking[J]. Scientific Reports,2013,34(15):115-135.
[42]Trinh Q,Xu W,Shi H,et al. An AT linker adapter polymerase chain reaction method for chromosome walking without restriction site cloning bias[J]. Analytical Biochemistry,2012,425(1):62-85.
[43]Trinh Q,Shi H,Xu W,et al. Loop‐linker PCR:an advanced PCR technique for genome walking[J]. IUBMB Life,2012,64(10):841-845.
[44]Kanizay L B,Jacobs T B,Gillespie K,et al. Parrott WA. HtStuf:High-throughput sequencing to locate unknown DNA junction fragments[J]. The Plant Genome,2015,8(1):67-98
[45]Lepage E′,Zampini E′,Boyle B,et al. Time-and cost-efficient identification of T-DNA insertion sites through targeted genomic sequencing[J]. PLoS One,2013,8(8):70912-70935.
[46]Zastrow-Hayes G M,Lin H,Sigmund A L,et al. Southern-by-sequencing:a robust screening approach for molecular characterization of genetically modified crops[J]. The Plant Genome,2015,8(1):25-49.