绒毛状烟草和林烟草全长cDNA文库构建及EST序列分析
2018-05-14孙榕陈明丽解敏敏孙玉合龚达平
孙榕 陈明丽 解敏敏 孙玉合 龚达平
摘 要:表达序列标签(EST)广泛应用于基因功能研究和分子标记开发。以普通烟草两个二倍体祖先种绒毛状烟草(Nicotiana tomentosiformis, TT)和林烟草(Nicotiana sylvestris, SS)多个组织为试验材料,使用CloneMiner cDNA文库构建方法构建了均一化全长cDNA文库,测序并进行序列拼接、功能注释、进化分析和标记开发。绒毛状烟草和林烟草均一化全长cDNA文库容量分别为0.72×106和1.12×106 pfu/mL,重组率分别约为94%和93%,插入片段平均长度为1.4 kb。测序获得20 953条EST序列,拼接为10 504个unigenes。与普通烟草EST序列混合拼接,产生34 450条contigs,123 511条singletons,烟草异源四倍体中T和S基因与绒毛状烟草、林烟草之间的相似性远高于两个二倍体祖先种之间。预测获得104 915个编码序列,其中73 670个序列包含功能结构域,81% unigenes在番茄中具有同源基因。鉴定了11 869个微卫星位点(SSR)和25 209个单核苷酸多态性位点(SNP)。这些数据信息对于烟草基因功能研究和分子育种具有重要价值。
关键词:烟草;cDNA文库;EST;SNP;SSR
中图分类号:S572.03 文章编号:1007-5119(2018)05-0009-08 DOI:10.13496/j.issn.1007-5119.2018.05.002
Abstract: Expressed sequence tags (EST) are widely used in gene function research and molecular marker development. In order to obtain a large number of EST sequences of tobacco, a variety of tissues and organs from Nicotiana tomentosiformis and Nicotiana sylvestris were taken as plant materials, and two full-length enriched cDNA libraries were constructed using the CloneMiner cDNA method. The EST sequences were used for sequence assembly, functional annotation, phylogenetic analysis and molecular marker development. The normalized full-length cDNA libraries were constructed successfully from Nicotiana tomentosiformis and Nicotiana sylvestris. The titer were 0.72×106 and 1.12×106 pfu/mL, respectively, and the recombination rates were approximately 94% and 93%, respectively. The average length of inserted cDNA fragments was 1.4 kb. 20 953 ESTs were generated from the full-length enriched cDNA libraries, and assembled into 10 504 unigenes. All of the ESTs from allopolyploid tobacco (Nicotiana tabacum) and its two diploid progenitors, Nicotiana tomentosiformis and Nicotiana sylvestris were assembled, resulting in 34 450 contigs and 123 511 singletons. The global assembly showed that the transcripts from the resident T- and S-genomes in the allotetraploid nucleus were more closely related to their diploid homologs than they were to each other. In total, 104 915 coding sequences were identified, of which 73 670 sequences contained functional domains. Approximately 81% of the unigenes had homologs in tomato. Furthermore, we found 11 869 putative simple sequence repeats (SSR) and 55 369 single nucleotide polymorphisms (SNPs). The EST resources have important implications for gene function research and molecular breeding.
Keywords: tobacco; full-length cDNA; EST; SNP; SSR
煙草属于茄科植物,不仅是重要的经济作物,也是研究异源多倍体的重要模式物种[1-3]。普通烟草为异源四倍体(2n=48),可能是由两个二倍体野生烟草绒毛状烟草(N. tomentosiformis,TT, 2n=24)和林烟草(N. sylvestris, SS, 2n=24)种间杂交后通过染色体加倍形成[4-5]。普通烟草基因组大小约4.5 G[6],重复序列比例高[7-8],具有高度的复杂性。基于TGI的基因标签数据,BINDLER等[9]开发SSR标记构建了一张高密度的普通烟草遗传图谱。WU等[10]利用单拷贝的直系同源基因(single-copy conserved ortholog set,COSII)和简单重复序列(simple sequence repeat,SSR)标记,比较了两个二倍体祖先烟草和普通烟草的遗传图谱,发现普通烟草相比二倍体经历了更多的染色体重排。最近,采用二代测序技术相继完成了林烟草、绒毛状烟草和普通烟草的基因组测序[11-14]。
全长cDNA序列分析是获得基因全长信息的最直接有效的一种方法。全长cDNA克隆具有完整的转录序列,包括编码区(CDSs)和非翻译区(UTRs),这有助于基因组测序完成后基因的准确预测。烟草EST序列信息是开展基因功能研究[15-16]、分子标记开发[17]、基因芯片开发[18]等的重要基础。美国烟草基因组计划、欧洲烟草测序项目组和日本烟草公司等构建了普通烟草品种不同发育时期的多个cDNA文库,分别获得80 783条、58 969条和65 102条EST序列。二倍体祖先烟草的基因组草图已经测序完成,但是关于全长转录本的信息还很少,因此开展烟草全长cDNA研究具有重要价值。本研究构建了两个二倍体祖先种绒毛状烟草和林烟草的全长cDNA文库,高效测序并获得了大量EST,利用生物信息学工具结合普通烟草EST进行了拼接,并对序列分化和基因功能进行了分析,开发了大量的SNP和SSR标记,为烟草的基因功能研究奠定了基础。
1 材料与方法
1.1 cDNA文库构建
绒毛状烟草和林烟草种植在中国农业科学院烟草研究所温室。收集幼苗、根、茎、叶和花等组织储存在–80 ℃备用。使用Trizol 提取(Invitrogen) 各组织总RNA,全长cDNA采用GenRacerTM试剂盒富集(Invitrogen)。cDNA文库使用CloneMiner II 试剂盒(Invitrogen)构建并插入到载体pDONR222,再通过基因组饱和杂交,构建均一化文库。为了评估文库的质量,随机挑取60个克隆通过载体特异性引物PCR扩增检测,通过琼脂糖凝胶电泳估计插入片段大小。
1.2 EST测序、组装和功能注释
随机挑取cDNA克隆在ABI3730DNA分析仪(Applied Biosystems公司)上从5′进行单向测序。利用PHRED[19]将峰值信息转换为序列文件。利用LUCY和Seqclean程序过滤低质量区域、载体序列和poly(A)序列,得到高质量序列[20]。使用CAP3程序在95%以上相似性和50 bp以上重叠的参数下进行聚类拼接[21]。将起始密码子上游的序列定义为5′-UTRs。使用BLASTN软件将unigenes与Sol数据库中绒毛状烟草和林烟草的CDS序列进行比对,分析unigenes的5′-UTR长度。所有的unigenes使用ESTScan程序搜索开放阅读框(open reading frames, ORF)[22-23]。采用interproscan程序进行GO注释[24]。拟南芥基因的GO注释信息来自TAIR 数据库[25]。
1.3 SSR标记和SNP标记挖掘
使用MISA程序分析微卫星序列(microsatellite,SSR)。重复单元为2~6个核苷酸碱基,最小重复次数分别是:2碱基重复单元为6次,3碱基重复单元为5次,4碱基重复单元为4次,5碱基重复单元为3次,6碱基重复单元为3次。两个相邻的SSR重复单元之间间隔最大长度设置为100 bp。利用Perl脚本AutoSNP对CAP3拼接产生的比对序列进行SNP鉴定[26]。
2 結 果
2.1 cDNA文库构建和EST测序组装
利用不同组织的混合RNA,构建了二倍体野生烟草绒毛状烟草和林烟草的全长均一化文库,文库容量分别为0.72×106和1.12×106 pfu/mL,重组率分别约为94%和93%,文库插入片段平均大小约为1.4 kb。随机挑选22 525个克隆进行5′末端测序,共产生20 953条EST序列。EST序列的长度在100~
908 bp之间,平均长度为671 bp。其中10 450条EST序列来源于绒毛状烟草(GenBank序列号:JZ959365-JZ969801),10 503条EST序列来源于林烟草(GenBank序列号:JZ948884-JZ959364)。通过聚类拼接,绒毛状烟草获得4805个unigenes,包括1202个contigs和3603个singletons ;林烟草获得5699个unigenes,包括1410个contigs和4289个singletons。其中,88%的绒毛状烟草unigenes和84%林烟草unigenes序列中EST序列数量都少于6条,说明均一化文库的冗余度相对较低。将unigenes与基因组中预测的CDS序列比较来鉴定UTR区域。绒毛状烟草和林烟草中,2917个基因和3838个基因具有完整的ATG起始序列,UTR长度分布如图1,大多数基因的UTR长度小于200。
2.2 EST组装
从Genbank数据库中,搜集获得了普通烟草40多个文库共计334 382条 EST序列,多于1000条EST序列的文库信息如表1[15-16,18,27-30]。这些文库来源包括烤烟品种K326、Hicks Broadleaf、白肋烟Burley 21、TN86、香料烟Samsun和雪茄烟Petit Havana等在不同条件下的根、花、叶、腺毛、花等组织和细胞。
将普通烟草与林烟草和绒毛状烟草共计347 022条EST序列进行组装,获得了34 450条contigs和123 511条singletons(共157 961个unigenes)。contigs的长度从107到3502 bp,平均长度为879.6 bp。每个contig包含的EST数量平均为14.8条(最多的为1158条),平均每个碱基的覆盖度为4.4倍。
3个烟草属物种混合组装构成的contig数量分布如图2。普通烟草、绒毛状烟草和林烟草共有EST成员的contig是376条;绒毛状烟草与普通烟草共同组成的contig是3103条;林烟草与普通烟草共同组成的contig是2761条;普通烟草特异的contigs 有28 210条。二倍体烟草没有特异的contig,说明二倍体烟草没有与普通烟草分化程度很大的特异基因序列。这些结果表明,普通烟草中T基因组和S基因组与二倍体基因组的相似程度远比它们之间的相似程度更高。但是,在绒毛状烟草和林烟草中仍然分别有2904和2225条EST序列属于单一序列,没有与普通烟草的EST构成contig。可能与文库质量、表达差异和测序错误等原因造成的文库偏好有关。
2.3 基因预测、功能注释及与其他植物基因的比较分析
通过ESTScan程序在104 915个unigenes(66.4%)中发现了开放阅读框(ORF),平均长度为524 bp(最小片段为150 bp,最长片段为3486 bp)。这些预测的烟草ORF序列长度相比基因组预测的CDS长度要短,可能是没有拼接出基因全长造成的。小部分unigene可以与NR数据库有较好的比对结果,说明ESTScan并没有鉴定准确,可能与ESTScan程序使用拟南芥的参数有关。
在104 915个ORF序列中,73 670个蛋白产物至少包含一个注释的Pfam结构域。其中,出现次数最多的结构域是Pkinase (Pfam: PF00069),这是一个包含蛋白激酶催化功能的结构保守的蛋白结构域。其他的结构域包括RNA识别基序(RNA recognition motif)、亮氨酸重复序列(leucine rich repeat)、WD40重复序列(WD40 repeat)、锌指结构域(Zinc finger domains)[32]和细胞色素P450。大量研究表明,这些结构域在其他植物中也广泛存在。
GO注释将基因功能分为细胞组分、分子功能和生物学过程3个部分和各个小类。将烟草和拟南芥的GO注释结果比较发现,整体上两个物种的基因功能分类是相似的,但在辅助转运蛋白(auxiliary transport protein)、蛋白标签(protein tag)、金属伴侣(metallochaperone)等功能类别中具有显著差异(图3)。将预测的104 915个烟草基因的氨基酸序列与拟南芥、水稻、杨树、大豆、葡萄和番茄的蛋白质数据库进行比对分析(E值>1E-10)。结果表明(图4),预测的烟草基因氨基酸序列与茄科植物,特别是番茄基因具有高度的相似性,仅有19%的烟草蛋白序列在番茄中没有相似序列;而在水稻中烟草有33%的蛋白没有序列相似性。图4的曲线也反应出了烟草与其他物种的分化程度,与同属于茄科的番茄关系最近。
2.4 SSR标记的鉴定
从152 891个unigenes中共鉴定了10 424个SSR位点。绝大多数序列仅含有1个SSR位点,1209个基因具有多个SSR位点。共计开发了11 869个烟草EST-SSR标记,包括二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸的SSR类型。其中,945个SSR位点是复合形式。二核苷酸和三核苷酸的SSR类型为主要类型,共占72.51%。二核苷酸重复序列有4434条、三核苷酸重复序列有4054条、四核苷酸重复序列有516条、五核苷酸重复序列有1273条,六核苷酸重复序列有1592条。烟草EST-SSR重复单元类型统计发现,在二核苷酸SSRs中AG/CT类型的重复序列最多,占二核苷酸重复序列的56.2%。在三核苷酸SSRs中AAG/CTT类型的重复序列是最丰富的,占总数的38.9%(表2)。
重复单元重复次数最多的是二核苷酸SSRs,AG/CT类型的重复单元最大重复数量为53次(表3)。
本研究获得的烟草EST序列共计94.75 Mb,SSR的密度为10 kb分布12.5个SSRs,频率约为6.8%。这些新的标记可用于遗传连锁图谱构建和比较基因组研究。
2.5 SNP标记的鉴定
从33 734个contigs中共鉴定103 027个SNP和24 760个插入/删除(insertions/deletions,indels)位点。测序错误导致基于EST序列鉴定的SNP可信度比较低,而具有较高冗余度和共分离值的SNP最有可能是真实的遗传变异[31-32]。使用两个或两个以上的冗余评分进行过滤后,获得42 355个SNP标记和11 014个InDel标记,其中SNP标记类型包括26 294个转换和16 061个颠换。大多数过滤后的SNPs是从包含4个以上序列的contigs中鉴定的。由于普通烟草是异源四倍体,基因组包含许多高度同源的基因。通过删除SNP频率大于20 SNP/kb的位点,共获得25 209个SNP。
3 讨 论
由于烟草是异源四倍体,基因组重复序列比例高,2013年烟草科研工作者采用新一代测序技术结合BAC-to-BAC策略完成了普通烟草及其二倍体祖先绒毛状烟草和林烟草的基因组测序。但对烟草基因组中基因的预测和功能的注释远落后于基因组测序。烟草EST数据是烟草基因组进行基因预测和功能注释的重要信息,目前还没有开展绒毛状烟草和林烟草全长cDNA文库构建及EST 测序的研究报道。本研究采用CloneMiner cDNA文库构建方法构建了两个二倍体祖先绒毛状烟草和林烟草的均一化全长cDNA文库。相比转录组测序,更有利于发现基因的全长信息,为研究烟草基因功能提供了一条重要途径。此外,全长基因是评估烟草基因组测序组装质量的重要指标之一。本研究获得的绒毛状烟草和林烟草EST数据有效的评估了中国烟草基因组计划组装拼接的二倍体烟草基因组,基本覆盖了所有基因[12-14]。
通过EST测序和拼接,绒毛状烟草和林烟草分别获得4805个和5699个unigenes。与烟草基因组预测的7万个基因相比[12-14],本研究获得的基因数量还相对有限,两个全长cDNA文庫还需要挑选更多的克隆进行EST测序。Genbank数据库中,报道了大量的普通烟草EST数据,为烟草基因组提供了大量的基因信息。通过与普通烟草EST序列混合拼接,获得了157 961个unigenes,预测获得104 915个编码序列。这些数据对于烟草基因组的基因预测和功能研究具有非常重要的价值。
分子标记在烟草基因定位和品种改良上发挥着重要作用[33-36]。本研究鉴定了11 869个微卫星位点(SSR)和25 209个单核苷酸多态性位点(SNP)。相比传统的分子标记,SSR和SNP标记具有数量多、分布广泛的优点。目前,最高密度的两个烟草遗传图谱分别是用SSR和SNP标记构建的[17,37]。本研究基于EST数据鉴定的大量SSR和SNP标记,为开展遗传图谱构建、基因定位克隆和分子标记辅助育种打下了良好基础。
4 結 论
本研究构建了烟草二倍体祖先种绒毛状烟草和林烟草的均一化全长cDNA文库,获得了超过2万条EST序列信息和10 504个unigenes,并且64.3%的unigenes具有5'-UTR。将这些序列与以前报道的普通烟草EST序列进行组装和基因注释,解析了异源四倍体同源基因间的分化程度,鉴定了10 424个SSR标记和25 209个SNP/indel标记。这些数据为烟草基因组注释、基因功能研究和分子育种工作提供了非常有价值的信息。
参考文献
[1]LAYTEN DAVIS D, NIELSEN M T: Tobacco: production, chemistry and technology[M]. Malden: Blackwell Science Ltd, 1999.
[2]MUELLER L A, SOLOW T H, TAYLOR N, et al. The SOL genomics network: a comparative resource for solanaceae biology and beyond[J]. Plant Physiology,2005, 138(3): 1310-1317.
[3]TREMBLAY R, WANG D, JEVNIKAR A M, et al. Tobacco, a highly efficient green bioreactor for production of therapeutic proteins[J]. Biotechnology Advances, 2010, 28(2): 214-221.
[4]LIM K Y, MATYASEK R, KOVARIK A, et al. Genome evolution in allotetraploid Nicotiana[J]. Biological Journal of the Linnean Society, 2004, 82(4): 599-606.
[5]CLARKSON J J, LIM K Y, KOVARIK A, et al. Long-term genome diploidization in allopolyploid Nicotiana section Repandae (Solanaceae) [J]. The New Phytologist, 2005, 168(1): 241-252.
[6]ARUMUGANATHAN K, EARLE E D. Nuclear DNA content of some important plant species[J]. Plant Molecular Biology Reporter, 1991, 9(3): 208-218.
[7]ZIMMERMAN J L, GOLDBERG R B. DNA sequence organization in the genome of Nicotiana tabacum[J]. Chromosoma, 1977, 59(3): 227-252.
[8]KENTON A, PAROKONNY A S, GLEBA Y Y, et al. Characterization of the Nicotiana tabacum L. genome by molecular cytogenetics[J]. Molecular and General Genetics MGG, 1993, 240(2): 159-169.
[9]BINDLER G, PLIESKE J, BAKAHER N, et al. A high density genetic map of tobacco (Nicotiana tabacum L.) obtained from large scale microsatellite marker development[J]. Theoretical and Applied Genetics, 2011, 123(2): 219-230.
[10]WU F, EANNETTA N T, XU Y, et al. COSII genetic maps of two diploid Nicotiana species provide a detailed picture of synteny with tomato and insights into chromosome evolution in tetraploid N. tabacum[J]. Theoretical and Applied Genetics, 2010, 120(4): 809-827.
[11]RENNY-BYFIELD S, CHESTER M, KOVARIK A, et al. Next generation sequencing reveals genome downsizing in allotetraploid Nicotiana tabacum, predominantly through the elimination of paternally derived repetitive DNAs[J]. Molecular Biology and Evolution, 2011, 28(10): 2843-2854.
[12]SIERRO N, BATTEY J N, OUADI S, et al. The tobacco genome sequence and its comparison with those of tomato and potato[J]. Nature Communications, 2014, 5: 3833.
[13]SIERRO N, BATTEY J N, OUADI S, et al. Reference genomes and transcriptomes of Nicotiana sylvestris and Nicotiana tomentosiformis[J]. Genome Biology, 2013, 14(6): R60.
[14]中國烟草基因组重大专项首席科学家团队. 战略与机遇:迈进烟草基因组时代[J]. 中国烟草学报,2017,23(3):8-13.
CHIEF SCIENTIST TEAM OF CHINA TOBACCO GENOME PROJECT. Strategy and opportunity: striding into tobacco genome era[J]. Acta Tabacaria Sinica, 2017, 23(3): 8-13.
[15]QUIAPIM A C, BRITO M S, BERNARDES L A S, et al. Analysis of the Nicotiana tabacum stigma/style transcriptome reveals gene expression differences between wet and dry stigma species[J]. Plant Physiology, 2009, 149(3): 1211-1230.
[16]ZHAO J, XIN H, QU L, et al. Dynamic changes of transcript profiles after fertilization are associated with de novo transcription and maternal elimination in tobacco zygote, and mark the onset of the maternal-to-zygotic transition[J]. The Plant Journal, 2011, 65(1): 131-145.
[17]BINDLER G, HOEVEN R V D, GUNDUZ I, et al. A microsatellite marker based linkage map of tobacco[J]. Theoretical and Applied Genetics, 2007, 114(2): 341-349.
[18]EDWARDS K D, BOMBARELY A, STORY G W, et al. TobEA: an atlas of tobacco gene expression from seed to senescence[J]. BMC Genomics, 2010, 11(1): 142.
[19]EWING B, HILLIER L, WENDL MC, et al. Base-calling of automated sequencer traces using phred. I. Accuracy assessment[J]. Genome Research, 1998, 8(3): 175-185.
[20]LI S, CHOU H H. LUCY2: an interactive DNA sequence quality trimming and vector removal tool[J]. Bioinformatics, 2004, 20(16): 2865-2866.
[21]HUANG X, MADAN A. CAP3: A DNA sequence assembly program[J]. Genome Research, 1999, 9(9): 868-877.
[22]ISELI C, JONGENEEL C V, BUCHER P. ESTScan: a program for detecting, evaluating, and reconstructing potential coding regions in EST sequences[C]. Heidelberg: the Seventh International Conference on Intelligent Systems For Molecular Biology, 1999, 99: 138-
148.
[23]LOTTAZ C, ISELI C, JONGENEEL C V, et al. Modelingsequencing errors by combining Hidden Markov models[J]. Bioinformatics, 2003, 19(2): 103-112.
[24]QUEVILLON E, SILVENTOINEN V, PILLAI S, et al. InterProScan: protein domains identifier[J]. Nucleic Acids Research, 2005, 33: W116-120.
[25]CAMON E, BARRELL D, LEE V, et al. The Gene Ontology Annotation (GOA) Database-an integrated resource of GO annotations to the UniProt Knowledgebase[J]. Silico Biology, 2004, 4(1): 5-6.
[26]BARKER G, BATLEY J, OSULLIVAN H, et al. Redundancy based detection of sequence polymorphisms in expressed sequence tag data using autoSNP[J]. Bioinformatics, 2003, 19(3): 421-422.
[27]MATSUOKA K, DEMURA T, GALIS I, et al. A comprehensive gene expression analysis toward the understanding of growth and differentiation of tobacco BY-2 cells[J]. Plant & Cell Physiology, 2004, 45(9): 1280-1289.
[28]李文正,宋利民,李永平,等. 烟草EST数据库构建及cDNA阵列技术建立[J]. 农业生物技术学报,2008,16(4):662-669..
LI W Z, SONG L M, LI Y P, et al. Construction of EST database and establishment of cDNA array[J]. Journal of Agricultural Biotechnology, 2008, 16(4): 662-669.
[29]LEIN W, USADEL B, STITT M, et al. Large-scale phenotyping of transgenic tobacco plants (Nicotiana tabacum) to identify essential leaf functions[J]. Plant Biotechnology Journal, 2008, 6(3): 246-263.
[30]GADANI F, HAYES A, OPPERMAN CH, et al. Large scale genome sequencing and analysis of Nicotiana tabacum: the tobacco genome initiative[C]. Bergerac: 5th Bergerac Tobacco Scientific Meeting, 2003: 117-130.
[31]BATLEY J, BARKER G, O'SULLIVAN H, et al. Mining for single nucleotide polymorphisms and insertions/ deletions in maize expressed sequence tag data[J]. Plant Physiology, 2003, 132(1): 84-91.
[32]WANG S, SHA Z, SONSTEGARD T S, et al. Quality assessment parameters for EST-derived SNPs from catfish[J]. BMC Genomics, 2008, 9(1): 450.
[33]朱承廣,任民,蒋彩虹,等. 以关联分析发掘烟草抗赤星病基因分子标记[J]. 中国烟草科学,2017,38(1):68-72.
ZHU C G, REN M, JIANG C H, et al. Identification of molecular markers for tobacco brown spot resistant genes through association analysis [J]. Chinese Tobacco Science, 2017, 38(1): 68-72.
[34]肖炳光. 烟草基因组计划进展篇:3.烟草分子标记遗传连锁图构建和重要抗病基因定位[J]. 中国烟草科学, 2013,34(3):118-119.
XIAO B G. Construction of molecular marker genetic linkage map and location of important disease resistance gene in tobacco[J]. Chinese Tobacco Science, 2013, 34(3): 118-119.
[35]文轲,张志明,任民,等. 烤烟CMV抗性基因QTL定位[J]. 中国烟草科学,2013,34(3):55-59.
WEN K, ZHANG ZH M, REN M, et al. QTL analysis of the resistance gene to CMV in flue-cured tobacco[J]. Chinese Tobacco Science, 2013, 34(3): 55-59.
[36]龚达平,王鲁,李凤霞,等. 基于EST序列的烟草cSNP发掘[J]. 中国烟草科学,2012,33(6): 61-65.
GONG D P, WANG L, LI F X, et al. Tobacco cSNP mining based on expressed sequence tag[J]. Chinese Tobacco Science, 2012, 33(6): 61-65.
[37]GONG D, HUANG L, XU X, et al. Construction of a high-density SNP genetic map in flue-cured tobacco based on SLAF-seq[J]. Molecular Breeding, 2016, 36(7): 1-12.