川芎转录组SSR分析与ESTSSR标记的开发
2017-09-23袁灿彭芳杨泽茂钟文娟牟方生龚一耘戢沛城
袁灿 彭芳 杨泽茂 钟文娟 牟方生 龚一耘 戢沛城
[摘要] 該研究通过组装川芎根转录组数据获得24 422个unigene,随后对得到的unigene进行了SSR检测,共检测到 4 073个SSR位点。对检测到的ESTSSR进行特征分析,结果显示单核苷酸重复最多,占41.0%。SSR所在序列功能注释结果显示在Nr中有2 201条序列能够被注释,同时SSR所在序列还被注释到49个GO分类和242个KEGG代谢通路中。利用SSR检测结果进行了ESTSSR标记开发,合成其中235对引物进行验证,74对扩增效果较好。利用74对ESTSSR引物对34个川芎资源进行遗传多样性分析,结果显示收集的川芎资源多样性较好,UPGMA聚类显示川芎资源分为两大类,聚类结果表现出一定的地域性,PCoA分析与UPGMA聚类结果类似。该研究首次对川芎进行ESTSSR分析和标记开发,对推动川芎资源遗传多样性研究、品种纯度检测、基因定位和分子育种等具有重要意义。
[关键词] 川芎; ESTSSR; 功能注释; 标记开发; 遗传多样性
ESTSSR identification, markers development of Ligusticum chuanxiong
based on Ligusticum chuanxiong transcriptome sequences
YUAN Can1, PENG Fang1, YANG Zemao2, ZHONG Wenjuan1, MOU Fangsheng1,
GONG Yiyun1, JI Peicheng1, PU Deqiang1, HUANG Haiyan1, YANG Xiao1*, ZHANG Chao1*
(1. Industrial Crop Research Institute, Sichuan Academy of Agricultural Sciences, Chengdu 610300, China;
2. Institute of Bast Fiber Crops, Chinese Academy of Agricultural Sciences, Changsha 410205, China)
[Abstract] Ligusticum chuanxiong is a wellknown traditional Chinese medicine plant. The study on its molecular markers development and germplasm resources is very important. In this study, we obtained 24 422 unigenes by assembling transcriptome sequencing reads of L. chuanxiong root. ESTSSR was detected and 4 073 SSR loci were identified. ESTSSR distribution and characteristic analysis results showed that the mononucleotide repeats were the main repeat types, accounting for 41.0%. In addition, the sequences containing SSR were functionally annotated in Gene Ontology (GO) and KEGG pathway and were assigned to 49 GO categories, 242 KEGG pathways, among them 2 201 sequences were annotated against Nr database. By validating 235 ESTSSRs,74 primer pairs were ultimately proved to have high quality amplification. Subsequently, genetic diversity analysis, UPGMA cluster analysis, PCoA analysis and population structure analysis of 34 L. chuanxiong germplasm resources were carried out with 74 primer pairs. In both UPGMA tree and PCoA results, L. chuanxiong resources were clustered into two groups, which are believed to be partial related to their geographical distribution. In this study, ESTSSRs in L. chuanxiong was firstly identified, and newly developed molecular markers would contribute significantly to further genetic diversity study, the purity detection, gene mapping, and molecular breeding.
[Key words] Ligusticum chuanxiong; ESTSSR; functional annotation; development of molecular marker; genetic diversityendprint
川芎Ligusticum chuanxiong为伞形科藁本属药用植物,始载于《神农本草经》[1],以其干燥根茎入药,是我国传统大宗中药材。四川的彭州和都江堰为川芎道地产区[23] 。其味辛、性温,有活血行气、祛风止痛功效,用于治疗头痛、风湿、月经不调等。
近年来,川芎活性成分、药理药效研究较多,已分离出阿魏酸、藁本内酯[47]和多糖[8]等多种有效成分,具有扩张血管、抗血小板聚集和血栓形成、钙拮抗等作用。然而川芎遗传多样性、DNA指纹图谱、基因定位、遗传图谱构建、分子育种等研究却鲜有报道。川芎中能够用于上述研究的分子标记甚少,仅一些通用引物如RAPD[9],ISSR[1011],ITS[1213]等,极大的限制了川芎功能基因定位、分子育种等相关研究。
微卫星序列又称简单重复序列(SSR)、短串联重复序列,由若干个串联重复单元组成,每单元含1~10个核苷酸,广泛分布在真核生物基因组中[14]。SSR具有标记之间密度大、材料间多态性好、易扩增、重复性高等优点[1516],已在水稻[17],玉米[18],小麦[19]等作物的分子育种等研究上广泛应用。随着EST数据库不断丰富和高通量测序技术发展,ESTSSR在药用植物上也被大量开发和应用[20],已有红花[21]、丹参[22]、党参[23]、人参[24]、西洋参[25]、金银花[26]等開发了ESTSSR,这些标记逐渐代替通用引物应用于药用植物遗传多样性、基因定位、道地性鉴定等研究。本研究对川芎根转率组测序数据拼接组装,对unigene进行SSR位点检测,对检测到的ESTSSR进行分布规律等特征分析,同时对SSR所在序列进行功能注释和代谢通路分析。随后利用SSR检测结果进行ESTSSR标记开发并验证其有效性,利用效果较好的标记对都江堰、彭州等主产地进行了川芎遗传多样性检测、聚类分析、PCoA分析、群体结构分析。旨在后续川芎基因定位、遗传作图、品种标准化、分子育种等研究奠定基础。
1 材料和方法
1.1 数据来源 材料为彭州、都江堰等地收集的川芎资源34份(表1),统一种植于四川省农业科学院经济作物育种栽培研究所青白江基地。测序数据来源于NCBI SRA数据库(SRX621358)。
1.2 原始测序数据质量查看、拼接和ESTSSR 统计 用FastQC查看测序数据的质量信息[Q=-10log10(e),e为测错的概率,如Q10时,e=1/10],利用Trinity[27]对clean data进行组装,利用MISA对得到的unigene进行SSR统计(检测标准为单碱基重复≥10,二碱基重复≥6,三碱基重复≥5,四碱基重复≥5,五碱基重复≥5,六碱基重复≥5)。
1.3 SSR序列注释 利用BLAST+(ncbiblast2.2.28+,evalue<1e-5)[28]将SSR所在的unigene序列与Swissprot,TrEMBL,Nr,Nt,CDD数据库进行比对注释,同时利用hmmscane将unigene与Pfam[29]数据库进行比对注释(evalue=0.01)。最后利用CDD和GO比对结果将unigene进行KOG和GO分类[30],利用KAAS[31]将unigene比对KEGG(Kyoto Encyclopedia of Genes and Genomes)数据库对SSR所在的unigene进行代谢通路映射分析。
1.4 ESTSSR 引物设计与验证 利用Primer 3和MISA运行结果进行SSR引物的设计(设计参数为GC量30%~70%, Tm 57~59 ℃,引物长度18~23 bp, 预期扩增产物长度80~300 bp),随机挑选部分引物由合成。利用CATB法提取川芎DNA,利用分光光度计检测DNA质量,PCR扩增体系[Taq酶(5 U·μL-1) 0.2 μL、引物(10 mmol·L-1)2 μL,dNTP(2.5 mmol·L-1) 2 μL,10×Buffer(25 mmol·L-1) 2 μL,ddH2O 11.8 μL]。在PCR 产物中加入5 μL 的dilution buffer,最后一孔加25 μL DNA Ladder(30~1 500 bp),30~1 500 bp 分离胶进行毛细管电泳,利用毛细管电泳结果分析软件PROSizeTM分析数据,自动生成结果:有条带的读数为“1”,无条带读数为“0”。
1.5 数据的分析与处理 利用Popgene进行遗传多样性分析,分别计算Nei指数(遗传相似系数)、Shannon指数、平均有效位点数。利用软件NTSYS进行聚类分析和PCoA,聚类分析采用按非加权配对法(UPGMA)进行,并计算GS值。利用STRUCTURE计算群体结构,不作数迭代设为10 000,将不作数迭代后的Markov Chain Monte Carlo(MCMC)设为100 000,K取值范围1~12,10次独立运算重复,根据Evanno等[32]的算法利用STRUCTURE HARVESTER计算ΔK。
2 结果与分析
2.1 数据的下载和拼接 从NCBI上下载川芎根转录组数据,合计13 717 243个reads,1.1 Gb数据。通过FastQC查看测序结果,所下载数据为去接头和去低质量读序的clean data,所有位置测序质量四分位数均高于10、中位数均高于25,A/T,C/G未出现分离现象。利用Trinity进行组装,共拼接出50 212个转录本,24 422个unigene,contig N10的长度为1 182 bp,contig N50的长度600 bp,平均长度616.86 bp,最长unigene为3 899 bp,最短unigene为401 bp,所有转录本平均GC量为40.78%。
2.2 ESTSSR的检测和注释 利用MISA脚本对拼接得到unigene进行SSR位点检测。结果显示共检测到4 073个SSR位点,3 602个unigene含有SSR位点,含SSR的unigene占unigene总数的7.17%,检测SSR频率为8.11%(检测出的SSR数目与unigene数目之比),平均7 604 bp 1个SSR(unigene长度与SSR次数之比),其中410个unigene含有2个或2个以上的SSR位点,224个unigene含有2种或2种以上的SSR类型。endprint
将含有SSR的unigene序列比对Nr和Nt数据库进行注释,结果显示2 201个unigene在Nr数据库中具有同源匹配信息,782个unigene在Nt数据库具有同源匹配信息,分别占比对序列的61.1%,21.7%。在与Nr数据库进行同源比对时,比对最多的物种为胡萝卜,共计1 655条,占比对序列的45.9%。同时将unigene与SwissProt(蛋白数据库)、TrEMBL、Pfam(蛋白结构域注释分类)、CDD数据库进行比对和注释,注释结果显示分别有1 302,2 009,1 110,1 318个基因被注释,占比对序列的36.2%,55.8%,30.8%,36.6%。
随后将含有SSR的unigene按GO(Gene Ontology)和KOG(Eukaryotic Orthologous Groups of proteins)分类系统进行分类(图1)。SSR所在序列共计分为25个KOG类,最多一类为蛋白转录后修饰139个,其次为一般功能预测118个,最少的一类为细胞运动1个,其次为未知蛋白2个。在GO分类中,将unigene分为细胞组分、分子功能和生物学过程3类。在GO分类中,进一步将3大功能细分为49个小类。在生物学过程中细胞过程最多(25.6%),生物附着过程最少(0.06%);细胞组分中细胞部分最多(28.8%),细胞外基质最少(0.03%);分子功能中结合功能最多(23.2%),最少的为通道调节激活(0.03%)。同时对unigene进行了KEGG注释(图1),共计1 271个unigene在KEGG中能够被注释,注释到242个代谢通路,分为30个亚组。通过对代谢通路分析发现其中最多映射到的为剪切体代谢通路,共计38个基因。基于川芎的药用特性考察了KEGG中一些活性成分相关的代谢通路注释结果,结果显示本研究共有28条序列注释到萜类骨架生物合成、类苯基丙烷生物合成、黄酮类生物合成、固醇类生物合成等7个代谢通路中。
对全部注释的数据库结果进行比对分析发现,543个unigene在4个数据库中都有注释(图1),345,24,111条序列在3个数据库中被注释。在KEGG中具有注释的序列,都能在Nr数据库中得到注释。
2.3 ESTSSR特征和分布规律分析 根据检测结果对SSR重复单元进行特征分析:从重复单元的组成数量分析发现,单核苷酸重复到六核苷酸重复全都含有。出现频率最高为单核苷酸重复,占总SSR的41.0%,其次为二核苷酸,占总SSR的38.5%,五核苷酸和六核苷酸重复最少,2种核苷酸共计占所有核苷酸总数的1.91%(图2)。
从重复单元的组成碱基类型分析发现,共计85种不同组成的重复单元,其中单核苷酸重复有2种、二核苷酸重复有4种, 三、四、五、六核苷酸重复基元分别有10,23,22,24种(表2)。
重复的92.6%;二核苷酸中CG/CG最少,AG/CT最多占总SSR的20.5%,占二核苷酸重复的55.0%;三核苷酸中ACG/CGT重复最少,ATC/GAT重复最多(表3);四核苷酸、五核苷酸、六核苷酸数量每种重复单元数量都较少,四核苷酸中ACAT/ATGT重复最多,五核苷酸中AAAAG/CTTTT和ACCCG/CGGGT重复最多,六核苷酸中ACCTCC/GGAGGT和AGCTCC/GGAGCT重复最多。
对重复单元的重复次数进行分析发现,单核苷酸重复中,10次单核苷酸重复最多占单核苷酸重复的45.7%;二核苷酸重复中,6次二核苷酸重复最多占二核苷酸重复的38.5%;三核苷酸重复中,5次三核苷酸重复最多占三核苷酸重复的64.4%,四核苷酸、五核苷酸、六核苷酸重复中都是4次重复最多(图3)。
2.4 ESTSSR引物验证与川芎资源遗传多样研究 引物设计结果显示2 616条unigene序列能够设计引物,占含有SSR uingene序列的72.6%,本研究共計出2 765对引物。合成其中235对进行有效性验证。通过毛细管电泳,共得到74对SSR引物扩增带谱清晰,大小在100~300,适合用于后续研究。
利用上述74对引物对从彭州、都江堰等道地产区收集的川芎栽培资源进行遗传多样性分析,74对引物共扩增得到多态性条带208条。利用Popgene软件计算各位点遗传多样性指数,有效等位基因数为1.48,Nei多样性指数0.28,Shannon信息指数0.43,结果表明34份川芎资源具有较高的遗传多样性。
通过聚类分析发现收集的川芎资源GS值在0.58~0.91,在GS等于0.59时被分为两大类(Ⅰ,Ⅱ)(图4)。第一类包含7个资源材料,收集于都江堰、什邡、新都、彭州,各个资源间平均GS 0.76,最小GS 0.49,这一支聚类较为分散,材料间聚类关系和地理关系不大。第二类包含27个资源材料,收集于都江堰、彭州、崇州、什邡、彭山等地,各个资源间平均GS 0.75,最小GS 0.57,其中来源于彭州的川芎主要集中于Ⅱ类中的Ⅱ1分枝中,都江堰川芎聚类则分散在多个类群。同时对34份川芎资源进行了PCoA分析,PCoA分析结果与NTSYS一致性较高(图5)。
通过对收集的川芎资源进行群体结构分析,采用ΔK最大值的方法寻找最优K值,根据Evanno计算法得到ΔK值,在K=3时得到ΔK最大值126.7(图6),34份川芎资源被分成3组。其中第一组与NTSYS聚类结果类似,仅一份来源彭州敖平的绿色茎杆川芎聚类结果有差异,同时这一组分类与PCoA分析结果一致性较高(图5)。第二组主要来源于彭州川芎,也包括2份都江堰川芎资源。第三组包含资源较多,主要来源于彭州,都江堰资源仅3个,在新产区彭山、什邡收集的少量资源也在第三组里。
3 讨论
3.1 药用植物SSR标记的开发 最早的SSR标记开发有包括文库筛选法、磁珠富集法、省略筛库法等,随着数据库的丰富,许多研究者也基于数据库开发相应的SSR[33]。近年来高通测序技术的发展和二代测序成本的降低,SSR开发软件的更新,使SSR标记开发简易、高效[34]。药用植物SSR也不断被开发和应用,邓科君等[22]利用丹参EST数据库开发丹参ESTSSR,并利用该标记进行了丹参种属间亲缘关系分析。谢明璐等[35]利用磁珠富集法开发了60对石斛SSR标记,并应用于石斛种质纯度检测。李炎林等[36]利用转录组数据进行红豆杉ESTSSR标记的开发,同时利用这些标记进行了红豆杉遗传图谱构建。本研究首次对川芎进行SSR标记开发,共计得到4 073个SSR位点,开发出2 765条SSR序列引物,随机选择235对进行验证,31.5%的引物序列扩增效果较好。新开发的标记可用于川芎资源多样性检测、系统发育树构建、DNA指纹图谱构建、品种纯度检测、遗传作图、基因定位等研究。endprint
3.2 川芎ESTSSR分布与特征分析 川芎ESTSSR检出频率为1/7 604,高于拟南芥(1/13 830)、杨树[37](1/14 000)、水稻[38](1/11 810)、小麦[19,38](1/15 600)、棉花[39](1/14 800),略低于大豆[38](1/7 400)、茶树[40](1/3 680);与其他药用植物相比,川芎ESTSSR的含量处于中等水平,低于模式药用植物丹参[22](1/2 100)、冬凌草[41](1/3 517)、番红花[42](1/5 670)、金银花[26](1/4 050)、人参[24](1/5 700)、党参[23](1/4 520),与西洋参[25](1/7 500)、野三七[43](1/7 750)相当,高于红豆杉[36](1/18 010)、杜仲[44](1/11 610)、红景天[45](1/8 520)、藏茵陈川西獐牙菜[46]1 /(12 600)。其中川芎、野三七、西洋参三者的ESTSSR含量接近,可能与三者同属于伞形目有关。西洋参、野三七与人参同属于人参属,人参ESTSSR出现频率却较高,前人研究表明ESTSSR的检测频率还与检测参数设置、基因组中转录比例、基因组大小、基因组低拷贝序列等[22, 47]因素有关。
大多数植物ESTSSR以二、三核苷酸重复为主要类型,药用植物中藏红花[42]、红花[21]、红景天[45]、黄花蒿[48]、刺梨[49]等以三核苷酸为主,丹参[22]、金银花[26]、杜仲[44]、灯盏花[50]等以二核苷酸为主,但川芎ESTSSR以单核苷酸(45.7%)和二核苷酸重复(38.5%)为主(表3),与文献报道的3种人参属植物(人参、三七、西洋参)ESTSSR结果[51]相似。单核苷酸重复以A/T为主,二核苷酸重复以AG/CT为主,去掉单核苷酸重复后,二核苷酸重复占65.3%,这一特征与山核桃ESTSSR重复基元特征一致较高[52],大多数药用植物二核苷酸重复也以AG/CT为主,由于三核苷酸重复种类较多,在各个植物间变异也较大,川芎ESTSSR三核苷酸重复以ATC/GAT、AAG/CTT为主,这与丹参[22]、人参[24]、藏红花[42]等三核苷酸重复特征基本一致。
3.3 川芎ESTSSR功能注释 对SSR所在序列与Nr,Nt,TrEMBL,Pfam,CDD数据库进行比对和注释, 结果显示SSR序列参与的功能较多,有转录调控、ATP酶催化、DNA修复等。通过对SSR进行KOG分类,结果显示983条序列具有KOG分类,这些SSR参与功能最多是蛋白转录后修饰,其中37条序列参与次生代谢。GO注释结果显示ESTSSR所在的序列被分为49类,其中分子功能中最多为结合功能,其次为催化活性。在细胞组分分类中细胞部分比例最多,生物学过程分类中细胞过程最多,这一结果与红花SSR[53]和黄花蒿ESTSSR[50]所在序列GO分类结果较为相似。通过KEGG分析,SSR所在序列共计分为242个代谢通路,其中有6条序列注释到类苯基丙烷生物合成代谢通路,与此代谢通路相关的阿魏酸为川芎主要活性成分,有7条序列注释到与川芎另一活性成分多糖合成相关的N聚糖生物合成途径。本研究所得到SSR所在序列注释信息和与活性成分相关基因紧密连锁标记的开发,将有助于川芎的功能基因研究和遗传改良。
3.4 川芎资源遗传多样性和聚类分析 从川芎传统道地产区彭州、都江堰以及新兴产区彭山、什邡共收集川芎资源34份,资源多样性丰富聚类分析显示都江堰和彭州资源虽然没有明显的界限,但彭州收集的资源在聚类上表现出一定的地域关系,大部分收集的彭州资源都被聚集在Ⅱ1中,PCoA分析结果与聚类分析结果一致性较高。新兴产区彭山、什邡等地资源与老产区差异不大,可能是因为新兴产区苓种主要来源于老产区。近年来生产调查发现都江堰川芎种植面积越来越少[54],本研究收集于都江堰产区的资源,对川芎基因资源的保存和川芎品种选育等都有重要意义。
[致谢] 本研究的资源收集得到成都中医药大学蒋桂华教授和马逾英教授的大力支持和帮助。
[参考文献]
[1] 单锋,郝近大. 川芎(芎藭)的本草源流考[J]. 中国中药杂志,2011,36(16):2306.
[2] 宋平顺,马潇,张伯崇,等. 芎藭(川芎)的本草考证及历史演变[J]. 中国中药杂志,2000,25(7):50.
[3] 刘圆,贾敏如. 川芎品种、产地的历史考证[J]. 中药材,2001,24(5):364.
[4] 張晓琳,徐金娣,朱玲英,等. 中药川芎研究新进展[J]. 中药材,2012,35(10):1706.
[5] 金玉青,洪远林,李建蕊,等. 川芎的化学成分及药理作用研究进展[J]. 中药与临床,2013,4(3):44.
[6] 郝淑娟,张振学,田洋,等. 川芎化学成分研究[J]. 中国现代中药,2010,12(3):22.
[7] 王文祥,顾明,蒋小岗,等. 川芎化学成分研究[J]. 中草药,2002,33(1):6.
[8] Hu J, Jia X, Fang X, et al. Ultrasonic extraction, antioxidant and anticancer activities of novel polysaccharides from Chuanxiong Rhizome[J]. Int J Biol Macromol,2015,85:277.
[9] 罗禹,王天志,杨兵,等. 川芎和引种日本川芎的RAPD分析与鉴定[J]. 华西药学杂志,2008,23(3):296.
[10] 王岚,肖海波,马逾英,等. 川芎道地性的ISSR分析[J]. 四川大学学报:自然科学版,2008,45(6):1472.endprint
[11] 陈要臻,王岚,马逾英,等. 川芎简单序列重复间区多态性和扩增片段长度多态性分子标记技术多态性比较研究[J]. 时珍国医国药,2009,20(6):1422.
[12] 刘玉萍,曹晖,韩桂茹,等. 中日产川芎的matK、ITS基因序列及其物种间的亲缘关系[J]. 药学学报,2002,37(1):63.
[13] 辛天怡,李美妮,宋经元. 川芎及其近缘物种的ITS2序列分析与鉴别研究[J]. 中国现代中药,2011,13(12):18.
[14] 陆丹,牛楠,李玥莹. SSR标记技术在植物基因组研究上的应用[J]. 沈阳师范大学学报:自然科学版,2010,28(1):83.
[15] Song Q J, Shi J R, Singh S, et al. Development and mapping of microsatellite (SSR) markers in wheat[J]. Theor Appl Genet,2005,50(3):550.
[16] Kalia R K, Rai M K, Kalia S, et al. Microsatellite markers: an overview of the recent progress in plants[J]. Euphytica,2011,177(3):309.
[17] Moorthy K K, Babu P, Sreedhar M, et al. Identification of informative ESTSSR markers capable of distinguishing popular Indian rice varieties and their utilization in seed genetic purity assessments[J]. Seed Sci Technol,2011,39(2):282.
[18] Galvo K S, Ramos H C, Santos P H, et al. Functional molecular markers (ESTSSR) in the fullsib reciprocal recurrent selection program of maize (Zea mays L.). [J]. Genet Mol Res,2015,14(3):7344.
[19] Gao L F, Jing R L, Huo N X, et al. One hundred and one new microsatellite loci derived from ESTs (ESTSSR) in bread wheat[J]. Theor Appl Genet,2004,108(7):1392.
[20] 周曉丽,刘春生,王学勇,等. 药用植物ESTSSR的研究进展[C]. 西安:中华中医药学会中药鉴定学术会议暨WHO中药材鉴定方法和技术研讨会,2010:6.
[21] Chapman M A, Hvala J, Strever J, et al. Development, polymorphism, and crosstaxon utility of ESTSSR markers from safflower (Carthamus tinctorius L.)[J]. Theor Appl Genet,2009,120(1):85.
[22] 邓科君,张勇,熊丙全,等. 药用植物丹参ESTSSR标记的鉴定[J]. 药学学报,2009,44(10):1165.
[23] 王东,曹玲亚,高建平. 党参转录组中SSR位点信息分析[J]. 中草药,2014,45(16):2390.
[24] 杨成君,王军. 人参EST资源的SSR信息分析[J]. 植物生理学通讯,2008,44(1):69.
[25] 杨维泽,金航,赵振玲,等. 西洋参EST资源的SSR信息分析[J]. 西南农业学报,2011,24(1):275.
[26] 蒋超,袁媛,刘贵明,等. 基于ESTSSR的金银花分子鉴别方法研究[J]. 药学学报,2012,47(6):803.
[27] Grabherr M G, Haas B J, Yassour M, et al. Fulllength transcriptome assembly from RNASeq data without a reference genome[J]. Nat Biotechnol,2011,29(7):644.
[28] Altschul S F, Madden T L, Schffer A A, et al. Gapped BLAST and PSIBLAST: a new generation of protein database search programs. [J]. Nucleic Acids Res,1997,25(17):3389.
[29] Finn R D, Coggill P, Eberhardt R Y, et al. The Pfam protein families database: towards a more sustainable future[J]. Nucleic Acids Res,2016,44(1):D279.
[30] Li X, Xiao X, Liang Y, et al. Analysis and functional annotation of expressed sequence tags from the aquatic midge (Chironomus plumosus) using highthroughput transcriptome sequencing[C]. 南京:第四届昆虫生理生化与分子生物学学术研讨会,2013.endprint
[31] Moriya Y, Itoh M, Okuda S, et al. KAAS: an automatic genome annotation and pathway reconstruction server[J]. Nucleic Acids Res,2007,35(suppl 2):182.
[32] Evanno G, Regnaut S, Goudet J. Detecting the number of clusters of individuals using the software STRUCTURE: a simulation study[J]. Mol Ecol, 2005, 14(8): 2611
[33] 邵阳,范文,黄连冬,等. 基于RNAseq的崇左金花茶ESTSSR标记开发[J]. 复旦学报:自然科学版,2015,54(6):761.
[34] 李卫国,常天俊,龚红梅. ESTSSR及其在植物基因组学研究中的应用[J]. 生物技术,2008,18(4):90.
[35] 谢明璐,侯北伟,韩丽,等. 珍稀铁皮石斛SSR标记的开发及种质纯度鉴定[J]. 药学学报,2010,45(5):667.
[36] 李炎林. 红豆杉紫杉烷代谢突变体筛选和连锁图谱构建[D]. 长沙:湖南农业大学,2014.
[37] Cardle L, Ramsay L, Milbourne D, et al. Computational and experimental characterization of physically clustered simple sequence repeats in plants[J]. Genetics,2000,156(2):847.
[38] 杨素丽,明军,刘春,等. 基于EST信息的百合SSR標记的建立[J]. 园艺学报,2008,48(7):1069.
[39] Wang C, Guo W, Cai C, et al. Characterization, development and exploitation of ESTderived microsatellites in Gossypium raimondii Ulbrich[J]. 科学通报:英文版,2006,51(5):557.
[40] Wu H, Chen D, Li J, et al. De novo characterization of leaf transcriptome using 454 sequencing and development of ESTSSR markers in tea (Camellia sinensis)[J]. Plant Mol Biol Rep,2013,31(3):524.
[41] 苏秀红,李庆磊,陈随清,等. 冬凌草转录组SSR位点分析及多态性初步评价[J]. 北方园艺,2016,40(4):93.
[42] 陈国庆. 番红花EST资源的SSR信息分析[J]. 广西植物,2011,31(1):43.
[43] 李翠婷,张广辉,马春花,等. 野三七转录组中SSR位点信息分析及其多态性研究[J]. 中草药,2014,45(10):1468.
[44] 黄海燕,杜红岩,乌云塔娜,等. 基于杜仲转录组序列的SSR分子标记的开发[J]. 林业科学,2013,49(5):176.
[45] 雷淑芸,高庆波,付鹏程,等. 基于Solexa高通量测序的唐古特红景天(Rhodiola algida)微卫星信息分析[J]. 植物研究,2014,34(6):829.
[46] 刘越,岳春江,王翊,等. 藏茵陈川西獐牙菜转录组SSR信息分析[J]. 中国中药杂志,2015,40(11):2068.
[47] 李永强,李宏伟,高丽锋,等. 基于表达序列标签的微卫星标记(ESTSSRs)研究进展[J]. 植物遗传资源学报,2004,5(1):91.
[48] 王英,蔡汉强,贾伟章. 黄花蒿EST资源的SSR信息分析及标记开发[J]. 中国中药杂志,2012,37(5):570.
[49] 鄢秀芹,鲁敏,安华明. 刺梨转录组SSR信息分析及其分子标记开发[J]. 园艺学报,2015,42(2):341.
[50] 陈茵,李翠婷,姜倪皓,等. 灯盏花转录组中SSR位点信息分析及其多态性研究[J]. 中国中药杂志,2014,39(7):1220.
[51] 杨维泽,金航,崔秀明,等. 三种人参属植物的ESTSSR信息分析及其在三七中的应用[J]. 基因组学与应用生物学,2011, 30(1):62.
[52] 赵国淼,曾燕如,黄有军,等. 基于种子发育过程RNASeq的山核桃SSR位点分析[J]. 分子植物育种,2015,13(11):2516.
[53] Ambreen H, Kumar S, Variath M T, et al. Development of genomic microsatellite markers in Carthamus tinctorius L. (Safflower) using next generation sequencing and assessment of their crossspecies transferability and utility for diversity analysis[J]. PLoS ONE,2015,10(8):e0135443.
[54] 陈林,彭成,刘友平,等. 川芎道地药材形成模式的探讨[J]. 中国中药杂志,2011,36(16):2303.
[责任编辑 吕冬梅]endprint