黑果枸杞转录组SSR信息分析及分子标记开发
2019-03-25赵建华王亚军樊云芳曹有龙
尹 跃,安 巍,赵建华,王亚军,樊云芳,曹有龙
(宁夏农林科学院 国家枸杞工程技术研究中心,宁夏 银川750002)
黑果枸杞Lycium ruthenicum是茄科Solanaceae枸杞属Lycium植物,主要分布在中国西北地区[1],野生种质资源非常丰富,耐干旱耐盐碱;其果实富含类黄酮、花青素、多糖、酚酸和脂肪酸等生物活性物质,具有预防多种疾病的功效[2],深受消费者喜爱。目前,对黑果枸杞果实活性物质的研究较多[2-3]。也有研究利用扩增片段长度多态性(AFLP)[4],简单重复序列间扩增多态性(ISSR)[5]和相关序列扩增多态性(SRAP)[6]标记进行遗传多样性评价,但鲜有利用简单重复序列(SSR)标记的报道。SSR标记是基于生物基因组中由1~6个核苷酸组成的串联重复序列特性开发的分子标记,具有多态性丰富、高通量检测、共显性遗传等优点,已广泛应用遗传图谱构建、分子标记辅助育种、种质资源鉴定和遗传多样性分析等[7-10]领域。由于缺乏基因组信息,基于基因组测序开发黑果枸杞SSR标记成本高,步骤繁琐[11-12],SSR标记在黑果枸杞种质资源研究中的应用受到限制。同时,美国生物技术信息中心(NCBI)中公布的黑果枸杞表达序列标签(EST)极少,除了CHEN等[16]研究了基于盐胁迫下黑果枸杞转录组表达序列标签-简单重复序列(EST-SSR)标记开发之外,基于转录组测序黑果枸杞EST-SSR标记开发尚未见报道。EST-SSR来源于表达的基因组区域,可直接反映相关基因多样性,在不同物种间具有良好的通用性;随着高通量测序技术和生物信息学方法快速发展,基于转录组测序已开发刺梨Rosa roxburghii,中国樱桃Cerasus pseudocerasus,马铃薯Solanum tuberosum等[13-15]多种植物的SSR标记。本研究以前期黑果枸杞抗旱转录组测序获得的数据为基础,利用生物信息学方法批量开发EST-SSR标记,并分析其分布特点、组成特征,以期为黑果枸杞种质资源遗传多样性分析研究提供参考。
1 材料与方法
1.1 转录组数据来源
取1年生黑果枸杞持续干旱胁迫下的叶和根,提取RNA后进行转绿组测序(无参,HiSeqTM2500,北京诺禾致源生物信息科技有限公司),共12个样本,计80 G数据。利用Trinnity等软件[17]对测序的数据进行拼接和组装,获得213 058条单基因簇(unigene)作为背景数据进行分析。
1.2 植物材料及DNA提取
用于SSR引物筛选及评价的24份枸杞种质资源(表1)均来自宁夏农林科学院国家枸杞工程技术研究中心枸杞种质资源圃(38°38′49″N, 106°9′10″E)。 利用天根试剂盒(DP5-02, 天根)提取基因组DNA。
1.3 转录组SSR位点鉴别及引物设计
使用MISA软件(http://pgrc.ipk-gatersleben.de/misa/misa.html)搜索Unigene序列的SSR位点。搜索标准为:重复单元长度1~6 bp,单核苷酸重复次数≥10次,二核苷酸重复次数≥6次,三、四、五、六核苷酸重复次数≥5次,复合型SSR位点碱基间隔≤100 bp。
采用BatchPrimer 3软件(https://probes.pw.usda.gov/batchprimer3/)对获得的SSR位点批量设计引物。引物设计参数为:引物长度18~27 bp(最佳22 bp),GC为40%~70%(最适50%),退火温度为50~60℃(最适55℃),PCR扩增产物长度为100~300 bp,其他参数为默认设置。
1.4 EST-SSR引物筛选及验证
随机挑选128对引物,在上游引物 5′端添加18 bp的 M13通用引物序列(TGTAAAACGACGGCCAGT),3′端保持不变,用FAM荧光集团修饰后,由英潍捷基贸易有限公司合成。
PCR扩增体系(15.0 μL):DNA模板1.0 μL,M13通用荧光引物0.1 μL,上游引物和下游引物各0.4 μL, 2×TaqPCR Master Mix 7.5 μL, 双蒸水 5.6 μL。 PCR 扩增在 ABI-2720(应用生物系统公司, 美国)上进行。扩增程序为:95℃ 5 min;95℃ 30 s,60~45℃ 30 s,72℃ 30 s,15个循环;95℃ 30 s,50℃30 s,72℃30 s,20个循环;72℃7 min。扩增产物经过ABI3730XL DNA(应用生物系统公司,美国)检测,用LIZ500作为分子量内标。
表1 供试种质材料信息Table 1 Information of twenty-four materials used in this study
1.5 数据分析
以SSR出现频率和SSR平均分布距离描述EST-SSR。公式如下:①SSR出现频率fc=c/n×100%,其中c为搜索到的SSR数量(个),n为无余EST数量(个)。②SSR平均分布距离fN=N/c,其中N为无余EST数量的总碱基数(个)。由GeneMapper 4.0软件获得扩增产物片段大小,用DataFormater 2.7软件[18]将数据转化为PowerMarker v3.25软件[19]的输入格式,计算等位基因数(number of alleles,NA)、主效等位基因频率(major allele frequency,fMA)、 期望杂合度(expected heterozygosity,HE)、 观察杂合度 (observed heterozygosity,HO)和多态信息量(polymorphism information content,CPI)。
2 结果与分析
2.1 黑果枸杞转录组中SSR位点的分布特点
利用MISA软件对黑果枸杞转录组测序获得的213 058条Unigene(序列总长度为262 643 598 bp)序列进行搜索,发现其中56 170条Unigene序列中含有73 896个SSR位点,其中13 611条Unigene含有2个或2个以上EST-SSR位点。总体上,SSR发生频率为26.36%,平均3.55 kb出现1个SSR位点。SSR类型丰富,单核苷酸至六核苷酸重复类型均存在;单核苷酸、二核苷酸和三核苷酸重复出现频率占优势,分别占总SSR的74.33%,13.30%和11.81%;四核苷酸、五核苷酸和六核苷酸重复类型数量较少,分别占总数的0.49%,0.03%和0.04%(表2)。
表2 黑果枸杞转录组SSR数量、类型和频率Table 2 Frequencies of the different SSR repeat motif types observed in the Lycium ruthenicum transcriptome
2.2 转录组SSR基序重复类型和频率特征
从黑果枸杞转录组SSR核苷酸基序重复类型来看,73 896个SSR位点共有84种重复基元,单核苷酸至六核苷酸重复分别有2,4,10,26,18和24种。从出现的频率来看(表3):占优势的前3种重复单元类型是单核苷酸、二核苷酸和三核苷酸重复基元;单核苷酸重复基元以A/T为主,占该类型SSR位点总数的95.64%;二核苷酸主要以AG/CT为主,占二核苷酸总数的40.42%,其次是AT/AT,AC/GT和CG/CG,分别所占比例为35.37%,23.74%和0.46%;三核苷酸重复单元以AAC/GTT,AAG/CTT,AAT/ATT,ATC/ATG和ACC/GGT为主,占所有三核苷酸重复单元的75.88%;四核苷酸、五核苷酸和六核苷酸重复单元类型较为分散,出现频率相对较低,仅为0.56%。
表3 黑果枸杞EST-SSR中重复基元的类型、数量及频率Table 3 Number and frequencies of repeat motif types in Lycium ruthenicum
2.3 SSR引物有效性及多态性检测
为检测所开发的EST-SSR标记的可用性,对56 170条Unigene序列的73 896个EST-SSR位点设计引物,共得到引物12 674对。随机挑选128对(包括二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸),以表型性状差异较大的 ‘黑果枸杞’ ‘宁杞1号’ ‘宁杞菜1号’和 ‘中国枸杞’的DNA为模板进行PCR扩增,其中74对引物能扩增出清晰的扩增产物,引物扩增有效率为57.8%;其中28对引物具有多态性,多态性引物占有效引物的37.8%。图1为引物LM-02对4份种质的基因型图。
2.4 SSR位点遗传多样性分析
以筛选的28对多态性引物对24份枸杞种质作遗传多样性分析。共检测到等位基因256个,各引物检测到的等位基因为4~19个,平均为9.1个;共检测到基因型数303个;主效等位基因频率变化范围为0.188~0.729,平均值为0.432;观察杂合度为0.167~0.833,平均值为0.439;期望杂合度为0.433~0.904,平均值为0.712,多态信息量为0.395~0.897,平均值为0.678。由Botstein理论[20]判定(表4),在开发出的28个多态位点中有24个高度多态位点(CPI≥0.5),4个中度多态位点(0.25≤CPI<0.5)。
3 讨论
本研究搜索了黑果枸杞的213 058条Unigene序列,发现其中的56 170条中含有73 896个SSR位点,发生频率为26.36%;高于中国樱桃Cerasus pseudocerasus(15.62%)[14],马铃薯Solanum tuberosum(3.43%)[15], 夏蜡梅Sinocalycanthus chinensis(21.25%)[16], 马尾松Pinus massoniana(4.69%)[23]和中间锦鸡儿Caragana intermedia(14.78%)[24], 低于蓝靛果忍冬Lonicera caeruleavar.edulis(32.51%)[25], 山桐子Idesia polycarpa(35.00%)[26], 普通油茶Camellia oleifera(39.67%)[27]和芙蓉李Prunus salicina(54.51%)[28]。可见,不同物种转录组SSR位点的出现频率不同,出现差异的原因除了物种本身差异,还可能与分析数据库大小、SSR挖掘工具及搜索条件有关[13]。
从重复单元频率来看,黑果枸杞转录组的SSR主要类型为单核苷酸重复基序(74.33%),其次为二核苷酸重复(13.30%)和三核苷酸重复(11.81%)。研究发现:多数植物中EST-SSR以二核苷酸和三核苷酸为主,但主要的重复基序类型不同[29]。推测原因可能与SSR搜索参数设置有关,多数植物在进行SSR位点搜索时并未将单核苷酸重复设置为搜索对象[13-14]。
本研究从213 058条Unigene序列中鉴定出73 896个SSR位点,丰富了黑果枸杞EST-SSR标记的数量。为了进一步评估这些EST-SSR引物的质量,从设计到的12 674对EST-SSR引物中随机挑选出128对引物,54对引物未能扩增出产物,原因可能是扩增产物中存在大量内含子或引物设计不合理[30-31];有74对引物成功扩增出产物,引物扩增有效性达57.8%,表明开发的引物质量较高,对后续黑果枸杞种质资源遗传多样性分析、品种鉴定、遗传图谱构建和分子标记辅助育种等均有应用价值。
图1 4个样本在LM-02位点的基因型Figure 1 Genotypes of 4 samples at LM-02 site
表4 28对EST-SSR引物对枸杞种质的遗传多样性检测Table 4 Genetic diversity of 24 wolfberry germplasm revealed by 28 EST-SSR markers