APP下载

紫芽六堡茶转录组SSR位点序列分析

2022-03-03梁燕妮黄银霞魏诗琴陈秋雨

江苏农业科学 2022年3期
关键词:六堡基元点数

梁燕妮, 黄银霞, 魏诗琴, 陈秋雨

(梧州学院,广西梧州 543002)

六堡茶因其原产于广西壮族自治区梧州苍梧县六堡镇而得名,为广西特色优质的历史名茶,并以其“红、浓、陈、醇”的特性闻名于世。六堡茶的制作以六堡镇的群体种茶树为原料,六堡群体种茶树为灌木型中小叶种,树势开展,分枝密。从芽色分,以青苗茶为主,占60%,紫芽茶占20%,茶树红紫色芽叶是一种特异茶叶资源,紫芽六堡茶树由于富含花青素成为当前茶树新品种开发利用的热点及研究的重点。

简单重复序列(simple sequence repeat,简称SSR)别称微卫星DNA,以1~6个碱基为核心序列,具有多态性高、重复性好、稳定性高等特点,随着现代分子技术的发展,SSR技术已广泛应用于植物分子辅助育种、种质资源遗传多样性、绘制遗传图谱等方面的研究中。毛娟等利用30对茶树核心SSR引物,对3个代表性的野生和栽培大理茶居群进行遗传分析。陈春林等从紫娟茶树转录组 46 041 条单基因簇(unigene)中筛选出57 976个SSR位点,并对SSR序列的分布特征进行了分析,筛选出44对高质量引物。班秋艳等对陕西及临近8个省份118份茶树资源利用表达序列标签(EST)-SSR分子标记进行了遗传多样性分析。但目前尚未见针对紫芽六堡茶SSR位点的分析报告。本研究基于转录组测序,首次对紫芽六堡茶转录组SSR位点的分布及其序列特征进行分析,以期为今后紫芽六堡茶品种选育、功能基因标记等提供基础依据。

1 材料与方法

1.1 试验材料

所用鲜茶叶于2021年6月采自广西壮族自治区梧州六堡镇四柳村群体种六堡茶。分别采摘1芽1叶的紫芽、绿芽六堡茶叶片,用离心管装好,迅速放入液氮中保存。每个样品3次重复。将采集的样品委托深圳华大基因股份有限公司进行转录组测序。

1.2 SSR位点搜索

针对Raw数据,本试验采用SOAPnuke软件进行数据的过滤与质控,将包含接头污染的读长(reads)、未知碱基N含量大于5%的reads以及质量值低于10的碱基含量大于20%的reads去除,以获得高质量序列。使用Trinity对干净读序(clean reads)进行组装,然后使用Tgicl对转录本进行聚类去冗余得到unigene。使用MISA( http://pgrc.ipk-gatersleben.de/misa)对获得的unigene进行SSR位点搜索,搜索标准为单碱基重复次数12次以上,双碱基重复次数6次以上,三碱基和四碱基重复次数5次以上,五碱基和六碱基重复次数4次以上;2个SSR之间的间隔碱基数>100 bp,SSR位点距离两端侧翼序列>150 bp。使用Primer 3 对检测到的SSR进行引物设计。

1.3 数据分析

所得数据使用Excel软件进行处理分析,包括SSR位点的出现频率、基元类型、基元组成、平均距离等。其中,SSR位点出现频率是搜索到的SSR总数与unigene序列总数的比值;SSR位点的平均距离是搜索到的SSR总数与总unigene长度之比,根据这些数据所反映出的特征可以对SSR 位点的分布特征和序列特征进行分析。

2 结果与分析

2.1 紫芽六堡茶转录组中SSR 位点的分布特征

通过对紫芽六堡茶叶片进行转录组测序,共获得去冗余的unigene序列 165 570 条,总长度为 240 177 233 bp,其中G+C占41.49%。利用软件SSRFinder对这些序列数据进行搜索,共在10 058 条unigene中找到符合条件的SSR,总长为 238 833 bp,SSR位点发生的频率为6.04%,其中,8 867 条unigene含单个SSR位点,1 191条unigene 序列含有1个以上的SSR位点。共检出 11 482 个SSR位点,出现的频率为6.93%。SSR分布的平均距离为 20.92 kb,即平均每 20.92 kb就出现1个SSR(表1)。

表1 转录组各SSR位点的分布特征

2.2 紫芽六堡茶转录组SSR的基元类型

紫芽六堡茶转录组中具有较为丰富的SSR碱基类型(表2)。其中重复率最高的为双碱基,占SSR位点总数的55.01%,其次为三碱基、六碱基,分别占28.64%、8.22%,其他的重复碱基类型所占比例较低(图1)。各重复碱基类型的出现频率存在一定差异。主要集中在双碱基和三碱基重复上,占总SSR的83.65%。其中,双碱基重复类型出现频率最高,为3.81%,出现频率最低的是单碱基重复,仅为0.11%。从分布情况看,转录组中平均每20.92 kb就出现1个SSR,不同重复类型间平均分布距离存在差别。其中,单碱基重复的平均分布距离最长,为1 264.09 kb;其次是四碱基重复,平均分布距离为839.78 kb;双碱基重复的平均距离最短,为38.03 kb。紫芽六堡茶转录组SSR位点的序列总长度为238 833 bp,平均长度为20.80 bp。

表2 紫芽六堡茶转录组SSR位点不同基元类型的分布状况

2.3 紫芽六堡茶转录组SSR重复基元分析

紫芽六堡茶转录组SSR重复基元的序列特征详见表3。由单碱基到六碱基重复基元种类数分别为 2、6、30、48、121、460 种,共667种。各碱基重复基元的数量分布不均衡,其中,单碱基重复基元数量最多的是 A/T,共186个,占SSR总位点数的1.62%,占单碱基重复基元总数的97.89%。双碱基重复基元中,数量最多的类型是GA/TC,共 2 185 个,占SSR总位点数的19.03%,占双碱基重复基元总数的35.45%;其次是AG/CT,共2 165个,占SSR总位点数的18.86%,占双碱基重复基元总数的34.28%。三碱基重复基元中,数量最多的类型是GAA/TTC,共345个,占SSR总位点数的3.00%,占三碱基重复基元总数的10.49%;其次是AGA/TCT,共288个,占SSR总位点数的2.51%,占三碱基重复基元总数的8.76%。四碱基重复基元中,数量最多的类型是AAAT/ATTT,共55个,占SSR总位点数的0.48%,占四碱基重复基元总数的19.23%。

表3 SSR 位点重复的基元序列特征

五碱基重复基元中,数量最多的类型是AAAAG/CTTTT,共48个,占SSR总位点数的0.42%,占五碱基重复基元总数的10.50%。六碱基重复基元中,数量最多的类型分别是AAAAAT/ATTTTT、CAAAAA/TTTTTG、GATGAA/TTCATC,各有22个,各占SSR总位点数的0.19%,各占六碱基重复基元总数的2.33%。转录组中不同SSR重复基元类型的比例详见图2。

2.4 紫芽六堡茶转录组中各基元的重复次数

SSR的多态性受重复碱基序列长度的影响,而重复碱基序列长度由SSR重复次数决定。通过对紫芽六堡茶转录组中不同基元类型SSR位点重复出现次数的统计(表4)可知,6种基元重复次数主要集中在4~12次,重复出现4~12次的SSR位点数共计9 941个,占总SSR位点数的86.58%。其中,重复出现6次和5次的SSR位点数最多,分别占总SSR位点数的16.63%(1 910个)、15.89%(1 825个);其次为重复7次和8次的,分别占总SSR位点数的10.53%(1 209个)、9.80%(1 125个)。统计发现,在重复出现6次的SSR位点中,双碱基最多(1 062个),其次是三碱基(673个),五碱基最少(仅20个)。重复出现5次的SSR位点中,三碱基最多(1 375个),四碱基、五碱基、六碱基的数量差别不大。SSR位点重复次数在12次以上的基元占总SSR位点数的13.42%。不同基元类型不同重复次数的SSR位点数分布情况见图3。从图3可以看出,随着重复次数的增多,SSR位点的数量逐渐下降。

表4 不同基元类型不同重复次数的SSR 位点数量

2.5 紫芽六堡茶转录组SSR重复片段的长度分布

紫芽六堡茶转录组SSR重复片段的长度分布情况见图4。SSR序列长度变化在12~70 bp之间,平均长度为20.80 bp。其中长度为24 bp的SSR位点数最多,共有1 838个,占SSR总数的16.01%。长度在12~20 bp的SSR有6 424个,占SSR总数的55.95%;>20 bp的SSR有5 058个,占SSR总数的44.05%。双碱基中最常见的长度是12 bp(1 021个,9.24%),长度变化幅度最大,最小为 12 bp 最长为70 bp。三碱基中最多的长度为15 bp(1 375个,11.98%)。四碱基、五碱基均以20 bp为主,分别有186(1.62%)、307(2.67%)个。六碱基中长度以24 bp(668个,5.82%)数量最多。

3 讨论与结论

通过对紫芽六堡茶进行转录组测序,共获得165 570 条unigene序列,总长度为240 177 233 bp,共搜索到11 482个SSR位点,出现频率为6.93%,略低于杨华等报道的茶树转录组中SSR位点出现频率(9.64%),但高于南方红豆杉(2.07%)、杜仲(2.90%)、短丝木樨(4.64%)、银杏(5.95%)、马尾松(3.45%)、云南松(3.07%)、甘薯(4.4%)等植物。紫芽六堡茶转录组SSR分布的平均距离为20.92 kb,分布水平高于云南松(29.00 kb)、杜仲(26.31 kb)、藤茶(31.69 kb)等植物。与其他已报道的茶树比较(表5)可知,紫芽六堡茶的SSR位点出现频率和平均距离与其他茶树存在较大差异,这可能与本研究中搜索SSR的算法不一致、数据处理方法不同、以及进化程度不同等因素有关。总体来说,紫芽六堡茶转录组中SSR位点的种类和数量还是较为丰富的,可为今后分子育种提供依据。

表5 不同茶树品种SSR位点信息比较

大多数研究表明,植物SSR重复基元以双碱基与三碱基重复为主。本研究发现紫芽六堡茶转录组SSR重复基元以双碱基重复最多,占SSR位点总数的55.01%,其次为三碱基重复,占SSR位点总数的28.64%,这与陈春林等报道的茶树SSR优势重复类型一致。银杏、猕猴桃、杏树和桃树等植物也是以双碱基重复为主。而玉米、水稻、小麦等禾谷类作物则以三碱基重复为主。经统计,紫芽六堡茶单碱基的优势重复基元为A/T,与已报道的大多茶树单碱基优势重复基元一致;双碱基的优势重复基元为GA/TC,而已报道的茶树中则多以AG/CT为主;三碱基的优势重复基元为GAA/TTC,与龙井43一致;四碱基的优势重复基元为AAAT/ATTT,与龙井43、舒茶早、云抗10号、紫鹃等茶树一致;五碱基的优势重复基元为AAAAT/ATTTT,与舒茶早、云抗10号一致;六碱基的优势重复基元为AAAAAT/ATTTTT,与云抗10号一致(表6)。表明基于转录组测序得到的SSR位点中可能普遍大量存在这类重复基元,推测可能是某些特定的DNA家族或者辅助合成某些优势蛋白。此外,在搜索到的紫芽六堡茶SSR位点中还发现了在高等植物转录组中较为少见的CG/GC 重复基元11个,以及在双子叶植物中不常见的CCG/CGG重复基元45个,这些位点可能与一些特定的生理功能,如抗逆性、信号传导、代谢调控等有关,表明紫芽六堡茶的SSR位点具有一定的特异性。

表6 不同茶树品种SSR位点重复基元序列最多的碱基组成

有研究认为,SSR的多态性与SSR基元重复次数及序列长度密切相关。一般认为重复次数越多,长度越长,多态性越高,当重复次数>12次时,多态位点含量高,紫芽六堡茶基元重复次数在12次以上的占13.42%。当SSR长度在12~20 bp之间时,多态性表现一般;当SSR长度>20 bp时,则具有较高的多态性。紫芽六堡茶转录组的SSR平均长度为20.80 bp,其中序列长度>20 bp的占44.05%,高于四球茶(33.22%)、龙井43(19.77%)以及舒茶早(8.65%)。表明紫芽六堡茶转录组SSR具有很高多态性和利用价值。

综上所述,本研究结果表明,紫芽六堡茶的SSR种类丰富、可用性高、多态性高。可为进一步开发紫芽六堡茶功能基因SSR分子标记奠定基础,对六堡茶种质资源的保护及茶树特定性状的辅助选育、基因组学的研究等方面都具有重要的意义。

猜你喜欢

六堡基元点数
面向游戏场景生成的细分插槽WFC算法研究
参观六堡开茶节游记
六堡茶机采茶园建设与管理关键技术
人体细胞内存在全新DNA结构
看不到的总点数
与茶相逢在六堡
画点数
破解“心灵感应”
多核并行的大点数FFT、IFFT设计
Numerical Modeling and Analysis of Gas Entrainment for the Ventilated Cavity in Vertical Pipe*