基于转录组序列的叶用芥菜奶奶青菜EST-SSR标记开发与遗传多样性分析
2021-10-09陈春艳刘针杉何远宽
马 杰,屈 雯,陈春艳,王 磊,马 俊,刘针杉,马 维,周 平,何远宽,孙 勃,*
(1.毕节市农业科学研究所,贵州 毕节 551700; 2.四川农业大学 园艺学院,四川 成都 611130)
叶用芥菜隶属于芥菜(Brassicajuncea),是一类重要的十字花科芸薹属蔬菜,在我国栽培历史悠久,分布范围广泛。奶奶青菜是西南地区的一种叶用芥菜,在贵州、四川等地冬春季节有较大的栽培面积和消费市场,其营养丰富,含有丰富的维生素C、类胡萝卜素和芥子油苷等[1-2]。奶奶青菜是西南地区地方特色蔬菜,不同品种间表型差异明显,具有较好的应用和推广前景。为了保护奶奶青菜的优异种质资源,并促进资源的有效区分和合理利用,奶奶青菜的遗传多样性研究显得尤为重要。
简单重复序列(simple sequence repeat, SSR)是一类由1~6个碱基组成的基序串联重复而成的DNA序列[3],因其具有共显性、数量丰富、多态性高、重复性好、易检测、操作简单等优点,被广泛应用在遗传多样性分析、遗传图谱构建与亲缘关系等研究领域[4]。根据SSR的来源可将其分为基因组SSR和EST-SSR(表达序列标签,expressed sequence tag,EST)2大类型[5],其中EST-SSR标记更加保守,拥有更高的转移率[6-7]。此外,转录组序列多集中在功能基因上,因此,基于转录组数据开发的SSR标记有利于后期与重要农艺性状进行关联分析,为分子标记辅助育种中亲本选育工作节省时间和成本。目前对芥菜的遗传多样性[8]、亲缘关系[9]和品种鉴定[10]等方面已有一些研究,但关于奶奶青菜遗传多样性的研究还未见报道。本研究利用转录组数据开发出奶奶青菜的EST-SSR标记,并对其遗传多样性进行分析,旨在筛选适合奶奶青菜SSR标记的核心引物,为奶奶青菜的种质资源评价和亲缘关系分析提供参考。
1 材料与方法
1.1 试验材料
本试验收集了30份奶奶青菜材料,另有3份其他芥菜材料(叶用芥菜、茎用芥菜和根用芥菜各1份)和2份芸薹属蔬菜材料(大白菜和甘蓝)分别作为种内和属内对照材料,材料信息如表1所示。
表1 供试材料的基本信息
1.2 试验方法
1.2.1 转录组测序
采集不同品种奶奶青菜的成熟叶片等量混合,委托北京诺禾致源生物公司进行转录组测序与分析。
1.2.2 基因组DNA的提取
试验材料种植于四川农业大学园艺学院基地,用草炭、珍珠岩、蛭石体积比2∶1∶1的混合基质种植,待长至4~5片真叶时取中部叶片,液氮冷冻研磨,采用改良CTAB法提取基因组DNA[11]。用1.0%琼脂糖凝胶电泳检测DNA质量,-20 ℃储存备用。
1.2.3 引物设计与合成
采用MISA软件(http://pgrc.ipk-gatersleben.demisamisa.html)对奶奶青菜转录组的unigene基因进行搜索,搜索条件为单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸、六核苷酸最少重复次数分别为10、6、5、5、5、5次。利用Primer3软件设计引物,引物长度18~27 bp,预计扩增产物长度100~280 bp,GC含量40%~60%,退火温度53~58 ℃。随机挑选出37对引物送往生工生物工程(上海)股份有限公司进行合成。
1.2.4 PCR反应
PCR反应体系为20 μL:DNA模板30 ng,2×EasyTaqPCR SuperMix for PAGE 10 μL,上下游引物(10 mmol·L-1)各1 μL,去离子水补足20 μL。PCR反应扩增条件:95 ℃预变性2min;95 ℃变性10 s,49~54 ℃退火30 s,72 ℃延伸15 s,30个循环;72 ℃延伸10 min。初筛采用1.5%琼脂糖凝胶电泳检测,复筛采用8%非变性聚丙烯酰胺凝胶电泳检测。
1.2.5 数据统计
采用人工读带的方法,将聚丙烯酰胺电泳图上可重复的清晰条带记为“1”,同一位置条带较弱或无条带记为“0”,以此建立原始数据矩阵。利用Popgene1.31和PIC-CALC软件进行SSR位点的遗传多样性分析,利用NTSYS-pc1.0软件进行聚类分析。
2 结果与分析
2.1 叶用芥菜奶奶青菜转录组中SSR位点的分布与特点
通过对叶用芥菜奶奶青菜的46 386条unigene序列(序列总长约51 117.115 kb)进行搜索发现,在13 544条unigene序列中含有18 720个SSR位点,其中,3 772条unigene含有2个或2个以上SSR位点。SSR的发生频率(含SSR的unigene基因数/总unigene条数)为29.20%,平均每2.73 kb出现1个SSR,分布频率(SSR个数与总unigene条数之比)为40.36%。单核苷酸重复是主要类型,占总SSR位点的49.39%;其次是三核苷酸和二核苷酸重复,分别占25.44%和24.13%;四核苷酸、五核苷酸和六核苷酸重复类型数量较少,均不足1%。所有SSR位点中,11~20次重复的SSR位点最多,共5 855个,占总数的31.28%;>20次重复的SSR位点最少,只有374个,仅占总数的2.00%(表2)。叶用芥菜奶奶青菜SSR位点的长度从10~76 bp不等,总长274 587 bp,平均长度14.67 bp;其中,长度在12~19 bp的SSR位点数量最多,有11 007个,占总数的58.80%,长度<12 bp的有5 547个(29.63%),长度≥20 bp的SSR有2 166个(11.57%)。
表2 叶用芥菜奶奶青菜SSR的类型、数量与分布比例
2.2 叶用芥菜奶奶青菜转录组SSR基序重复类型和频率特征
从叶用芥菜奶奶青菜转录组SSR核苷酸基序类型看,18 720个SSR位点包含93种重复基元,单核苷酸至六核苷酸重复类型分别有2、4、10、18、24、35种。单、二、三核苷酸重复类型数量占比最多,出现最多的基元分别是A/T(9 172个,占49.00%),其次是AG/CT(3 472个,占18.55%)和AAG/CTT(1 658个,占8.86%)。在单核苷酸重复基元中,以A/T为主,占单核苷酸总重复数的99.20%。在二核苷重复基元中,以AG/CT为主,占二核苷酸总数的76.85%。在三核苷酸重复基元中,AAG/CTT、AGG/CCT和ATC/ATG的数量较多,分别占三核苷酸总数的34.82%、16.82%和16.19%(表3)。
2.3 核心引物筛选与通用性检测
随机挑选37对SSR引物,以30份叶用芥菜奶奶青菜的混合DNA为模板,进行初步筛选,其中32对引物可扩增出条带,占引物总数的86.49%,表明引物设计较为合理。利用8份叶用芥菜奶奶青菜材料(DG-1、CCB-1、DG-4、GYQ-2、BD-1、XJ-3、DXQ-1、JS-1)进行复筛,筛选出23对具有多态性的引物,占复筛引物数的71.88%,占设计引物总数的62.16%。之后用全部30份奶奶青菜材料进行第3次筛选,并用其他芥菜和芸薹属蔬菜进行通用性检测,部分引物(M2-1、M2-8、M5-4、M2-9)第3次筛的聚丙烯酰胺电泳结果见图1。最终得到17对多态性高、带型清晰的奶奶青菜SSR引物,占总引物的45.95%(表4)。利用17对核心引物共扩增出153条条带,多态性条带有135条,每对引物平均扩增出9条条带,多态性条带平均7.9条,平均多态率88.2%。扩增条带数最多的引物是M2-8和M2-18,均为15条,最少的是M5-2,只有3条。17对引物中有11对引物在其他5种芸薹属蔬菜中可以全部扩增出条带,具有较好的通用性;M2-5、M2-11、M2-15、M2-20、M5-2、M5-4等6对引物可以在1~4种芸薹属蔬菜中扩增出条带,也具有一定的通用性。
序号1~35同表1。
表4 叶用芥菜奶奶青菜SSR核心引物序列与扩增信息
2.4 遗传多样性分析
遗传多样性分析结果如表5所示,17对SSR核心引物在30份奶奶青菜材料间共扩增获得97个等位基因,每个位点等位基因数(Na)为3~9个,平均每个位点等位基因数5.705 9个,平均有效等位基因数(Ne)为2.397 8个,有效等位变异率(有效等位基因数占观测等位基因数的比例)为42.02%。其中,引物M2-11等位基因数最多,有9个,引物M3-2有效等位基因数最多,为4.905 4。有效等位基因数低于观测等位基因数,说明在基因组中存在一些高频率的等位基因。多样性指数(I)平均值为1.036 1,最小位点是M5-2,最大位点是M3-2,变化范围是0.224 5~1.674 5。观察杂合度(Ho)为0~0.969 7,平均值为0.312 1。期望杂合度(He)为0.094 7~0.808 4,平均值为0.530 0。Nei’s期望杂合度的平均值是0.521 9,变化范围是0.093 1~0.796 1。多态性信息含量(PIC)为0.090 8~0.765 7,平均为0.476 4,其中8对引物是多态性信息含量大于0.5的高多态性引物,占核心引物数的47.06%。结果表明,通过这17对引物能够揭示30份叶用芥菜奶奶青菜材料的遗传多样性。
表5 十七对SSR核心引物的遗传参数
2.5 聚类分析
根据17对核心引物扩增数据,采用非加权组平均法(unweighted pair-group method with arithmetic means,UPGMA)对30个叶用芥菜奶奶青菜供试材料进行聚类。由图2可以看出,30个供试叶用芥菜奶奶青菜材料的遗传相似系数(GS)为0.661~0.987,表明这些材料的遗传背景较为相似。其中,GYQ-1与GYQ-2之间的遗传相似系数最大(0.987),表明两者间亲缘关系较近。在GS=0.677处可将供试材料分为3类:90%的材料(27种)为一类,剩下ZC-2和CCB-1聚为一类,CCB-4单独为一类。在GS=0.730处可分为5类:86.67%的材料(26种)为一类,剩下的ZC-2、CCB-1、CCB-4、GYQ-3各为一类。
图2 三十份叶用芥菜奶奶青菜材料SSR标记的聚类分析
3 结论与讨论
本研究利用奶奶青菜转录组数据,从46 386条unigene序列中检索发现了13 544个unigene基因中含有18 720个SSR位点,平均每2.73 kb出现1个SSR位点,SSR发生频率为29.20%,与同为芸薹属的其他蔬菜相比,明显高于甘蓝(6.0%)[12]、花椰菜(12.09%)[13]、白菜(18.44%)[14],低于菜薹(55.03%)[15];SSR分布频率为40.36%,高于菜薹(24.26%)[15]、甘蓝(6.22%)[12]、花椰菜(16.12%)[13]、白菜(34.84%)[14]。虽然同为芸薹属蔬菜,但是SSR位点的发生频率与分布频率的不尽相同,可能与SSR位点搜索软件的算法、筛选条件、转录组中的unigene数和物种的基因组差异有关,还可能与测序深度和样品来源等因素有关[16]。
大多数植物的SSR类型以二核苷酸、三核苷酸重复类型为主,而主导重复基序因物种不同而不同[17-18]。奶奶青菜转录组中SSR位点的种类比较丰富,单核苷酸到六核苷酸都有出现,单核苷酸最多,占总数的49.39%,其次三核苷酸和二核苷酸占总SSR的25.44%和24.13%,与芸薹属蔬菜菜薹[15](单核苷酸41.11%、三核苷酸29.67%、二核苷酸28.23%)相似,与白菜[14](单核苷酸39.70%、二核苷酸33.06%、三核苷酸25.55%)有所不同。表明奶奶青菜转录组序列开发的SSR位点具有偏好性,单核苷酸和三核苷酸类型的SSR较为稳定,这可能与物种的特异性有关。在93种重复基元中,AT、AGCT、AAG/CTT依次占比最多,分别占单核苷酸、二核苷酸、三核苷酸的99.20%、76.85%、34.82%,这与菜薹[14]、大白菜[19]等芸薹属蔬菜的结果一致。研究表明,单核苷酸、二核苷酸、四核苷酸和五核苷酸重复主要与非翻译区(UTR)相关,而三核苷酸、六核苷酸重复主要发生在编码序列(CDS)内,奶奶青菜单核苷酸最多,其次三核苷酸、二核苷酸较多,说明其转录组unigene中包含更多的UTR信息[20]。
研究表明,SSR标记的多态性与SSR位点中重复序列的长短相关,重复序列愈长,多态性的可能性越高,且当SSR重复序列≥20 bp时,出现多态性的比例高;重复序列长度在12 ~19 bp出现多态性的可能性明显下降,而低于12 bp的SSR位点多态性极低[21-22]。本研究中17对多态性引物均来自于≥20 bp的重复序列。奶奶青菜转录组中18 720个SSR位点有2 166个≥20 bp,由此推测这些位点可能具有较高的多态性。
本试验中,随机挑选37对来自奶奶青菜转录组的SSR引物,32对有效扩增产物中有17对引物可扩增出条带清晰、稳定性好、多态性高的产物,占总检测引物的45.95%,高于菜薹[14]的40%,低于大白菜[16]的70.9%、花椰菜[13]的60.71%。不同物种的多态性引物比例不尽相同说明这与引物合成的随机性和供试材料的数量有一定的关系[23]。虽然奶奶青菜转录组SSR位点的扩增效率略低,但是SSR位点的多态性较高(88.2%),说明开发出的引物能较好地表现出30份奶奶青菜的遗传多样性。
利用17对核心引物对30份奶奶青菜进行遗传多样性分析,结果表明,这些奶奶青菜材料存在丰富的遗传多样性,试验结果高于张海焕[24]的芸薹属SSR遗传多样性(I、PIC和Nei指数分别是0.536 0、0.560 6和0.362 6),低于青花菜[25]的PIC(0.680 0),表明不同芸薹属蔬菜间的结果不尽相同,这可能与材料、开发过程不同有关。陈发波等[26]利用SSR标记检测到16份芥菜变种间的遗传相似系数为0.41~0.75,表明这些芥菜变种具有一定的遗传多样性。宋慧等[9]利用RAPD和SSR引物检测到41份芥菜种质间遗传相似系数为0.31~1.00,表明该研究中搜集的芥菜种质差异大,蕴含丰富的遗传基因。本试验中奶奶青菜遗传相似系数为0.661~0.987,说明材料间的遗传背景较为相似。聚类结果显示,遗传差异与地理分布没有明显的相关性,这可能与收集材料的遗传变异幅度较小,以及材料间的基因交流频繁有关。
本研究基于转录组数据成功开发了奶奶青菜SSR位点,并筛选获得17对核心引物,成功应用于30个奶奶青菜材料的遗传多样性和聚类分析。研究结果丰富了奶奶青菜EST-SSR标记引物库,为今后奶奶青菜和叶用芥菜的种质资源鉴定、亲缘关系分析、分子标记辅助育种等研究提供了引物支持和技术参考。