APP下载

雄性不育东方百合转录组SSR信息分析及其分子标记开发

2019-04-09王有国崔光芬王祥宁马璐琳杜文文贾文杰

西南农业学报 2019年2期
关键词:基元核苷酸多态性

王 立,王有国,崔光芬,王祥宁,马璐琳,段 青,杜文文,贾文杰*

(1.云南农业大学园林园艺学院,云南 昆明 650201;2.云南省农业科学院花卉研究所,云南 昆明 650205)

【研究意义】百合是享誉世界的著名球根花卉,拥有“球根花卉之王”的美誉,观赏性极佳,随着中国经济的快速发展,人们对于百合鲜切花的需求也在日益剧增[1]。欧美国家自 20 世纪初即开展了百合育种工作,选育了大量优良的杂种系,其中东方百合杂种系是世界,也是中国最为流行的切花运用杂种系[2]。但是由于其花粉量大,往往在运用时容易污染衣物和环境,因此,培育雄性不育的无花粉百合一直是百合育种的重点方向[3]。【前人研究进展】如何开发相关分子标记技术来辅助实现无花粉百合的育种,是该项育种工作中的核心。目前利用分子标记进行的百合研究,主要集中在分析泸定百合[4]、淡黄花百合[5]等不同群体的遗传多样性与亲缘关系方面,运用的是常用的分子标记技术,主要有RAPD、ISSR、AFLP、SRAP[6],也有基于EST序列开发百合SSR分子标记的研究[7],而基于东方百合雄性不育系转录组测序结果开发SSR分子标记,并利用SSR标记进行无花粉百合遗传多样性分析的研究鲜有报道。【本研究的切入点】本研究在雄性不育东方百合转录组测序结果基础上,开发SSR分子标记,并验证其有效性。【拟解决的关键问题】为实现利用SSR分子标记技术进行辅助无花粉百合的育种和品种指纹图谱构建奠定基础。

1 材料与方法

1.1 转录组数据来源

转录组数据来源于云南省农科院花卉所球根中心百合课题组2015年对东方百合高通量测序的结果。测序所用材料:东方百合可育系及其变异不育系造孢细胞期和四分体期花药,每个时期取6朵花花药[3]。分别提取2个时期的花药RNA,测序时将2个时期的RNA分别等量混合后构建文库,每个时期构建2个文库。委托北京诺禾致源生物信息科技有限公司对提取的RNA完成RNA-Seq测序,并通过Trinity方法组装[8]。共得到135 483条Unigenes作为背景数据。

1.2 实验材料及DNA提取

SSR分子标记可用性实验材料为东方百合有花粉品种和云南省农业科学院选育的东方百合无花粉品系,采样共计24份,每个株系取4~5片新鲜叶片,用变色硅胶干燥,室温保存直到DNA提取。

总DNA的提取采用改良的CTAB法进行[4],针对百合多糖较多,增加去蛋白质、多糖的步骤。选取DNA条带清晰,亮度与Marker相当的用来筛选SSR引物。DNA母液稀释后放入-20 ℃冰箱保存。

1.3 转录组 SSR 位点鉴别及 SSR引物设计

用Trinity软件将转录组数据组装,获得转录本序列。组装共得到222 365条Transcript和135 483条Unigene。采用MISA(1.0版,默认参数。)按照各个unit size的最少重复次数标准1-10,2-6,3-5,4-5,5-5,6-5对Unigene进行SSR检测,详见 http://pgrc.ipk-gatersleben.de/misa/misa.html。找出SSR标记之后,采用Primer3(2.3.5版,默认参数)进行SSR引物设计[9]。

1.4 SSR引物筛选

SSR引物由精赛顿生物科技有限公司(云南)合成,从转录组SSR数据库中随机选取71对引物,其中包括各核苷酸重复类型。从供试百合材料中随机挑选 24个个体对71对 SSR引物进行初步筛选(表1)。PCR扩增体系为10 μl:10×Buffer(Mg2+)1 μl;dNTP10 mmol/L 0.8 μl;上下游引物各 0.5 μl;Taq酶0.05 μl;DNA模板 0.5 μl,ddH2O 6.65 μl。扩增反应条件:95 ℃预变性5 min、95 ℃变性30 s、53 ℃(各引物有所不同)退火30 s 、72 ℃延伸30 s,反应34个循环,72 ℃延伸8 min,4 ℃保存。然后将PCR产物用1 %琼脂糖凝胶电泳进行多态性初筛,为了进一步确定引物的多态性,对能扩增出条带的引物再进行2 %琼脂糖凝胶电泳,采用花青素的方法显色,以得到条带多且亮的引物。

表1 供试百合材料

表2 百合转录组中不同SSR类型的数量以及频率

注:c&c*均为复杂重复。

Note: c&c* are complex repeats.

1.5 数据统计

用SSR的出现频率和SSR的平均分布距离来描述SSR。计算公式分别为SSR的出现频率:fc(%)=c/n×100,其中n为无冗余EST数量,c为搜索到的SSR数量;SSR的平均分布距离:fN=N/c,其中,N为无冗余EST数量的总碱基数,c为搜索到的SSR数量。对琼脂糖凝胶电泳结果的处理方法:采用人工读带的方式,在相同迁移的位置上,无带的记为0,有带的记为1,缺失的记为9,进行统计扩增结果,通过参考 Smith等[6]的方法计算多态信息含量(PIC)值。应用 POPGENE Version 1.31软件对标记数据进行遗传参数分析。

2 结果与分析

2.1 百合转录组中SSR 的分布及结构特点

转录组测序共获得135 483条Unigenes,利用 MISA 软件对获得的Unigenes做SSR分析,发现其中11 649条Unigenes序列中包含有12 391个SSR位点,其中包含2个或2个以上SSR位点的序列有742条,占6.4 %。SSR的类型十分丰富,单核苷酸至六核苷酸重复类型共11 948个,同时还存在复杂重复类型443个。

单核苷酸所占比例最大,为 63.94 %;其次是二核苷酸、三核苷酸分别占总 SSR 的 20.65 %和 11.21 %;四核苷酸、五核苷酸、六核苷酸重复类型比较少,分别占 0.46 %、0.10 %、0.06 %,复杂重复类型占3.58 %。转录组 SSR 重复单元的重复次数分布在 5~24次,单核苷酸重复单元主要在10次和10次以上,分别占总SSR的 26.10 %和37.84 %;二核苷酸至六核苷酸重复单元中,5次、6次重复所占比例最大,分别占7.66 %和9.13 %;通过分析,发现二核苷酸重复的次数主要在6、7、8 次;而三核苷酸的重复次数主要在 5、6、7 次。如表2所示。

2.2 转录组 SSR重复类型和频率特征

百合转录组的SSR核苷酸基序类型十分丰富,其中以单核苷酸重复类型为主,单核苷酸主要重复次数为10次和10次以上,以A和T为主。A单核苷酸重复占4种单核苷酸重复的51.1 %,T单核苷酸重复占45.6 %,G单核苷酸重复占2.3 %,C单核苷酸重复占1.0 %,各单核苷酸详细重复情况见图1。

图中纵坐标轴为同类核苷酸某一重复次数所占百分比The vertical axis in the figure means the percentage of a repetition of the same nucleotide图1 单核苷酸重复类型分析Fig.1 The types of mononucleotide repetition

二核苷酸主要以 AT/AT、TA/TA、AG/CT、CT/AG、GA/TC、TC/GA为主,其中,GA/TC所占比例最大,达到 4.70 %,AT/AT占2.59 %,AG/CT 占 3.28 %;三核苷酸重复的主要类型较二核苷酸的类型多,以 GGC/GCC、GAG/CTC、GGA/TCC为主,GGC/GCC占0.68 %,其次是GAG/CTC占0.65 %;四、五核苷酸基序类型较二、三核苷酸基序类型少,TAAA/TTTA、CCCA/TGGG、GTCCG/CGGAC是最主要的几个类型,但所占比重低。详细SSR重复信息如表 3所示。

表3 SSR中二核苷酸和三核苷酸重复基元类型的数量及频率

续表3 Continued table 3

重复单元类型Repeat motifsSSR重复基元类型的数量(个)The number of SSR repeat motifs5次重复6次重复7次重复8次重复9次重复10次重复>10次重复合计频率(%)FrequencyCTC/GAG251451000450.36TG/CAG13210000160.13CTT/AAG14710000220.18GAA/TTC11820000210.17GAC/GTC410100060.05GAG/CTC522260000800.65GAT/ATC13110000150.12GCA/TGC15410000200.16GCC/GGC37691000530.43GCG/CGC251481000480.39GCT/AGC10421000170.14GGA/TCC481561000700.56GGC/GCC5517120000840.68GGT/ACC281130000420.34GTC/GAC410000050.04GTG/CAC13550000230.19GTT/AAC100000010.01TAA/TTA9661000220.18TAC/GTA010000010.01TAG/CTA100000010.01TAT/ATA24840000360.29TCA/TGA800000080.06TCC/GGA 21 221000260.21TCG/CGA 5 10000060.05TCT/AGA 13 021000160.13TGA/TCA 14 700000210.17TGC/GCA 12 320000170.14TGG/CCA 20 1031000340.27TTA/TAA 24 1090000430.35TTC/GAA 15 101000170.14TTG/CAA 4 20000060.05总计 8891123662382359393140394831.86百分比(%)7.179.065.343.082.903.171.1331.86

2.3 SSR引物的有效性验证

随机选取71对引物,其中包括单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸及六核苷酸等6种重复基元的SSR位点进行引物有效性验证。以东方百合材料的24个样品进行PCR扩增,筛选。其中22对引物能扩增出比较理想的产物,有效率为30.99 %。这说明利用东方百合花药EST序列开发的SSR引物是高效可行的。图2为部分引物在24份东方百合样品中扩增的情况。

2.4 SSR引物评价

在71对随机选取的SSR引物中,22对能够成功扩增出条带,有效率为30.99 %。利用验证的22对引物对24份东方百合材料进行扩增及多态性的评价,22对SSR引物在东方百合中表现出多态性,共获得了108个等位基因,分子标记中等位基因最多为10,最少为3,平均等位基因数5个,其中93017,191987,201703和 960002 4个引物的等位基因数分别是10,8,7,5个。观望杂合度的范围介于0.0154~0.4514,均值0.1977,期望杂合度的范围介于0.1547~0.8471,均值0.4533。22个位点的PIC值变化范围在0.1254~0.9248,平均值在0.5048,其中,高度多态的SSR分子标记有11对(PIC≥0.5),表4为22对引物的多态性扩增情况。

图2 部分SSR引物PCR扩增结果Fig.2 PCR amplification results of some SSR primers

表4 百合22个SSRs 标记的特征

续表4 Continued table 4

引物编号Primer No.SSR 基序重复Repeat motif上、下游引物序列Primer sequence 5’-3’Tm(℃)等位基因数Na观测杂合度Ho期望杂合度He多态信息含量PIC203915(CACTGC)13F:TGCCAACATTCTCCGCAGATR:GTGTTGGCAAAGGCAGTGTT6050.42580.33250.5149202350(CCTGCC)8F:GAAAGACCCCTGGGACATGGR:AGACAAGCTCGGGGTTCTTG6040.45140.58140.3269188282(CCGAGC)5F:CCCAAAATGCCCTTCCTCCTR:TGTTTCGAGGGAGTGAACGG6040.21560.21440.3547206853(GGGTG)5F:AGGTGTTCGAGCTTGGGTTCR:AGATTCTCTCAAACGCGGCA6040.15420.36540.1254220620(GTCCG)5F:ACCTAACGGAGCAATGCACAR:GCAAAGCCTGGACGAGTTTC6050.01980.21590.6559203915(CACTGC)13F:TGCCAACATTCTCCGCAGATR:GAGTGTTGGCAAAGGCAGTG6040.24870.44580.4225202620(GTCCG)5F:ACCTAACGGAGCAATGCACAR:GACGGGACAAGCGGACTTAT6050.03650.15470.5874193722(GGGAG)5F:AGGGAAAGGACAGGCTCTCAR:AGTCCTGCGGTGAAGGAAAT6040.24780.32650.2164平均值///50.19770.45330.5048

3 讨 论

随着高通量测序技术的迅猛发展,通过转录组测序来开发EST-SSR引物的成本大为降低,对于类似百合这样由于基因组巨大而缺乏基因组信息的物种,该技术提供了前所未有的机遇,已在许多植物中得到了广泛的应用,如榧树[10],云南松[11],西红花[12],印度南瓜[13],南方红豆杉[14],灯盏花[15]等。大量研究工作表明,利用转录组数据可以挖掘和开发出丰富的SSR 标记[16]。

本研究对东方百合可育系及其变异雄性不育系2个不同发育时期的百合花药进行转录组测序,共组装得到222 365条Transcript和135 483条Unigene。利用MISA程序对筛选得到的1 Kb 以上的Unigene做SSR位点搜索,共获得12 391个SSR位点。SSR位点发生频率为9.14 %,高于菊芋(8.64 %)[17]、鱼腥草(7.51 %)[18]、云南松(3.07 %)[11]等植物,低于西红花(18.73 %)[12]。表明东方百合雄性不育系转录组中SSR数量相当丰富。

通过对基于东方百合雄性不育系转录组开发的SSR重复基元分析发现,该SSR分子标记的重复基元种类繁多,有单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸、六核苷酸以及复杂重复基元等。而重复基元主要集中在单核苷酸、二核苷酸和三核苷酸重复,其中以单核苷酸重复最多,这与榧树[18]的SSR分布类型极为相似、而与印度南瓜[13]、菊芋[17]、云南松[11]等植物多以二核苷酸、三核苷酸重复类型为主的SSR分布类型有所不同,说明东方百合SSR重复基元与其他物种的情况存在相似性,同时也存在一定的差异性。与杜方[19]等研究者基于百合不同器官EST开发的SSR多以二核苷酸和三核苷酸重复为主也有所不同,说明基于同一种植物不同器官组织转录组测序结果开发的SSR分布类型也有所不同。22对可扩增产物的SSR引物中,各对SSR等位基因多,多态信息含量PIC值高,说明SSR引物表现稳定可重复的多态性。

4 结 论

本研究成功筛选出22 对多态性较高、条带清晰、稳定性好的引物。随机对24种不同来源的东方百合可育品种及雄性不育系初筛的引物进行多态性验证分析,结果显示在22对SSR引物中,引物表现稳定可重复的多态性,各个位点的等位基因介于3~8个,平均等位基因数5个,多态信息含量PIC、观测杂合度Ho、期望杂合度He的平均值分别是0.5048,0.1977和0.4533。研究表明通过对东方百合雄性不育系转录组分析可获得较高频率的SSR位点且类型丰富。将为东方百合雄性不育分子标记辅助育种和功能基因的挖掘等奠定基础,同时对东方百合分子标记类型、遗传资源评价、绘制遗传图谱、实现特定性状的辅助选择和进行比较基因组学研究也有重要意义。

猜你喜欢

基元核苷酸多态性
单核苷酸多态性与中医证候相关性研究进展
徐长风:核苷酸类似物的副作用
面向异构履带车辆的统一运动规划方法
MTHFR C677T基因多态性与颈动脉狭窄及其侧支循环形成的关系
RANTES及其受体CCR5基因多态性及环境因素在昆明汉族T2DM发生中的交互作用
CLOCK基因rs4580704多态性位点与2型糖尿病和睡眠质量的相关性
基于多重示范的智能车辆运动基元表征与序列生成
有级转向履带车辆的驾驶员操控行为模型
Acknowledgment to reviewers—November 2018 to September 2019
人体细胞内存在全新DNA结构