西藏砂生槐EST—SSR引物开发及多态性检测
2016-01-27符亚茹,李少珂,姚卫杰,等
符亚茹,李少珂,姚卫杰,等(78)
摘要:砂生槐为青藏高原特有灌木种,具有重要生态价值。开发多态EST-SSR 引物对其居群遗传多样性研究及保护策略的制定具有重要意义。利用SciRoKo v3.4软件对前期获得的砂生槐转录组中146 943个转录本进行扫描共发现9 428个SSR位点。转录本中的微卫星种类十分丰富,其中以三核苷酸和五核苷酸重复最多,分别占SSR总位点数的33.32%和21.70%,重复次数主要集中在3~9次重复。其中(AG/CT)n、(GA/TC)n、(GAA/TTC)n、(AAAAT/ATTTT)n 重复基序最多,占总重复基序的4.50%、 4.34%、 3.13%和2.44%。本研究中设计130对EST-SSR引物,有80对扩增出预期大小条带,经变性聚丙烯酰胺凝胶电泳检测,最终有11对具有较高多态性,且对于30个模板得到的位点平均等位基因数为2.9;观测杂合度(HO)和期望杂合度(HE)平均值分别为0.423 9和0.336 4。
关键词:砂生槐;转录本;EST-SSR;多态性;引物
中图分类号: S718.43文献标志码: A文章编号:1002-1302(2015)11-0078-04
收稿日期:2014-12-19
基金项目:国家自然科学基金(编号:31260189);西藏特色农牧资源研发协同创新中心建设——高原生态。
作者简介:符亚茹(1988—),女,陕西西安人,硕士研究生,主要从事高原植物分子生态研究。E-mail: fuyaruxw@126. com。
通信作者:李慧娥,博士,副教授,主要从事高原植物分子生物学研究。E-mail: lihuiesh@126.com。砂生槐[Sophora moorcroftiana (Benth.) Benth. ex Baker]为青藏高原特有豆科槐属矮灌木。主要分布在青藏高原海拔2 800~4 400 m的西藏“一江两河(雅鲁藏布江、拉萨河、年楚河)”河谷宽谷段的沙质地上,在雅鲁藏布江宽河谷形成大片群落[1]。该树种为青藏高原干旱河谷半固定沙地上的先锋灌丛植物[2]。由于其极强的抗旱、防风固沙特点,目前已成为青藏高原人工造林先锋树种,具有重要的生态价值。但由于砂生槐分布区的过度放牧及薪炭过度樵采等人为干扰,导致青藏高原独有的砂生槐种群严重退化,甚至一些种群正逐步消失,为此对砂生槐的保护迫在眉睫。
基于遗传学与分子生物学的植物遗传多样性研究为资源保护提供了新的理论指导。分子标记是遗传多样性研究的重要手段之一,常用DNA分子标记中简单重复序列(simple sequence repeats, SSR)[3]又称微卫星(microsatellite)[4],因其具有共显性分离、重复性强、DNA样本用量少、位点专一且多态性高等优点[5],已广泛运用于植物遗传多样性分析中[6-9]。本实验室前期已经获取了砂生槐的转录组数据(GenBank 登录号: SRP041237)[10],这为成功开发砂生槐多态EST-SSR引物提供了前提,本研究则基于此转录组数据开发用于分析砂生槐遗传多样性的多态EST-SSR引物。
1材料与方法
1.1试验材料
来自于青藏高原不同分布区的共30个砂生槐单株用于多态SSR引物开发。
1.2总DNA提取和检测
取砂生槐叶片0.3 g,采用改良无液氮CTAB法[11]提取总DNA。琼脂糖凝胶和微量紫外分光光度计(NanoDrop 2000 C,美国)对其浓度和纯度进行精确检测,-20 ℃保存备用。
1.3SSR引物来源及引物设计
用高通量Illumina 2代测序技术对砂生槐RNA样本进行测序,得到clean data 数据。再利用CLC Genomics Workbench v6.5(CLC Bio, Denmark)软件对高通量数据进行拼接分析,最后用SciRoKo 3.4[12]软件对转录组所有转录本进行SSR位点扫描。从中选取三重复基元最终设计并合成130对SSR引物用于多态引物筛选。
利用Primer Premier 6.0软件,对含有SSR位点的EST序列进行引物设计,设定标准为:GC含量40%~60%,退火温度55~60 ℃,引物长度范围17~25 bp,扩展片段长度110~200 bp。
1.4PCR扩增及电泳检测
PCR扩增体系为20 μL:上下游引物各1 μL,DNA模板3 μL (10 ng/μL),PCR扩增Mix (康为世纪生物科技有限公司,北京)10 μL,超纯水5 μL。PCR扩增条件为:94 ℃预变性4 min;95 ℃变性30 s,退火30 s,72 ℃延伸40 s,35个循环;72 ℃延伸5 min。
用浓度为2%的琼脂糖凝胶对PCR产物进行检查,查看是否有预期大小扩增产物。然后对能扩增出条带的产物进行8%变性聚丙烯酰胺凝胶电泳检测[13],以10 bp DNA maker (广州东盛)作为分子量标准,电泳后银染[14]染色,在凝胶成像系统(GBOX-F3-E,英国)对条带进行扫描分析,并照相保存。
1.5数据处理和分析
根据扩增产物条带的迁移率,对照分子量标准分别统计每个位点等位基因片段长度,获得数据矩阵。用软件PowerMarker v3.0[15]对每个位点等位基因数(NA)、观测杂合度(HO)和期望杂合度(HE)、连锁平衡(LD)和哈温平衡(HWE)进行检测及评价。
2结果与分析
2.1砂生槐转录组SSR位点扫描
用SciRoKo 3.4软件默认参数对146 943个砂生槐转录本进行扫描共发现9 428个SSR 位点,其SSR 数量、类型及频率见表1,SSR中主要重复基元的类型及频率见表2。由表1、表2可知,SSR种类丰富,且不同类型SSR出现频率不同,除单核苷酸外,其他核苷酸重复所占总SSR比例从12.61%到33.32%;以三、五核苷酸重复为主,分别占SSR总数的33.32%和21.70%;其他类型所占比例相对较小,其中四核苷酸最少;重复次数主要集中在3~9次重复。从不同 SSR 基元出现频率来看(表2),二核苷酸中以(AG/CT)n和(GA/TC)n为主,所占其重复基元的比例分别为33.41%和32.23%;三核苷酸种类丰富,其中以(GAA/TTC)n、(AAG/CTT)n和(AGA/TCT)n最多,分别占其重复基元的11.94%、7.61%、7.49%,其他较少;四核苷酸中以(AAAT/ATTT)n最多,占13.05%;另外五、六核苷酸分别以(AAAAT/ATTTT)n和(AAAAAT/ATTTTT)n最多;占总重复基元的主要重复基元类型是AG/CT (4.50%)、GA/TC(4.34%)、GAA/TTC (3.13%)和AAAAT/ATTTT(2.44%)。基于此扫描结果根据SSR位点侧翼序列共设计并合成130对引物供筛选。
2.2扩增产物长度差异的SSR引物
首先用130对引物对2个来自不同分布区的砂生槐DNA模板进行PCR预扩增,2%琼脂糖凝胶电泳结果显示其中80对引物扩增出预期大小条带(图1)。用此80对引物对30个不同分布区的模板进行扩增的PCR产物经8%变性聚丙烯酰胺凝胶电泳检测(图2),最终有41对引物对不同模板的扩增显示出差异,其中有19对差异变化较大,其引物信息见表3。
2.3多态SSR引物筛选
用PowerMarker 3.0软件对表3中19个SSR位点进行分析,结果表明,其中8个SSR位点分析结果偏离哈温平衡达极显著水平。因此,最终筛选11个多态SSR位点,其等位基因数(NA)、观测杂合度(HO)和期望杂合度(HE)、连锁平衡及哈温平衡分析结果见表4。
3讨论与结论
对于缺乏基因组信息的物种来说,欲开发应用于遗传多样性的多态SSR引物成本高、耗时长。基于高通量转录组数据开发多态EST-SSR引物具有开发成本低、操作简便、信息量大等优势而被广泛应用[17]。砂生槐因其分布范围狭窄、分布地交通不便等原因一直没有相关基因组序列被公开报道,本研究基于实验室前期获得的转录组数据,设计的SSR引物表3砂生槐扩增产物长度差异的EST-SSR引物中 61.5%能在基因组DNA上扩增出预期大小条带,未成功扩增的引物可能是由于:2条引物被内含子隔开;引物位置恰好位于内含子或外显子剪切点;EST片段发生了变化等而导致无法有效扩增。
砂生槐高通量转录组中微卫星的种类非常丰富,从单核苷酸到六核苷酸都具有丰富的类型,其中以三核苷酸和五核苷酸重复为主,分别占SSR总数的33.32%和21.70%,目前在大多数物种如豌豆[18]、苹果[19]、红豆杉[20]、杜仲[21]等中,研究发现二核苷酸和三核苷酸是最常见的转录组SSR重复基序类型。主要重复基元的比较分析表明,二核苷酸中的
表411对砂生槐多态EST-SSR位点信息
位点NAHOHEP(Seq-Bon)Sm2430.509 40.700 00.039 0(0.007 3)Sm5030.235 00.266 71.000 0(0.050 0)Sm6920.444 40.400 00.702 0(0.025 3)Sm7730.539 40.500 00.144 0(0.012 7)Sm8220.497 80.266 70.007 0(0.006 4)Sm8550.570 60.233 30.000 0(0.004 6)Sm9540.501 70.366 70.002 0(0.005 1)Sm10120.432 80.300 00.097 0(0.010 2)Sm11230.399 40.266 70.087 0(0.008 5)Sm12230.212 80.133 30.004 0(0.005 7)Sm12720.320 00.266 70.303 0(0.017 0)Mean2.90.423 90.336 4 注:本表中所筛选的11个SSR位点为表3中加粗位点。
AG/CT重复,三核苷酸中的GAA/TTC重复,四核苷酸中的AAAT/ATTT重复和五核苷酸中的AAAAT/ATTTT重复在各类重复基元中所占比例最大,六核苷酸各重复类型所占的比例都较低,这与桑树[23]较为相似。EST-SSR发生频率和密度、重复基元类型在不同物种间存在较大差异,这可能与物种基因组组成、转录组测序方法、数据量大小、微卫星搜索标准等不同有较大的关系。物种三核苷酸基序数量较多可能是对自然选择机制的一种积极响应,这对物种的生存竞争具有重要意义,且三核苷酸基序的SSR位点具有转高的遗传变异[22],因此本研究主要选取三核苷酸基序的SSR位点设计引物进行分析。
对不同植物种类SSR位点分析结果显示,每个SSR位点的平均等位基因数约为10.0,期望杂合度约为0.61[24],本研究中,80对砂生槐EST-SSR严格控制分析结果后,最终有11对引物显示出较高的多态性。在这11个位点中尽管Sm24和Sm77位点的遗传多样性相对于其他位点来说较高,但多数位点平均等位基因数和期望杂合度都低于上述平均值,这可能是因为文献所列这2项指标的平均值仅基于部分物种所得引起的偏差及砂生槐分布范围狭窄所致。
综上,利用砂生槐转录组数据开发多态EST-SSR引物是可行的,同时最终筛选出的这11对多态EST-SSR引物可以用于后期砂生槐天然居群遗传多样性分析、核心种质库构建、分子标记辅助育种、功能基因挖掘等研究中。
参考文献:
[1]吴征镒. 西藏植物志:第二卷[M]. 北京:科学出版社,1985:716-717.
[2]赵文智. 砂生槐沙生适应性初步研究[J]. 植物生态学报,1998,22(4):92-97.
[3]Tautz D,Trick M,Dover G A. Cryptic simplicity in DNA is a major source of genetic-variation[J]. Nature,1986,322(680):652-656.
[4]Litt M,Luty J A.A hypervariable microsatellite revealed by in vitro amplification of a dinucleotide repeat within the cardiac muscle actin gene[J]. American Journal of Human Genetics,1989,44(3):397-408.
[5]艾先涛,梁亚军,沙红,等. 新疆自育陆地棉品种SSR遗传多样性分析[J]. 作物学报,2014,40(2):369-379.
[6]孙清明,马帅鹏,马文朝,等. 荔枝两个F1杂交群体的EST-SSR鉴定及多样性分析[J]. 分子植物育种,2014,12(1):87-95.
[7]王静,王旗,徐璟琨,等. SSR和EST-SSR技术在小麦锈菌研究中的应用[J]. 河北农业科学,2014,18(3):63-66.
[8]Rumeu B,Sosa P A,Nogales M,et al. Development and characterization of 13 SSR markers for an endangered insular juniper (Juniperus cedrus Webb & Berth.)[J]. Conservation Genetics Resources,2013,5(2):457-459.
[9]Mishima K,Hirao T,Watanabe A,et al. Isolation and characterization of microsatellite markers for Thujopsis dolabrata var. hondai (Cupressaceae)[J]. American Journal of Botany,2012,99(8):E317-E319.
[10]Li H E,Yao W J,Fu Y R,et al. De novo assembly and discovery of genes that are involved in drought tolerance in Tibetan Sophora moorcroftiana[J]. PLoS One,2015,10(1):e111054.
[11]张剑侠. 中国野生葡萄抗病基因标记及辅助育种应用研究[D]. 杨凌:西北农林科技大学,2006.
[12]Kofler R,Schloetterer C,Lelley T. SciRoKo:a new tool for whole genome microsatellite search and investigation[J]. Bioinformatics,2007,23(13):1683-1685.
[13]萨姆布鲁克. 分子克隆实验指南[M]. 3版.北京:科学出版社,2002:418-424.
[14]王西平. 中国葡萄属野生种抗白粉病基因克隆与序列分析[D]. 杨凌:西北农林科技大学,2004.
[15]Liu Kejun,Muse S V. PowerMarker:an integrated analysis environment for genetic marker analysis[J]. Bioinformatics,2005,21(9):2128-2129.
[16]Moran M D. Arguments for rejecting the sequential Bonferroni in ecological studies[J]. Oikos,2003,100(2):403-405.
[17]李小白,向林,罗洁,等. 转录组测序(RNA-seq)策略及其数据在分子标记开发上的应用[J]. 中国细胞生物学学报,2013,35(5):720-726,740.
[18]Mishra R K,Gangadhar B H,Nookaraju A,et al. Development of EST-derived SSR markers in pea (Pisum sativum) and their potential utility for genetic mapping and transferability[J]. Plant Breeding,2012,131(1):118-124.
[19]Azad M K,Nasiri J,Abdollahi H. Genetic diversity of selected iranian quinces using SSRs from apples and pears[J]. Biochemical Genetics,2013,51(5/6):426-442.
[20]吴琼,段小群,陈旭,等. 基于高通量测序的红豆杉EST-SSRs标记研究[J]. 中国中药杂志,2012,37(24):3728-3733.
[21]黄海燕,杜红岩,乌云塔娜,等. 基于杜仲转录组序列的SSR分子标记的开发[J]. 林业科学,2013,49(5):176-181.
[22]Blanca J,Canizares J,Roig C,et al. Transcriptome characterization and high throughput SSRs and SNPs discovery in Cucurbita pepo (Cucurbitaceae)[J]. BMC Genomics,2011,12(1):104-108.
[23]高丽霞. 桑树EST-SSR引物开发[J]. 南方农业学报,2013,44(8):1254-1257.
[24]Nybom H. Comparison of different nuclear DNA markers for estimating intraspecific genetic diversity in plants[J]. Molecular Ecology,2004,13(5):1143-1155.王爱玲,张敏,郑贺云,等. 甜瓜红心脆和早皇后再生体系的建立[J]. 江苏农业科学,2015,43(11
:82-85.