SSR标记的开发及其在棉花中的应用
2020-12-17孙亚莉张海明
孙亚莉,张 晋,张 洁,张海明
(山西农业大学 信息学院,山西 太谷 030800)
棉花(GossypiumL)作为最重要的纤维和油料作物,在我国乃至全世界经济中都占有举足轻重的地位,棉花的大规模生产和与其有关的理论、应用研究一直是各产棉国关注的热点。为适应棉花的大田生产,优良品种是不可或缺的基础资源,棉花新品种选育的中心环节是对产量、品质等相关目标性状的筛选。传统的选择育种或杂种优势育种方法易受材料以及环境的影响,会导致育种周期长、工作量大、育种家的主观因素使选择效率降低等问题。随着分子遗传学尤其是分子标记技术的发展,为解决这一问题提供了新途径,也使作物遗传育种进入了分子育种新阶段[1]。
分子标记是20世纪80年代初快速发展起来的一种新型遗传标记,它主要以核酸、蛋白质等控制遗传及性状的生物大分子突变为基础,以检测生物体遗传结构及变异为目的,从DNA、蛋白质甚至碱基水平上直接准确反应遗传标记位点,从而揭示生物的遗传变异。DNA分子标记检测的对象大到不同发育时期的个体、小到器官、细胞甚至染色体,可供开发的标记数量极多,分布于整个基因组,具有多态性高,遗传稳定性好的特点,受环境的影响小,亦不受基因表达与否的限制。因而,伴随生物技术尤其是测序技术的快速发展,不同类型的分子标记在诸多相关领域均得到广泛应用[2]。
其中,SSR是在各物种中应用较多的一种分子标记,SSR即简单序列重复,又称微卫星DNA,指的是几个(一般1~6)核苷酸为重复单位串联组成的简短序列,在外显子、内含子及染色体上的任一区域均存在[3]。研究发现,组成上,真核生物染色体中每隔大约10~50 Kb的距离就存在1个微卫星[4],以2个核苷酸的重复单位居多,也有一些重复单位为3个核苷酸,4个核苷酸或更多的微卫星极少。结构上,人和动物基因组中的重复单位主要为(TG)[5],植物中(AT)重复较为普遍。生物进化程度越高,其DNA序列中微卫星重复单位所占的比重就越大[6]。
SSR分子标记的应用始于动物基因组[7],目前,在多种农作物中也均有不同程度的开展,虽然随着高通量测序技术的发展,SSR标记逐渐被SNP标记所取代,但其依然在遗传育种中发挥了巨大的作用,鉴此,文章就SSR分子标记技术的基本内容、引物开发以及在棉花遗传育种中的应用进行综述,以期为棉花分子育种提供理论参考依据。
1 SSR分子标记技术的基本原理及特点
SSR标记的发展起源于VNTR(数目可变串联重复序列),对VNTR的保守侧翼序列开发引物,再用PCR方法实现整个VNTR位点的特异性扩增,并于1989年将该法应用于另一种重复DNA序列,即形成SSR标记。
SSR是简单序列重复的英文表达首字母缩写,亦指简单串联重复序列,简单体现在此序列长度一般较短,由1~6个单核苷酸组成,重复次数一般10~50次。重复单位也称SSR座位,根据其两侧的单拷贝序列相对保守的特性,可设计一对特异性SSR引物。以基因组DNA为模板用特异的引物进行PCR扩增,若该扩增区域DNA片段存在变异,则扩增产物因重复率不同而不同,通过聚丙烯凝胶电泳技术可以比较扩增条带的大小,从而对表型存在个体差异进而表现在某个SSR座位上得到的多态性进行检测,此多态性主要依赖于基本单元的重复次数,若在扩增区域有DNA插入片段、碱基的缺失或突变,也会产生多态性[8]。
SSR标记具有如下优点: ①SSR引物序列在植物基因组中具有均匀、随机、广泛的特点,可提供全面的基因组遗传信息;②SSR引物的变异主要体现为重复次数不同,而且是共显性,因而可通过电泳条带区别基因的杂合型和显性纯合型;③重复性好,若引物特异性好,SSR标记使用简单,结果稳定;④多数SSR序列无基因功能作用,增加或减少几个小片段保守重复序列的频率高,在品种间位点变异广泛,多态性高;⑤保守性,SSR引物两端侧翼序列保守性强,利用该特性可以将一个物种的微卫星研究结果应用于另一物种,从而实现对新物种或者无相关信息的物种,更快更准地找到其更多的SSR位点;(6)SSR引物应用阶段实验操作简单,只需要将SSR引物进行PCR扩增,然后凝胶电泳(琼脂糖凝胶电泳或者聚丙烯酰胺凝胶电泳)显色(EB染色或银染)即可。根据SSR标记侧翼序列来源的不同,SSR标记主要分为基因组SSR (Genomic SSR, G-SSR)和表达序列标签SSR ( Expressed sequence tag SSR, EST - SSR)两种。EST-SSR标记来自转录组数据,可以用于功能基因组的研究,也可以鉴定控制重要性状的等位基因,同G-SSR标记相比更有应用价值。EST-SSR标记在棉花中已被鉴定[9,10]。
2 SSR标记及其引物的开发
SSR标记需要根据所研究物种中重复序列两侧的序列信息设计引物,然后才能被用于PCR,所以,SSR标记引物的开发是其应用的首要目标。新SSR标记的创建需要清楚重复序列两翼的序列信息,在测序费用较高的情况下,引物开发有一定的难度,但一旦开发成功,便可以商品化,并通过PCR扩增获得DNA多态性。
SSR标记引物开发的传统方法较耗时费力,具体做法是:构建DNA文库,筛选鉴定微卫星克隆,通过测序或者借助DNA序列数据库信息获得这些DNA克隆的侧翼序列,利用SSR侧翼序列在同一物种有高度保守的特性,设计一对特异性引物来扩增基因组序列,根据插入片段分为大插入片段基因组文库[11]和小插入片段基因组文库[12]两种方法。
此外,人们也在不断挖掘能够简化技术环节、提高效率、降低成本的方法,比如微卫星富集法、利用比较遗传学和SSR标记的可转移性[13]从相近物种获得引物等。
近来,各个物种相应序列数据库迅猛发展,生物信息软件也不断涌现,这为从数以千计的DNA序列中发掘新的微卫星标记提供了便利,基于序列资源的SSRs标记开发也因此更加方便快捷。比如简单序列重复鉴定工具(SSRIT,http://www.gramene.org/gremene/searehes/ssrtool)可以用于挖掘SSRs。王长彪等[14]开发的软件工具——AutoSSR,可用FASTA格式的序列快速发掘和鉴定大量微卫星SSRs,同时可对SSRs类型进行区分,并指明可以借助方便而且有效的软件工具来开发引物,最有效的开发微卫星引物序列的程序是SPU TNIK ( http :/ / abajian. net/sp ut nik/ ) SSRIT[15]和TROLL[16]。
SSR标记的两种类型中,EST-SSR标记的开发,可以不经过构建基因组文库、识别筛选重复序列克隆以及测序等程序,比基因组SSR标记更快速高效、降低成本。
3 SSR分子标记在棉花中的应用
3.1 棉花数量性状基因QTL定位中的应用
QTL作图是指通过性状调查获得数量性状表型数据,并结合分子标记所做的的基因分型,通过作图软件,对基因组染色体中DNA标记所代表的基因型数据与数量性状获得的表型值进行相关性分析,从而将控制数量性状的QTL位点逐一定位到遗传连锁图谱或者染色体上的相应位置,同时可以评估该QTL位点所代表的性状的遗传效应[17]。棉花基因组中同样具有大量的、随机均匀分布的微卫星序列位点,QTL作图方法同样适用,一般都是先构建作图群体,调查获得表型数据,结合分子标记,利用性状和标记存在的连锁关系,即QTL位点和SSR标记位点之间的关联,可将一些控制重要产量、品质等数量性状的功能基因或QTLs进行定位。
关于棉花重要数量性状QTL定位的研究,一直都有学者报道: 杜威世等[18]以海岛棉品种“Ⅱ15-3493” 和陆地棉品种“石河子875” 作为杂交亲本,前者为高抗黄萎病材料,后者高感黄萎病材料,海陆杂交后获得175个F2代单株,将其作为作图群体,结合BSA法筛选获得的多态性SSR引物,构建了由SSR标记组成的遗传连锁群,并在该连锁群上定位到了一个与SSR标记之一相距13.1 cm的黄萎病抗性QTL主效基因位点。Yuksel Bolek等[19]通过对高抗黄萎病的海岛棉Pima S-7和易感的陆地棉Acala44杂交后的F2群体进行SSR分析,构建了包含35个标记的11个连锁群的遗传图谱,其中有15个标记与重要性状有连锁关联,并检测到11号染色体上3个与黄萎病的抗性有很大效应的基因座。Shen[20]等通过对来自于陆地棉7235和TM-1杂交组合的RIL群体进行SSR分析,通过标记构建了全长1 024.4 cm的遗传连锁图谱,以LOD≥ 3.0为标准,筛选出与重要性状有关的一系列QTLs,其中与纤维品质和产量有关有25个。
3.2 棉花遗传图谱构建中的应用
遗传图谱也称连锁图谱、染色体图谱,是依据标记与基因的连锁关系,计算基因与标记之间的重组率,借助分子标记将基因线性排列在某一物种染色体的相对位置上,与基因在每条染色体上特殊的物理位置有一定的区别[17]。
建立遗传图谱,需要选择合适的亲本进行杂交,构建后代分离群体,这决定了遗传图谱建立的难易程度、准确性以及适用范围[21]。遗传图谱的构建不仅是遗传研究的重要内容,它提供了基因在染色体上的坐标,为目标基因定位、基因克隆、重叠群的定位提供了较为精确的位置,而且为鉴定作物种质资源、确定分子育种方法等提供了理论依据[22]。
Ma等[23]以两个二倍体亚州棉材料为亲本进行杂交,用获得的189个F2植株结合6029对SSR引物成功构建了第一个亚洲棉A基因组的种内遗传图谱,该图谱全长2 508.71 cm,覆盖了13个连锁群,并指出A基因组与At、Dt亚基因组的染色体是共线的。杨鑫雷等[24]以两个遗传背景差异很大的陆地棉与海岛棉材料进行种间杂交,以F2群体为作图群体,用ll0个SSR标记和65个AFLP标记构建了由175个标记构成的遗传连锁图谱,该图谱全长2 030 cm,覆盖了棉花全基因组的40.6%,包括42个连锁群,连锁群长度介于4.5~147.3 cm之间,单个连锁群包含2~22个分子标记,标记平均间距为11.6 cm。秦鸿德[25]用4个陆地棉栽培品种种内杂交,形成的四交后代作为作图群体,结合SSR分子标记构建了陆地棉种内遗传图谱,该图谱全长2 113.3 cm,包含56个连锁群,共含有286个SSR标记多态性位点, 覆盖了棉花全基因组的42.3%;单个连锁群含标记2~24个,平均5.2个;连锁群长度介于0.37~125 cm之间,平均38.4 cm;标记平均间距为7.4 cm。此图谱是所报道的棉花遗传图谱中,第1张覆盖率高达40%的陆地棉种内、不同栽培品种间的分子标记遗传图谱。
3.3 棉花分子育种中的应用
传统的育种方法如引种、选择育种、杂交育种、杂种优势育种、倍性育种等方法,都是从表型性状着手,通过优异性状的筛选与累积达到对优异基因聚合的目的,具有一定的盲目性,育种效率较低。近来,随着各类分子标记的开发、遗传图谱的构建以及大量QTLs作图软件的应用,为各种作物的育种方法打开了新的思路,以分子标记辅助选择(Master Assisted Selection , MAS)为最主要的育种辅助选择手段[26]。
MAS将现代分子生物学手段应用于传统的遗传育种中,应用分子标记与目标基因的紧密连锁或共分离关系,同时借助表型数据直接从DNA水平对育种材料中具有优异基因型的个体进行筛选,避免了仅仅依赖于表型性状来间接推断基因型的情况。另外,MAS方法可以直接用F2群体进行标记与基因的关联,缩短了育种年限,大大加速了改良进程,并可以极大的提高育种效率。另外,在传统育种过程中,育种工作者主要根据自身多年育种经验对性状加以选择,受主观因素影响较大,而且最终导致棉花品种遗传基础变窄,若在此决选过程中辅以分子标记手段,可以减轻这一不良影响。
MAS方法对多基因控制的数量性状如许多产量、品质性状的准确选择也同样适用,可有效地减少或避免连锁累赘[27]。对棉花而言,其主要的农艺性状大多为数量性状,易受环境影响,材料个体间差异大,传统育种方式仅仅借助表型选择,不同育种工作者受到的干扰也大,选择效果不理想。金骏培等[28]经过研究发现,将分子标记应用于群体的混合选择,仅一次便可提高表型选择甚至是两轮选择的效果。因此,MAS在棉花这一作物的育种领域也将大有前途。
选择合适的分子标记对于MAS的应用非常关键,如理想的分子标记要建立在PCR基础上,要有很高的重复性,在不同的材料中有广泛的应用性,跟目标基因关联性强, 这些要求SSR标记都符合,是很好的标记。SSR标记的MAS在棉花上也取得了很大进展,Abdurakhmonov等[29]通过SSR标记对大量来自乌兹别克斯坦的野生棉花种质资源进行了分析,以期挖掘与棉花纤维品质性状有关的新的遗传变异,并初步揭示了连锁不平衡在标记辅助选择育种中应用的重要性。王芙蓉等[30]用综合性状优良、抗黄萎病的鲁棉研22号和渐渗了海岛棉优异纤维基因的鲁原343作为亲本,获得杂交后代F2:3家系,对这些材料在不同发病时期进行黄萎病鉴定,发现与黄萎病抗性紧密连锁的两个SSR标记NAU751和BNL1395,含这两个标记的基因型均可以显著增加黄萎病抗性,有加性效应,两个标记的基因型聚合后,能极显著提高后代抗性水平。
3.4 棉花遗传多样性及品种鉴定中的应用
狭义的遗传多样性是指不同种群之间或种内不同个体之间的遗传差异程度或基因的变化。对遗传多样性的研究可以揭示物种或种群的进化历史,了解物种起源的时间、地点、方式,了解物种的群体结构和多样性水平,为进一步分析品种类型、亲本选配、多样性保护等提供依据,是种质资源发掘、开发和利用的前提,也可为植物育种和遗传改良奠定基础。
中国培育和种植的大多数棉花栽培种有遗传背景狭窄,多样性差的问题,原因是这些品种是从岱字棉、福字棉、斯字棉等少数基础种质衍变而来,而这些基础种质又都几乎来自美国[31],这为棉花的遗传多样性鉴定增加了一定的难度,而分子标记技术可以直接从DNA分子水平上揭示个体之间的微小差异以及物种间的区别与联系,对研究背景相对狭窄的棉花种质资源的遗传多样性、创新与鉴定非常重要。
目前,我国国家种质资源长期库中已搜集保存棉花种质资源约8 000多份[32],成为继玉米、水稻、小麦、大豆之后的第5类保护数量最多的农作物,对收集到的数量较多的棉花种质资源的整理、保护、筛选、鉴定及合理利用如新品种的选育、生产和贸易中变得尤为重要[33]。
陈光等[34]用筛选出的24对多态性好的SSR引物对53份海岛棉材料进行遗传多样性分析,检测出多态性基因位点共97个,占总位点数的91.5%,并用标记对53份材料进行聚类分析,发现材料可被分为与系谱来源一致的两大类,证明SSR标记在品种鉴定和遗传多样性研究中有重要的应用价值。Zhang 等用SSR标记对投放超过75年的Acala1517栽培品种(系) 进行了遗传多样性分析,包括的性状有产量、铃形、衣分、纤维长度、纤维强度和纤维细度,结果表明SSR分子标记在品种不同性状的遗传多样性研究中也有重要作用。Stella等将SSR引物应用到亚洲棉核心种质材料的遗传多样性研究中,共筛选了1500多对SSR引物,其中25个SSR标记可用于分析亚洲棉地域多样性。
3.5 棉花种子纯度检测中的应用
种子的生产和贸易是以合格的种子质量为前提的,种子的纯度和真实性检测非常必要。SSR标记与其它技术相比有很大的优越性,在棉花种子纯度检测上有很大的应用价值。秦利等对50对SSR引物进行筛选,最后获得10对多态性好的引物用于新疆近50 a来的50个陆地棉种质资源的基因组DNA进行扩增,进一步从中筛选3对多态性好的引物对新疆主栽品种构建了指纹图谱,并进行了杂交种纯度鉴定的实践验证。刘勤红等用异源四倍体棉花材料筛选出了217对SSR引物,获得了十几个标记位点可用以区分“鲁棉研15号”父母本及其F1群体材料,可准确、稳定和快捷的鉴定 “鲁棉研15号”杂交种的纯度,非常实用。
4 结语
自SSR标记技术创立以来,由于其相对于其他分子标记而言具有很大的优越性,所以,逐渐成为实现现代植物尤其是作物学研究的一个重要技术手段,在棉花方面,不论从品种、种质资源鉴定,遗传图谱的构建,还是功能基因及重要农艺性状的QTLs定位,甚至新品种培育等方面都取得了很大进展。SSR分子标记在物种间有不同程度的通用性被相继证实,为棉花SSR标记的开发提供了新的方向。如,郑丽珊等用111对棉花SSR引物在24个香蕉材料上扩增,也有很高的多态性,获得797个等位基因位点,并对24个香蕉材料进行了聚类分析,结果较好地反映了香蕉品种的遗传组成。
虽然SSR标记与之前的其他DNA分子标记相比开发费用相对较贵,但是SSR位点两侧的序列高度保守的特性,使得SSR引物在不同物种中有不同程度的通用性,我们可以利用这个特点将一个物种的SSR引物用于另一物种,从而更快更准确地开发出该物种更多的SSR引物,而且SSR引物对检测和分析等位基因是比较简单的,尤其是共显性基因。因此SSR标记更适合于材料的聚类分析,遗传多样性分析以及遗传图谱的构建,虽然随着测序技术的发展,SNP标记被大量开发和应用,逐渐替代了SSR标记,但是SSR标记对棉花遗传育种的作用依然是巨大的,毋庸置疑的。
(余参考文献略)