APP下载

基于SSR标记构建广西杉木核心种质*

2022-01-07李魁鹏陈仕昌贺锦锋唐红亮谭文婧余代渊莫宗恒黄开勇

广西科学 2021年5期
关键词:杂合杉木等位基因

李魁鹏,陈仕昌,程 琳,贺锦锋,唐红亮,谭文婧,余代渊,王 斌,莫宗恒,黄开勇**

(1.广西壮族自治区林业科学研究院,广西优良用材林资源培育重点实验室,广西南宁 530002;2.融水苗族自治县国营贝江河林场,广西柳州 545300;3.融安县西山林场, 广西柳州 545400)

0 引言

种质资源是动植物遗传改良的物质基础,在品种选育以及优异材料创制和利用研究中起重要作用。由于盲目开发及生态环境问题,导致物种多样性锐减,种质资源受到世界各国的关注,并相继创建了种质资源库[1],保存收集各类种质资源。随着收集数量增多,保存管护、评价利用方面出现各种困难,且种质资源未能充分发挥其重要作用,故核心种质的概念及其构建的方法得以提出和发展[2,3],其思想是通过合理的方法,从原始种质中筛选代表性的材料构成核心种质,其数量规模远小于原始种质,意在提高种质资源利用效率,发掘优异基因。

我国核心种质研究工作起步于1994年,最先在部分农作物上建立核心种质[4-8],在林木中的有关研究工作相对滞后。目前白桦Betulaplatyphylla[9]、柿Diospyroskaki[10]、灰楸Catalpafargesii[11]、欧洲黑杨Populusnigra[12]、尾叶桉Eucalyptusurophylla[13]、日本柳杉Cryptomeriajaponica[14]、银杏Ginkgobiloba[15]、木荷Schimasuperba[16]和水青树Tetracentronsinense[17]等树种构建了核心种质。多年生林木树体高大,占地面积广,需耗费大量经费管护,建立核心种质可更高效地保护和利用林木种质资源。

杉木Cunninghamialanceolata是我国南方重要的针叶用材树种之一,具速生、材质优等特点,在国家木材储备战略中具有重要地位[18]。广西从20世纪70年代开始进行杉木遗传改良工作,持续收集了不同产区的杉木种质材料,为杉木遗传改良提供了丰富的种质资源[19,20]。随着杉木种质资源收集数量增多,保存与评价利用的难度加剧,因此构建核心种质对充分利用现有杉木种质资源,挖掘优异基因显得尤为重要。本研究通过SSR分子标记技术检测国家杉木良种基地基因库的864份种质材料的遗传多样性,对比分析不同构建方法的差异,从而确定合适的构建方法和取样比例,为广西杉木种质研究和挖掘优异基因提供理论支撑与材料基础。

1 材料与方法

1.1 材料

试验材料来自广西融安县西山林场(25°20′ N,109°23′ E)和融水苗族自治县国营贝江河林场(24°57′ N,109°11′ E)国家级杉木良种基地基因库。杉木种质取样总数为864份,其地理来源分别为广西(605份)、湖南(70份)、广东(55份)、福建(54份)、江西(40份)、贵州(31份)和湖北(9份)。

2019年11月,采集健康且无病害的杉木新鲜嫩叶,放入1.5 mL离心管后,投入液氮罐暂存,带回实验室后于-80℃超低温冰箱保存备用。

1.2 主要仪器及试剂

22对SSR引物[21]由北京睿博兴科公司合成,植物DNA提取试剂盒购自生工生物工程(上海)股份有限公司,NanoDrop-2000型超微量分光光度计购自美国热电公司,ABI 3730xl型基因测序仪购自美国ABI公司,Biometra Tone 96G PCR仪购自德国EasyCycler公司。主要试剂有氯仿、β巯基乙醇、异丙醇、50×TAE等。

1.3 基因组DNA提取及PCR扩增——SSR标记法

杉木种质样本基因组DNA提取按照植物DNA提取试剂盒提供的方法进行。 (1)用1.0%琼脂糖凝胶电泳(150 V、100 mA,15-20 min)检测DNA纯度和完整度。用紫外观测仪观察电泳结果,若DNA分离较好,亮度较好,没有弥散,说明提取的DNA纯度较高且比较完整;若DNA没有分离,亮度较差且存在弥散,则需要重新提取DNA。(2)用NanoDrop-2000超微量分光光度计测定提取的DNA样品浓度。合格标准A260/A280值为1.70-1.90,若不处于此范围则重新提取DNA。提取结果合格的各样品DNA模板(共864份),用TE Buffer统一稀释至15 ng/μL后,于-20 ℃冰箱保存备用。

PCR扩增反应在Biometra Tone 96G PCR仪上进行,反应体系为10 μL:5 μL 2×Taq plus Mix,10 μmol/L正反向引物各0.3 μL,DNA模板2 μL,去离子水加至10 μL。扩增程序:95℃ 5 min;95℃ 30 s,55℃ 30 s,72℃ 30 s (40 个循环);72 ℃ 10 min,4℃保存。PCR扩增产物在美国ABI 3730xl基因测序仪上检测,利用GeneMarker V2.2.0软件读取每个位点的片段大小。

1.4 遗传参数分析

采用GenAlEx 6.502软件[22]统计分析22对SSR引物的等位基因数(Na)、有效等位基因数(Ne)、观测杂合度(Ho)、期望杂合度(He)和Shannon′s信息指数(I)等5个遗传多样性指标,利用Cervus 3.0.7[23]分析SSR引物的多态信息含量指数(PIC)及无效等位基因频率(Fna)。

1.5 核心种质构建方法

按照杉木种质的地理来源进行分组,将864份材料分为广西、湖南、广东、福建、江西、贵州和湖北等7组,根据Core Finder软件[24](简称MC法)、Power Core软件[25](简称MP法)、模拟退火算法(Simulated annealing algorithm)[26]以等位基因数最大化标准(简称SANA法)和模拟退火算法以遗传多样性最大化(Maximizing genetic diversity)标准(简称SAGD法)分别构建核心种质:

(1)按照等位基因数最大化(Maximizing allelic richness)标准(M策略),运用MC法和MP法对原始种质进行分析并抽取核心种质,取样比例由软件自动设定。

(2)根据SANA法,运用Power Marker v3.25软件构建核心种质,取样比例设置为10%、15%、20%、25%和30%。

(3)根据SAGD法,运用Power Marker v3.25软件构建核心种质,取样比例设置为10%、15%、20%、25%和30%。

1.6 数据分析与处理

核心种质构建完成后,利用SPSS 22.0对4种方法构建的核心种质库与原始种质库的相关遗传参数进行有效性t检验,利用主坐标分析法(Principal Coordinates Analysis,PCoA)生成核心种质、原始种质的分布图,进一步确认核心种质的代表性。

2 结果与分析

2.1 PCR扩增结果及遗传多样性分析

对864份杉木种质的遗传多样性进行检测,结果见表1。22个SSR标记的片段大小为96-295 bp。864份材料中:(1)检测到195个等位基因(Na),平均每对引物检测出8.86个等位基因,其中等位基因数最多的引物是SSR12(15)、SSR16(15),其次是SSR8(14),最少的是SSR2(5)、SSR13(5);(2)有效等位基因数(Ne)最多的是SSR8(6.01),其次是SSR12(5.01),最少的是SSR21(1.46),平均为3.13;(3)在观测杂合度(Ho)、期望杂合度(He)和Shannon′s信息指数(I)方面,最高的是SSR8,最低的是SSR21,平均观测杂合度、平均期望杂合度、平均Shannon′s信息指数值分别为0.62,0.65和1.31;(4) 22对SSR引物的多态信息含量指数(PIC)值为0.30-0.82,平均值为0.60,最高的是SSR8,最低的是SSR21,其中中度多态性引物(0.250.5)有18对;(5)22对SSR引物的无效等位基因频率(Fna)均小于0.2,均值为0.03,说明22对SSR引物对遗传多样性参数分析没有影响,结果准确可靠。

表1 广西杉木种质资源的遗传多样性分析

2.2 4种构建方法的遗传多样性差异分析

对4种方法构建的杉木核心种质情况进行遗传多样性分析,结果见表2。4种构建方法的等位基因数(Na)保留率均在75%以上,其中:(1)在等位基因数(Na)方面,MC法和MP法构建的核心种质Na保留比例达100%;SANA法取样比例为10%时,Na保留率最低(丢失了48个等位基因,仅保留147个);(2)在有效等位基因数(Ne)方面,SAGD法和SANA法的核心种质Ne随取样比例增大呈先降低后升高的趋势,最高的是MP法,其次是MC法,最少的是取样比例为25%的SAGD法;MP法、MC法和SAGD(25%)法Ne保留率分别为108.7%、107.6%和99.4%;(3)在Shannon′s信息指数(I)方面,MP法、MC法的核心种质高于原始种质,而取样比例为10%-30%的SANA法和SAGD法,其Shannon′s信息指数值随取样比例增加而升高,均能够保留原始种质97.7%的Shannon′s信息指数值,与原始种质相差不大;(4)在观测杂合度(Ho)、期望杂合度(He)方面,4种构建方法的核心种质保留率均在98.4%以上。SANA法、SAGD法5个取样比例构建的核心种质的等位基因数与原始种质的等位基因数存在显著差异,未能保留所有的等位基因,最高的是取样比例为30%的SANA法和SAGD法(仅保留了174个等位基因,丢失了21个),在抽取的种质数量上比MC法多了179份,但保留的等位基因数没有MC法的多。结合5个遗传多样性指标的保留率及种质数量进行综合考虑,可认为MC法、MP法构建的结果较好。

表2 不同方法构建核心种质的遗传多样性比较

2.3 核心种质的确认

为了验证核心种质的有效性,利用SPSS 22.0分别对MC法、MP法构建的核心种质与原始种质、核心种质与保留种质的5个遗传多样性参数(Na、Ne、I、Ho和He)进行t检验,结果见表3。结果表明:(1)MC法构建的核心种质Na、Ne、I、Ho和He的保留率分别为100%、107.6%、106.9%、100%、103.1%;在等位基因数(Na)和有效等位基因数(Ne) 2个指标上显著高于MC法的保留种质,但与原始种质没有显著差异;(2)MP法构建的核心种质Na、Ne、I、Ho和He的保留率分别为100%、108.7%、107.6%、100%、104.6%;在等位基因数(Na)和有效等位基因(Ne)2个指标上均显著高于Mp法的保留种质,与原始种质没有差异;说明MC法、MP法对原始种质的冗余材料进行了剔除,有效地选择含等位基因多的材料。

表3 遗传多样性参数t检验

将MC法和MP法构建的核心种质进行检验比较,结果表明,两者在Na、Ne、I、Ho和He上没有差异。相较于MP法,MC法仅保留80份种质材料就能保留原始种质的所有等位基因,其遗传重复和冗余度小于MP法,因此最终选择遗传重复低、冗余度低的MC法筛选的80份材料作为广西杉木核心种质。在这80份核心种质中,地理来源为广西的种质最多,有54份(占8.9%),最少的是湖北(2份,占22.2%)(表4)。利用主坐标分析法展示原始种质与核心种质的分布情况,对MC法核心种质作进一步确认(图1),结果显示,核心种质与原始种质均分布在主坐标内且范围相近,说明MC法构建的核心种质的代表性较好。

表4 不同地理来源杉木种质入选MC法核心种质的数量及比例

图1 MC法核心种质的主坐标分析

3 讨论

目前,构建核心种质主要应用表型数据和分子标记数据[27]。多年生林木容易受到环境因素影响,采用传统调查方法得到的表型数据(树高、胸径、叶形、果实大小等)往往不能准确地反映材料间的遗传差异,且数据收集需持续多年观测调查,整个过程耗费巨大的人力和物力[28,29]。相较于传统表型数据,DNA分子标记技术具有费用低、数据获取速度快和不受外界因素影响的特点,能够真实地反映材料间差异及亲缘关系,比表型数据更适用于构建核心种质和遗传多样性分析,被广泛应用于各类种质资源研究[30-34]。

合理的取样比例是成功构建核心种质的决定因素。国内外研究报道中,大多数取样比例为5%-40%[4,8,35-37]。吴昊等[38]利用苗期生长量及种子质量性状的表型数据构建了野生榧树Torreyagrandis种群的初级核心种质,取样比例为36%,并利用分子标记检测初级核心种质,剔除了部分遗传重复的材料,最终保留了15份材料,占原始种质的10.56%;钟永达等[39]基于幼苗及种子的表型数据,用4种不同聚类方法从872份材料中构建了含218份种质材料的中国樟树Cinnamomumcamphora初级核心种质,取样比例为25%;彭婵等[40]报道了含45份南方型美洲黑杨Populusdeltoides的初级核心种质,占原始种质的15%。这些研究结果表明,取样比例随原始种质材料的数量增多而降低。一般来说,由于物种的独特性,其取样比例主要由树种、遗传结构、遗传多样性及种质数量规模决定。本研究中共有864份杉木种质材料,将不同取样比例的结果进行对比分析,其中SANA法和SAGD法的等位基因数随着取样比例增加而增加,但均未能保留原始种质的全部基因,说明这2种方法在构建核心种质时并未能筛选出等位基因数多的材料,存在遗传重复的材料,构建效果较差。而MC法构建结果的取样比例最低(占原始种质的9.3%,筛选出80份种质材料),取样比例低于前人的研究结果[41-43],但在等位基因数(Na)、有效等位基因数(Ne)、Shannon′s信息指数(I)、观测杂合度(Ho)和期望杂合度(He)的保留率上均达到100%,可见Mc法能用较少的种质保留原始种质所有等位基因数,保留效果较好。

不同构建方法直接影响核心种质的代表性和有效性。在进行核心种质构建时,应遵循优先选择特异基因和等位基因数目多的材料,以及尽可能保留含多等位基因的原则,以保证获得的核心种质具有最多的等位基因[44,45]。M策略是以每个位点的等位基因数目最大化为标准,主要通过Core Finder[24]、Power Core[25]和Power Mstrat[46]这3款软件实现,在构建过程中能够剔除材料中的遗传重复,筛选出具等位基因数目多且冗余度低的材料,是目前最具优势的构建方法之一。本研究的MC法、MP法、SANA法是以等位基因数最大化为标准,能够筛选出具等位基因多的材料,而SAGD法是以遗传多样性最大化为标准,筛选出的材料具有较大遗传多样性。结果发现,SANA法和SAGD法构建结果不佳,而Core Finder软件和Power Core软件构建结果的Na、Ne、I、Ho、He等5个遗传参数的保留率高于SANA法和SAGD法,说明MC法和MP法优于SAGD法和SANA法。在选择核心种质材料时,MC法、MP法均选择等位基因数目多且冗余度低的材料,相比而言,Core Finder软件的构建结果比Power Core软件的少了18份,仅用80份核心种质保留了864份原始种质中的全部等位基因,其构成的核心种质库更为精简,遗传重复和冗余度更低。

广西是全国杉木主产区之一,1976年和1979年,广西区内29个种源参加全国杉木产区的种源试验,广西融水种源在两次试验中表现突出,其因适应范围广,单株材积大、树高和胸径生长量高且稳定,被认定为全国杉木优良种源之一。广西属典型的喀斯特地貌,地形复杂多变,山地丘陵居多,北回归线横穿境内,南北温差大,各地种源在生长量和适应性方面存在差异,具较强的地域性。受喀斯特地理隔离影响,广西境内还有一些特异的种质资源,如念水糠杉、白云糠杉和四荣红心杉等[20,47,48]。融江河流域位于全国优良种源南岭的西部,是广西杉木的中心产区[49-51]。本研究广西的605份材料中,主要由融水(262份)、融安(152份)、河池(75份)、桂林(36份)、玉林(34份)、百色(19份)、梧州(13份)、南宁(7份)和钦州(7份)等9个不同市县的种质构成。入选的80份核心种质中,有54份材料来自广西,其中广西杉木中心产区来自融水县(20份)、融安县(15份)的种质材料居多,其余的分别来自河池(7份)、百色(5份)、桂林(3份)、梧州(2份)、玉林(2份)和钦州(1份),本次入选的种质材料基本涵盖了整个广西杉木分布区。未入选核心种质的材料仍不能随意舍弃,当核心种质遭受自然灾害发生衰亡或无当前生产实践所需的高产优质和抗逆性强的重要性状时,可从保留种质中寻找相似材料进行补充[24]。随着核心种质的深入研究,需要及时对核心种质遗传结构和材料进行调整与更新,不断增补新发现的特异材料,使其具有更丰富的遗传变异,更合理的遗传结构。

本研究利用SSR分子标记数据,通过对比分析不同构建方法的差异,从而确定以等位基因数最大化为标准(M策略)、通过Core Finder软件构建广西杉木核心种质的构建方法。由于缺少生长量、抗逆性等表型数据以及SSR分子标记数量的限制,并没有将表型数据和分子数据结合起来构建,今后的研究中仍需收集调查表型生长性状,将两者相结合起来,对核心种质作进一步全面分析和调整。

4 结论

本研究基于SSR分子标记技术,以广西杉木864份种质为材料,通过构建方法筛选,最终确定M策略(Core Finder软件)构建方法,并构建了含80份材料的广西杉木核心种质,其中,种质数占原始种质的9.3%,Na、Ne、I、Ho和He遗传多样性参数的保留率达100%,经主坐标分析和t检验,验证所构建的核心种质与原始种质差异不显著,分布范围与原始种质基本一致,说明构建结果有效且具较好的代表性,可为广西杉木种质资源优异基因资源挖掘、创新利用提供理论依据与材料基础。

猜你喜欢

杂合杉木等位基因
杂合肽Melitten-cathelicidin_BF的生物信息学分析
亲子鉴定中男性个体Amelogenin基因座异常1例
广东汉族人群D18S51基因座等位基因分型现象分析
甘蓝型油菜隐性上位互作核不育系统不育系材料选育中常见的育性分离及基因型判断
广东汉族人群Penta D基因座off-ladder稀有等位基因分析
杉木黄化病的防治技术措施研究
杉木萌芽更新关键技术
杉木育苗化学防除杂草技术
WHOHLA命名委员会命名的新等位基因HLA-A*24∶327序列分析及确认
从翻译到文化杂合——“译创”理论的虚涵数意