香樟及近缘种的亲缘关系分析
2022-04-15孙维红万晓会韩国勇邹双全邹小兴
向 双, 孙维红, 万晓会, 丁 乐, 韩国勇, 邹双全, 邹小兴
(1.福建农林大学林学院,福建 福州 350002;2.福建省林业调查规划院,福建 福州 350001; 3.福州植物园,福建 福州 350000)
香樟(Cinnamomumcamphora)为樟科(Lauraceae)樟属(Cinnamomum)植物,是重要的自然生态树种,也是宝贵的芳香植物资源,集香料、药用、材用等多功能于一体[1].研究表明,其枝、叶、果均含有丰富的化学成分[2-5],如黄酮类、糖苷类、挥发油、木脂素类等,具有抗癌止痛、驱虫抑菌、抗氧化等多种药理活性[6],利用价值高,开发意义大.香樟也是越南、韩国、日本、中国台湾和大陆地区的间断分布种.然而香樟种类繁多,有不同的化学型,引种混乱,给实际生产与利用带来了挑战.研究不同香樟无性系的遗传结构,探讨其亲缘关系,对制定香樟种质资源保护策略、指导优良种质资源筛选和相关优异基因挖掘具有重要意义.
分子标记技术在研究不同品系间亲缘关系和遗传多样性方面应用广泛[7],包含简单重复序列(simple sequence repeat, SSR)[8]、相关序列扩增多态性(sequence related amplified polymorphism, SRAP)[9]、随机扩增多态性DNA(random amplifed polymorphic DNA, RAPD)[10]、扩增片段长度多态性(amplified fragment length polymorphism, AFLP)[11]等标记方式.SNP(single nucleotide polymorphism)即单核苷酸多态性,是由单个核苷酸变异导致的DNA序列多态性.目前所有DNA分子标记中多样性最为丰富的标记技术就是SNP标记,具有数量多、分布广、代表性强、遗传稳定性好等优点[12].SNP标记近年来快速发展,已逐步成为遗传结构分析、遗传多样性评价和遗传连锁图谱构建[13-16]的首选方法.本研究通过对香樟无性系及近缘种进行全基因组重测序开发SNP标记,解析了18份樟科资源(特别是16份香樟无性系)的亲缘关系,探讨不同无性系间的系统演化关系,为不同香樟无性系的鉴定评价以及进一步的收集和保存提供依据.
1 材料与方法
1.1 供试材料
收集永安林业苗圃14个福建选育的芳樟(Cinnamomumcamphoravar.inalooliferaFujita.)无性系,福建省中益制药有限公司连城基地的1个四川宜宾油樟(C.longipaniculatum)、1个江西的龙脑樟(Cinnamomumcamphorachvar. Borneol)和1个肉桂(C.cassia)无性系,以及1个福建建瓯的沉水樟(C.micranthum),共18份无性系.于2019年7月采集所有样品的嫩叶,用75%酒精和纯水洗净,经液氮处理后,置于-80 ℃冰箱中保存.样品名称及来源见表1.
表1 样品名称及来源信息Table 1 Sample names and origins
1.2 基因组DNA提取
18份无性系基因组DNA的提取采用改良的CTAB方法[17],以1.0%(质量分数)琼脂糖凝胶电泳检测,并利用Nano-drop 2000紫外分光光度计(Thermo,美国)检测DNA的纯度和浓度.
1.3 测序与质控
测序工作由华大基因完成,在全基因组水平上对样品进行重测序分析.利用Trimmomatic软件实现对数据的质控,将原始数据进行拆分、过滤.接头序列、长度太短的序列以及低质量读段、N率较高的序列被滤除,最终获得质量高的读段.
1.4 SNP标记筛选
以测序香樟基因组作为参考基因组,利用BWA[18]将序列比对到参考序列上,采用贝叶斯模型对参考序列存在的多态性位点进行筛选和过滤.利用ANNOVAR软件对检测筛选出的SNP进行功能注释[19].
1.5 亲缘关系分析
基于筛选的多态性SNP,使用MEGA 7[20]软件构建不同香樟无性系及近缘种的系统进化树,采用NJ(neighbor-joining)算法[21]以及p-distance模型,bootstrap重复1 000次.不同种间的遗传距离用系统进化树的分支长度体现,长度越短即代表两份种质之间的亲缘关系越近.使用Cluster软件[22]对供试无性系进行主成分分析.
1.6 精油提取与成分分析
分别收集芳樟类群(编号1~11)混合叶、油樟类群(编号12~15)混合叶和龙脑樟(编号16)成熟健康、无病虫害的叶片.香樟精油提取采用水蒸汽蒸馏法[23].称取100 g香樟(芳樟、油樟或龙脑樟)叶鲜品,50 ℃下烘干至含水率为5%~13%,粉碎后置于500 mL挥发油提取器中,加入200 mL超纯水加热提取,提取时间为60~90 min.对提取出的芳樟精油进行GC-MS[24]分析,根据峰面积确定各化学组分的相对质量分数.色谱条件:初温68 ℃,以15 ℃·min-1升温至150 ℃,然后以5 ℃·min-1升温至200 ℃,再以15 ℃·min-1升温至280 ℃,进样口温度为250 ℃.进样量为0.1 μL,载气为氦气.质谱条件:EI离子源250 ℃,四级杆150 ℃;电子能量70 eV;电子倍增管电压1 347 V,扫描质量45~450 u.
2 结果与分析
2.1 测序数据
本次测序共获得有效数据209 Gb.根据设定的过滤参数进行数据过滤,以香樟基因组作为参考基因组,利用BWA软件比对序列,将所有的测序数据比对到参考基因组上.其中,基因组大小是720 Mb,杂合率为2.94%,重复率为62.77%,组装完整度达到95.3%,参考基因组GC含量为40%.所有样本的比对率较高,平均有效测序深度16 ×.从测序结果来看,数据准确,能满足后续信息分析的要求.
2.2 SNP位点检测
通过重测序检测,18份无性系共获得约209 308 831个高质量SNP,其中,纯合SNP共165 814 908个,杂合SNP共43 493 923个(表2).纯合比率为62.49%~97.54%,平均值为79.67%;杂合比率为2.46%~37.51%,平均值为20.33%.
表2 香樟及近缘种SNP统计结果Table 2 SNP information of C. camphora and its related species
2.3 系统进化树
基于不同香樟无性系的SNP标记用MEGA7软件建立系统发育树(图1).近缘种肉桂首先被分离出来,之后是沉水樟.系统进化树将16份香樟无性系分为龙脑樟、芳樟类群和油樟类群.11份芳樟无性系(包括香樟187号、香樟195号、香樟120号、香樟114号、建阳5号、漳浦1号、漳浦5号、漳浦6号、漳浦2号、漳浦4号和武平系香樟)聚在一起,说明其亲缘关系较近.牡丹1号、铁10、香樟209号与油樟聚在一起,说明其与油樟亲缘关系较近.龙脑樟被单独分为一类,在系统进化位置上靠近油樟类群.
2.4 主成分分析
主成分分析结果如图2所示.香樟及近缘种被分为3个类群,其中类群1为11个芳樟无性系,对应系统进化树中的芳樟类群,其距离比较近,说明他们遗传关系较近.肉桂也位于类群1,说明其与芳樟类群遗传关系较近.类群2为牡丹1号、铁10、香樟209号、油樟和龙脑樟,对应系统进化树中油樟类群和龙脑樟.类群3为沉水樟,与其他香樟无性系距离较远,说明其遗传关系较远.油樟处在类群1与类群2之间,推测为种间杂交品系.主成分聚类结果与进化树分析基本一致,说明其结果准确.
图1 基于SNP构建的香樟及近缘种系统进化树Fig.1 Phylogenetic tree of C.camphora and its related species based on SNP markers
2.5 精油化学利用类型
采用GC-MS对芳樟、油樟、龙脑樟3种化学型进行精油成分分析,结果显示3种樟树的精油成分有明显差异(表3).芳樟精油中芳樟醇为主要成分,占比46.92%;油樟精油中桉叶油素为主要成分,占比30.31%;龙脑樟精油中樟脑为主要成分,占比46.28%.根据所测得的精油主要化合物及利用类型,分为3种化学型,分别为芳樟醇型、油樟型和樟脑型.SNP标记分类结果与精油成分的分类结果一致,验证了结果的准确性.
表3 3种化学型樟树精油的主要成分Table 3 Main components in essential oil of 3 groups of Cinnamomum
3 讨论
香樟为樟科植物,亚热带阔叶树种,在我国种植广泛.根据其精油成分的种类与含量将香樟分为不同类型.另外,表型标记常被用来划分植物类型,但易受环境影响,准确性不高[25].与表型标记相比,分子标记不受环境或生理因素影响,是评估植物亲缘关系和群体结构的有效工具[26].本研究基于全基因组重测序技术开发的SNP标记,解析不同香樟无性系的亲缘关系,共获得209 Gb原始数据,平均有效测序深度16 ×.共获得约209 308 831个高质量SNP,纯合SNP共165 814 908个,杂合SNP共43 493 923个.
本试验所用的1~14序号的香樟主要为福建选育的芳樟醇精油利用型,龙脑樟由江西引种,为樟脑利用型;油樟从四川宜宾引种,为桉叶油素利用型.从系统进化树可知11份芳樟无性系聚在一起,3份芳樟无性系与油樟聚在一起,沉水樟先被分离出来.值得注意的是,牡丹1号、铁10、香樟209号为闽选香樟,选育为芳樟醇精油利用型,但从亲缘关系来看,其与油樟亲缘关系更近.而邢建宏等[27]的研究表明,在猴樟、云南樟和油樟中,油樟与樟树亲缘关系最远,这可能与油樟在演化过程中逐渐出现较大分化有关;也可能是在长期的繁衍过程中,杂交使得其组内基因发生了改变[28].主成分分析同样将16份香樟无性系分为3类,分别为芳樟类群、龙脑樟和油樟类群.而主成分分析显示肉桂与芳樟类群有较近的亲缘关系,但系统进化树中肉桂先分化出来,并未与芳樟类群聚在一起.芳樟在进化过程中独立成为分类学上的种[28],但其可能保留了部分肉桂血缘. 系统进化树与主成分分析和化学利用类型结果一致,反映了结果的准确性,为樟树优良无性系的选育提供了基础.张国防等[29]对樟树不同化学型的研究也表明不同化学型樟树样本间的遗传关系与其叶精油的主成分有一定的相关性,并且,他们也将芳樟型样本归入脑樟[30],这与本研究中的部分闽选芳樟醇型与油樟聚在一起是一致的,原因在于不同化学型樟树基因间的交流, 形成了复杂的遗传关系.
4 结论
通过对16个香樟无性系和2个近缘种进行重测序分析,共获得209 Gb原始数据,平均有效测序深度16×.共获得约209 308 831个高质量SNP,纯合SNP共165 814 908个,杂合SNP共43 493 923个.从系统进化树可知:11份芳樟无性系聚在一起,3份芳樟无性系与油樟聚在一起,然后与龙脑樟聚在一起,沉水樟和肉桂先被分离出来.主成分分析结果表明16份香樟无性系分为3类,分别为芳樟类群、龙脑樟和油樟类群;芳樟、龙脑樟和油樟精油成分存在差异,为不同的化学利用类型.