基于叶绿体matK基因序列的两份安康野生桑遗传特征分析
2020-10-09王瑞娴楚渠彭云武
王瑞娴 楚渠 彭云武
摘要:对陕西省安康市黄石滩、八仙镇2份野生桑叶绿体基因组进行PCR扩增,获得matK编码基因及其侧翼序列,扩增长度为1 715 bp,ORF长度为1 518 bp,2份序列仅存在1处单碱基差异。利用matK序列分析7份桑树(Morus alba L.)之间的遗传多样性,结果表明,不同品种桑树matK序列相似度较高,仅存在6个单位点碱基差异,定义3种单倍体,单倍型多样度为0.714,核苷酸多样度为0.001 32,平均核苷酸差异为2.000。遗传距离分析表明,八仙镇桑树与印度桑(M. indica)、鲁桑(M. multicaulis)的遗传距离最近,黄石滩桑树与蒙桑(M. mongolica)、华桑(M. cathayana)的遗传距离最近。聚类分析将7份桑树聚为1支,且桑树品种之间的进化支长要明显短于其他科属之间的长度,表明桑树品种间的遗传多样性较低,经历较少进化事件。
关键词:桑树(Morus alba L.);进化分析;遗传多样性;叶绿体;matK
中图分类号:S888.2 文献标识码:A
文章编号:0439-8114(2020)15-0151-04
Abstract: The matK gene sequences of two wild mulberry that collected form Huangshitan and Baxian town (Ankang city, Shaanxi province) have been obtained by PCR. The length of amplified sequences is 1 715 bp while the ORF is 1 518 bp. Only one base difference when compared with each other. The genetic variations of 7 mulberry have been analyzed with the matK genes. The results showed that 6 variable sites were detected, which defined 3 haplotypes in Morus alba, and the haplotype diversity was 0.714. The nucleotide diversity was 0.001 32 and the average nucleotide difference was 2.000 respectively. As for the genetic distances, Baxian was closer to M. indica and M. multicaulis, while Huangshitan was closer to M. mongolica and M. cathayana. Cluster analysis demonstrated that the seven mulberries were grouped together, and the branch was shorter than other species, implied lower genetic diversity and fewer evolutionary events proceeded.
Key words: Morus alba L.; phylogenetic analysis; genetic diversity; chloroplast; matK
桑樹(Morus alba L.)是桑科桑属(Morus)的一种多年生落叶乔木或灌木。桑树可作为某些菌类培养的良好代料,亦可防风固沙,作为绿化和石漠化治理树种,有很高的生态价值。桑叶是家蚕(Bombyx mori L.)惟一的饲料来源,可作为兔、羊、牛、猪等禽畜饲料添加物,同时也被开发成为诸多食品。中国卫生部批准的首批“药食同源”食品中,桑叶名列其中[1-3]。中国是桑树遗传多样性的起源中心之一,目前保存桑树种质3 000余份,分属15个种及4个变种,其中栽培种5个,野生种10个,是世界上桑种最多的国家[4]。对桑树不同品种的亲缘关系及遗传多样性进行研究,对桑树种质资源收集、核心种质保存及新品种选育均具有重要意义。
叶绿体是大多数高等植物必不可少的细胞器,叶绿体基因组(cpDNA)编码110~130个基因[5],其中matK(maturase kinase)编码一种RNA转录体中Ⅱ型内含子剪切的成熟酶,是叶绿体基因组中进化最快的编码基因之一[6,7]。相对于cpDNA中其他基因序列,matK具有较多的A-T碱基对,3′端相对保守,5′端则变异较快,可进行植物科属水平的系统发育研究,在植物属及属以下单位水平上为植物类群系统重建等工作提供较高的支持率[8,9],在2009年被生命条形码联盟(CBOL)植物工作组人员列为DNA条形码鉴定的核心序列之一[10]。滕艳芬等[11]通过分析属间及5种药典收载石斛种间的叶绿体matK基因序列,将不同属及不同种间的正品与混淆品区分开,因此,matK基因序列可用于地道药材的鉴别;刘静等[12]分析了12种药用石斛及密花石豆兰的matK序列,比较其遗传距离和碱基差异,认为matK基因可以在分子水平对石斛不同种及变种进行鉴别,可作为石斛属植物的分子标记。
桑树matK基因研究已有报道,赵卫国等[13]通过对2份桑品种的叶绿体trnL-trnF基因间隔区序列进行研究,得出两者的同源性很高,且与菊科、蔷薇科等都具有同源性;汪伟等[14]对关于桑树 trnL内含子序列的分子系统学进行研究,得出桑树为单系的结论;王晖等[15]对桑树 matK基因进行了生物信息学分析;Kong等[16,17]利用叶绿体基因组对蒙桑(M. mongolica)、华桑(M. cathayana)和鲁桑(M. multicaulis)等品种进行了遗传进化分析。
本研究从2份安康市野生桑叶中提取全基因组,扩增测序获得叶绿体matK序列,分析其序列特征,并分析桑树遗传聚类关系,从DNA水平上对桑树种质资源的遗传多样性进行鉴定,为桑树品种重要农艺性状的基因发掘与利用提供理论依据和应用基础。
1 材料与方法
1.1 桑树
2份野生桑分别采集自陕西省安康市八仙镇(8xian)和黄石滩(HST)。新鲜桑叶表面用乙醇消毒后置于硅胶上快速干燥,超低温保存备用。
1.2 基因组DNA提取
采用SDS-CTAB法提取总DNA。称取0.50 g干燥叶片,液氮研磨成粉末后,迅速加入DNA提取液(20 g/L CTAB,1.4 mol/L NaCl,0.1 mol/L Tris-HCl,20 mmol/L EDTA,pH 8.0),混匀,65 ℃孵育45 min;冷却至室温,加入苯酚/氯仿/异戊醇(25∶24∶1)的混合液500 μL,混匀;4 ℃,12 000 r/min离心10 min,将上清液转移至1.5 mL灭菌离心管中,加2倍体积沉淀液,室温下孵育60 min,4 ℃,12 000 r/min离心10 min;-20 ℃放置15 min,4 ℃,12 000 r/min离心10 min;用350 μL NaCl (1.2 mol/L)溶液溶解沉淀,待沉淀完全溶解后,加350 μL氯仿,混匀;4 ℃, 12 000 r/min离心10 min,上清液转移至1.5 mL灭菌离心管,加0.6倍体积异戊醇,充分混匀;4 ℃, 13 000 r/min离心15 min,弃上清液;70%乙醇洗涤沉淀,12 000 r/min离心10 min,弃上清液,室温干燥后,将DNA溶解在100 μL去离子水中;1%琼脂糖凝胶电泳检测。DNA置于-20 ℃冰箱保存备用。
1.3 序列扩增和测序
根据GenBank中桑树叶绿体基因组序列(登录号NC_025772.2)设计引物。上游引物序列为5′-TGGTGCAGGAACAGGATGAAC-3′,下游引物序列为5′-GAGACCADTACTTGCTTTCAG-3′。引物序列由生工生物工程(上海)股份有限公司合成。
PCR扩增体系总体积50 μL,含20 ng/μL总DNA模板1.0 μL,10×PCR缓冲液5.0 μL,25 mmol/L MgCl2 5.0 μL,2.5 mmol/L dNTPs 2.0 μL,2 μmol/L上、下游引物各0.5 μL,5 U/μL高保真聚合酶1.0 μL,ddH2O 35.0 μL。反应条件为94 ℃预变性4 min,94 ℃变性 40 s,52 ℃退火40 s,72 ℃延伸1 min,共32个循环,最后72 ℃延伸10 min。
PCR产物用1.2%(W/V)琼脂糖凝胶电泳鉴定,切取目的条带,利用OMEGA胶回收试剂盒(OMEGA Gel Extraction Kit,美国)回收和纯化核酸片段,操作步骤按照试剂盒说明书进行。回收获得的PCR产物经过1.2%(W/V)琼脂糖凝胶电泳检测,合格目的条带应表现单一、清晰。检测合格之后的PCR回收产物送生工生物工程(上海)股份有限公司进行测序。
1.4 数据分析
从GenBank中获得蒙桑、川桑(M. notabilis)、鲁桑等桑树叶绿体matK基因序列。利用MUSLE软件包进行核苷酸、氨基酸序列的同源性比对和相似性分析;采用DNAsp统计单倍型,计算单核苷酸位点多态性、平均核苷酸差异、单倍型多样度、核苷酸多樣度等群体遗传学参数;采用MEGA6.0软件以邻接法(neighbor-joining)构建系统发生树,参数为Bootstrap=1 000,Poisson model,gaps/missing处理方式为pairwise deletion。
2 结果与分析
2.1 桑叶形态和序列扩增
八仙镇同株桑叶有全叶和裂叶之分,叶尖呈长尾状,叶基为深心形,叶缘锐锯齿,叶面粗糙有毛。黄石滩桑叶多裂,叶尖呈尾状,叶基为深心形,叶缘锐锯齿,叶面平滑有光泽(图1)。利用所设计的引物,以桑叶基因组为模板进行扩增。经过克隆和测序分析,扩增序列长1 715 bp,其中包含长度为1 518 bp的ORF框,ORF的起始密码子为ATG,终止密码子为TGA(图2),ORF框编码蛋白的结构域分析表明其中含有1个名为matK的保守结构域,表明扩增序列为桑树叶绿体matK基因的开放阅读框及其侧翼序列。
2.2 序列比对
编码序列比对表明,黄石滩和八仙镇桑树matK扩增序列仅在ORF框内660 bp处存在1个单核苷酸位点差异,其中黄石滩桑树为胞嘧啶碱基,八仙镇桑树为胸腺嘧啶碱基。将扩增获得的matK基因编码序列与其他5份桑树的同源序列进行联配比对和遗传多样性分析(图2),结果表明,matK基因在不同桑树之间表现出高度一致性,仅在558、660、716、795、1 188、1 294等6个单碱基位点上出现差异,未出现插入或缺失等变异,核苷酸多样度π为0.001 32,平均核苷酸差异k为2.000,7份桑树matK基因共定义3种单倍型,单倍型多样度为0.714,其中川桑定义1种单倍型,蒙桑、华桑和黄石滩桑树种共享1种单倍型,印度桑(M. indica)、鲁桑和八仙镇桑树种共享另一种单倍型。
2.3 遗传距离和进化分析
从数据库中下载不同种属的代表性matK序列,与桑树matK序列一起计算遗传距离,构建进化树。结果表明,不同桑树品种间的遗传距离为0.000 00~0.003 96。八仙镇桑树与印度桑、鲁桑的遗传距离最近,与川桑遗传距离较远,黄石滩桑树与蒙桑、华桑的遗传距离最近,与川桑遗传距离较远(表1)。进化树聚类表明,不同科属植物分别聚类,其中本研究中2份桑树与其他5份桑树聚为一支,同时桑树品种间的进化支长要明显短于其他科属间的长度,表明桑树品种间的遗传多样性较低,经历较少进化事件(图3)。
3 小结
本研究在2份安康野生桑树叶绿体中扩增得到matK编码基因及其两侧部分序列,2份桑树matK序列仅存在1处碱基差异,并利用该序列分析桑树间的遗传多样性。结果表明,不同品种桑树的matK序列仅在6个位点上存在单碱基差异,品种间的序列相似性水平较高,进化和遗传距离分析表明2份桑树获得的序列与其他5份桑树聚为一支,分别与印度桑、华桑等亲缘关系最为接近,表明本研究中采用的桑树可能是众多桑树资源中新的桑树品种。进化分析还表明,桑树品种间较其他科属植物经历了较少的进化时间。考虑到不同桑树品种间matK序列的高度相似性,matK序列并不能很好地区分桑树品种之间的进化关系,因此在后续研究中采用叶绿体全基因组的分析,可能更有利于分析桑树的遗传多样性、分类及进化关系。
参考文献:
[1] 黄自然,杨 军,吕雪娟. 桑树作为动物饲料的应用价值与研究进展[J]. 蚕业科学,2006(3):377-385.
[2] 范 浩,庄 愉. 桑叶药食同源开发应用研究进展[J]. 现代农业科技,2017(14):78-79, 83.
[3] 曾卫湘. 53份桑资源叶的药用品质评价[D]. 重庆:西南大学,2017.
[4] 中国农业科学院蚕业研究所. 中国桑树栽培学[M]. 上海:上海科学技术出版社, 1985.
[5] 张同武. 植物细胞器基因组测序,组装及比较基因组学研究[D]. 杭州:浙江大学,2012.
[6] HILU K W, LIANG H P. The matK gene: Sequence variation and application in plant systematics[J]. American journal of botany,1997,84(6):830-839.
[7] OZDILEK A, CENGEL B, KANDEMIR G, et al. Molecular phylogeny of relict-endemic liquidambar orientalis mill based on sequence diversity of the chloroplast-encoded matK gene [J]. Plant systematics and evolution,2012,298(2): 337-349.
[8] PLUNKETT G M,SOLTIS D E,SOLTIS P. Clarification of the relationship beteen apiaceae and araliaceae based on matK and rbcL sequence data[J]. American journal of botany,1997,84(4):565.
[9] SPECHT C D, KRESS W J, STEVENSON D W, et al. A molecular phylogeny of costaceae (Zingiberales)[J]. Molecular phylogenetics and evolution,2001,21(3):333-345.
[10] 劉宇婧,刘 越,黄耀江,等. 植物DNA条形码技术的发展及应用[J]. 植物资源与环境学报,2011,20(1):74-82, 93.
[11] 滕艳芬,吴晓俊,徐 红,等. 石斛及其常见混淆品的matK基因序列比较[J]. 中国药科大学学报,2002(4):18-21.
[12] 刘 静,何 涛,淳 泽. 药用石斛的叶绿体matK基因序列分析及鉴别[J]. 药学学报,2009,44(9):1051-1055.
[13] 赵卫国,张志芳,潘一乐,等. 桑树trnL-trnF基因间隔区序列的特点及分析[J]. 蚕业科学,2002,28(2):83-86.
[14] 汪 伟,王兴科,朱昱萍,等. 基于trnL内含子序列的桑属植物分子系统学初探[J]. 蚕业科学,2008,34(2):298-301.
[15] 王 晖,高妍夏,高德满,等. 桑树matK基因的生物信息学分析[J]. 北方蚕业,2014,35(4):14-17.
[16] KONG W Q, YANG J H. The complete chloroplast genome sequence of Morus mongolica and a comparative analysis within the fabidae clade[J]. Curr genet, 2016, 62(1):165-72.
[17] KONG W Q, YANG J H. The complete chloroplast genome sequence of Morus cathayana and Morus multicaulis, and comparative analysis within genus Morus L[J]. Peerj, 2017, 5:e3037.