中国亚热带地区3种榧属植物叶绿体微卫星特征分析
2018-09-28李建辉刘丽丽
李建辉,刘丽丽
(浙江省衢州市农业科学研究院,浙江衢州 324000;衢州学院化学与材料学院,浙江衢州 324000)
王蕾
(国家林业局林产工业规划设计院,北京 100010)
榧属(Torreya)植物隶属于红豆杉科(Taxaceae),共有7种2变种,我国有5种2变种,包括榧树(T.grandis)、长叶榧(T.jackii)、巴山榧(T.fargesii)、四川榧(T.parvifolia)、云南榧(T.fargesiivar.yunnanensis)、九龙山榧(T.grandisvar.jiulongshanensis)和日本榧(T.nucifera),其中日本榧为引进栽培种,榧树、长叶榧、巴山榧、四川榧、九龙山榧为我国亚热带地区的特有种,但九龙山榧植株数量极为有限,四川榧则是近年来发表的新种[1]。榧属植物是一类古老珍稀的孑遗植物,具有重要的经济价值和科学研究价值,我国榧属所有种类均被列为国家二级重点保护野生植物[2],且大部分被收录于IUCN濒危物种红色名录[3]和《中国物种红色名录》[4],目前亟需制定合理有效的保护策略。
微卫星序列(simple sequence repeat,SSR)广泛分布于真核生物的核基因组DNA和叶绿体基因组DNA(chloroplast genome DNA,cpDNA)中,由于其具有共显性、分布广泛、多态性丰富等优点,使得SSR标记成为遗传学分析中极为有用的分子工具[5~7]。另一方面,与核基因组 DNA的SSR相比,叶绿体微卫星标记(chloroplast simple sequence repeat,cpSSR)又兼有叶绿体基因组单亲遗传、分子量小、结构简单、相对保守等特点,因而近年来发展很快,现已成为一种新型高效的分子标记技术并广泛应用于物种鉴定以及种群和个体水平的遗传学分析[8~10]。
为此,本研究选择我国亚热带地区榧属植物的3个代表性物种即榧树、长叶榧和巴山榧为对象,对长叶榧和榧树进行叶绿体全基因组序列的测定,再与已公布的的巴山榧进行比较,同时应用生物信息学软件对三者的叶绿体微卫星分布特征和规律进行全面分析,以获得更多榧属植物叶绿体基因组数据并为开发榧属植物叶绿体通用微卫星引物提供基础信息。
1 材料与方法
1.1 材料
供试的长叶榧样品采自浙江省桐庐县白云源森林公园,榧树样品采自浙江省杭州植物园。在长叶榧和榧树的植株上分别采集健康幼嫩叶片,擦拭干净后装入放有足量干冰的低温贮藏箱中送上海翰宇生物科技有限公司在Illumina Hiseq 2500中进行叶绿体基因组测序。
1.2 方法
将长叶榧和榧树的叶绿体基因组测序结果提交至NCBI中的GenBank数据库(https:// www.ncbi.nlm.nih.gov/),获得基因组入库序列号。同时,在GenBank 中下载已公布的巴山榧叶绿体基因组全序列测序结果(入库序列号为KT027377)。采用MIcroSAtellite (MISA)软件(http://pgrc.ipk-gatersleben.de/misa/)搜索SSR重复序列,设定单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸的最少重复分别为10、5、4、4、3和 3次[11]。
2 结果与分析
2.1 cpSSR分布区域特征
长叶榧和榧树的叶绿体基因组测序结果在GenBank数据库中入库序列号分别为KX902234、KY369757。从测序结果来看,3种榧属植物叶绿体基因组均为环状双链DNA,全序列总大小以巴山榧最大,榧树次之,长叶榧最小,依次为137075、136949、136720bp。在巴山榧、榧树、长叶榧中,利用MISA软件分别搜索到34、42、36个重复序列,总大小分别为407、522、463bp,各占 cpDNA 全序列的 0.30%、0.38%、0.34%。3个物种叶绿体基因组上cpSSR分布范围都较广,其中巴山榧的cpSSR分布于4061bp~132480bp之间,榧树的cpSSR分布于8762bp~132419bp之间,长叶榧的cpSSR分布于4051bp~114413bp之间,但这种分布并不平衡,有集中区与稀疏区之分。从图1可以看出,3种榧属植物的 cpSSR 主要集中分布在20~120kb区域,这个区域分布的cpSSR占微卫星总数的90%以上,而0~20kb和120~140kb的区域分布的数量较少。
图1 cpSSR在3种榧属植物叶绿体DNA中的分布
2.2 cpSSR不同碱基重复类型的比较
从3种榧属植物cpSSR不同碱基重复类型的分布特征来看,在搜索到的cpSSR中,3种榧属植物cpSSR重复序列主要由单碱基和四碱基微卫星构成,其他碱基重复的微卫星较少(表1)。在巴山榧cpSSR中,单碱基微卫星占总数的58.82%、四碱基微卫星占总数的23.53%;在长叶榧cpSSR中,单碱基微卫星占总数的63.89%、四碱基微卫星占总数的22.22%;在榧树cpSSR中,单碱基微卫星占总数的57.14%、四碱基微卫星占总数的23.81%。
表1 3种榧属植物叶绿体DNA中cpSSR不同碱基重复类型比较
在单碱基微卫星重复中,3种榧属植物均以A和T的单碱基重复为主,C的重复极少,而且都没有出现G的重复。在巴山榧cpSSR中,A和T的单碱基重复占单碱基微卫星总数的100%;在长叶榧cpSSR中,A和T的单碱基重复占单碱基微卫星总数的95.65%;在榧树cpSSR中,A和T的单碱基重复占单碱基微卫星总数的95.83%。
此外,在二碱基微卫星的碱基分布中,3种榧属植物均以AT重复为主,且只有在榧树中出现TA重复;三碱基微卫星均为ATT重复;四碱基微卫星不同碱基重复类型较多,但每种类型的数量相对较少,整体呈现出相对分散的格局;五碱基微卫星仅在榧树中出现1种类型。
2.3 cpSSR单碱基不同重复次数的分布
从3种榧属植物cpDNA中单碱基重复次数的总体分布情况来看(表2),单碱基微卫星重复以(A)n和(T)n为主,其中(A)n微卫星重复多于(T)n,且碱基重复数主要集中在10个至14个,碱基重复数在15个以上的相对较少。在巴山榧中,微卫星(A)n重复以10次最多,共6个;微卫星(T)n重复以11次最多,共3个。在长叶榧中,微卫星(A)n重复以10次和11次最多,均为5个;微卫星(T)n重复以10次最多,共2个。在榧树中,微卫星(A)n重复以10次最多,共6个;微卫星(T)n重复以10次最多,共3个。
表2 3种榧属植物叶绿体DNA中cpSSR单碱基不同重复次数比较
3 讨论
明确 cpSSR在叶绿体基因组中的分布规律是开发cpSSR分子标记的前提。为获取更多榧属植物叶绿体基因组数据,本研究对长叶榧和榧树进行了叶绿体全基因组序列的测定,并已登记于GenBank 数据库中,再加上先前已公布的巴山榧叶绿体基因组全序列信息,可为后续开发榧属植物cpSSR通用引物奠定重要基础。
从本研究结果来看,3种榧属植物叶绿体基因组均为环状双链DNA,总长度在136720 ~137075bp之间。3种榧属植物的叶绿体微卫星以榧树中最多,为42个,其次为长叶榧(36个),巴山榧中最少(34个)。3种榧属植物叶绿体微卫星均呈现出单碱基重复较多、3核苷酸重复数较少的特点,且单碱基重复主要以(A)n和(T)n为主,这一分布特征在其他科属植物的cpDNA中也同样存在[12~14]。此外,3种榧属植物的cpSSR中均不存在单核苷酸G的微卫星标记,这可能与榧属植物本身的生物学特性有关。
在微卫星的重复基元类型和重复次数方面,3种榧属植物均呈现出重复基元类型不多、重复次数较少且以单碱基重复为主的特点,这可能与叶绿体基因组本身的特点和进化方向有关。与核基因组相比,叶绿体基因组相对较小,进化速率仅为核基因组的1/5,平均每年每个位点进化速率为(0.2~1.0)×10-9[15]。同时叶绿体基因组呈单亲遗传,其遗传物质在由亲代向子代传递过程中不涉及基因重组,也不受选择压力,因而序列结构相对稳定,保守性较强,从而使得叶绿体SSR的变异类型要少于核基因SSR[16,17]。
已有的研究表明,从一个物种基因组中分离出来的SSR可用于同属中的其他物种的遗传学分析,如此可极大降低SSR的开发成本,并为其广泛应用创造有利条件[18~20]。Powell等[21]在松属(Pinus)不同植物中筛选得到一批叶绿体微卫星标记,并成功用于松科(Pinaceae)其他植物的种质资源研究。Weising等[22]利用 cpSSR侧翼序列的保守性开发了10对可用于不同物种分析的cpSSR通用引物;Grivet等[23]通过对烟草(Nicotianatabacum)的研究开发了一批通用的cpSSR引物。Cheng等[24]从不同物种的22对cpSSR引物中筛选得到9对可用于柑橘(Citrusreticulata)亲缘关系分析的通用引物。因此,通过对3种榧属植物cpSSR分布特点和规律的研究,可为后续榧属甚至红豆杉科其他属植物通用cpSSR分子标记的开发提供重要信息。