桑蟥DNA条形码与系统进化分析
2020-11-13杨金宏
杨金宏
(安康学院 陕西省蚕桑重点实验室,陕西 安康 725000)
桑蟥(RondotiamencianaMoore)又称桑蚕、白蚕、白蟥、松花蚕等,是鳞翅目家蚕蛾科昆虫,寄主桑、枸、褚等,以幼虫在叶背食害叶肉,蛀食成大小不一的孔洞,严重的只剩叶脉,曾是我国蚕桑生产的大敌。近年尤其是发现桑蟥对氨基甲酸酯类农药敏感和种群扩散能力较弱后,经有效治理,猖獗一时的桑蟥渐趋消亡。浙江湖州、嘉兴等地,自2004年就没有发现桑蟥的踪迹,其它地区也未见有桑蟥危害的报道[1]。但2013~2014年,研究人员在安徽省桑园采集到样本,并提取了DNA[2]。2014年江苏省也发现了该害虫,并对其虫卵的孵化进行了研究[3]。陕西省蚕桑历史悠久,野桑蚕资源丰富,近年来桑蟥危害也有零星发生,对其线粒体基因组进行全长测序并分析了其进化地位[4]。
桑蟥是蚕桑生产的害虫,但也是一种重要的绢丝昆虫,也能吐司结茧,在距今5 500~6 000年的仰韶文化时期,我们的祖先曾经饲养过它们[5]。但与其它绢丝昆虫如家蚕(Bombyx mori)和柞蚕(Antheraea pernyi)相比,我们对桑蟥种质资源遗传背景的了解仍十分有限。而且由于目前桑蟥的发生规模较小,容易被植保人员忽视,DNA条编码可以有效实现物种的鉴定、新种和隐存种的发现以及高级阶元演化关系的重建等[6]。COI基因是动物线粒体细胞色素C 氧化酶Ⅰ亚基基因,因其序列变异适中,长度合适,可以应用通用引物扩增,在物种鉴定方面的优势备受学术界关注,并在哺乳动物、鸟类、鱼类、软体动物以及昆虫等物种鉴定研究中得到认可[7]。因此笔者对桑蟥的DNA条形码基因COI部分序列进行PCR扩增和测序,并以此作为对其进行种属鉴定的依据,进一步对其分类和系统进化等进行研究,为了更多的了解、有效利用仍处于野生状态的桑蟥资源奠定基础。
1 材料与方法
1.1 材料与试剂
桑蟥成虫采自秦巴山区。通用基因组提取试剂盒、EX Taq DNA聚合酶、dNTPs、胶回收试剂盒、pMD18-T vector、DL2000等购自TaKaRa公司,宿主菌JM109由本实验室保存。
1.2 方法
1.2.1 桑蟥DNA的提取和COI基因的PCR扩增 取桑蟥成虫头部置于研钵中,加液氮冷冻研磨,通用基因组提取试剂盒提取基因组DNA。以此DNA为模板,以昆虫线粒体COI基因通用引物LYQ3(5’-CCTGGATCTTTAATTG -GAGA-3’)和LYQ4(5’-GGTAAAATTAAAATATAAACTTC-3’)进行PCR扩增扩增桑蟥线粒体COI基因[8]。反应体系为50μL,包括10×PCR buffer 5μL、dNTPs 2 μL、25 mmol·L-1MgCl2 4.0 μL、10 pmol·μL-1F、R引物各1.5 μL、Premix LA Taq(TAKARA)0.4 μL、DNA模板20ng。反应程序为:94℃预变性4 min;94℃变性1 min,50℃退火1 min,72℃延伸1 min,30 个循环;最后72℃延伸10 min。扩增产物进行1.0% 琼脂糖凝胶电泳,溴化乙锭染色观察。
1.2.2 COI基因克隆与序列测定 PCR产物经琼脂糖凝胶电泳后,按胶回收试剂盒说明进行回收。并将回收产物与pMD18-T vector相互连接,转化JM109感受态菌株,涂布于加有氨苄青霉素、IPTG、X-gal 的平板上,培养12~14 h。挑取白色单菌落于LB 液体培养基中培养,碱裂解法抽提质粒,并送上海生工武汉测序部进行测序。
1.2.3 COI基因序列分析 编码蛋白的氨基酸序列根据无脊椎动物线粒体遗传编码进行;利用NCBI在线BLAST程序在核酸数据库和线粒体数据库进行同源性分析;ClustalX程序对获得的COI基因片段进行序列对齐,并去除各序列两端多余的核苷酸。碱基组成偏度根据公式AT偏度=(A-T)/(A+T)和GC偏度=(G-C)/(G+C)进行计算;利用MEGA X软件进行多态性位点分析,基于Kimura-2-Parameter(K2P)双参数模型计算序列间的变异度,分别采用距离法和类平均聚类法构建系统树[9]。
2 结果与分析
2.1 桑蟥COI基因的PCR扩增和克隆测序
以线粒体DNA为模板,利用引物对LYQ3、LYQ4进行PCR扩增得到一条清晰的特异条带(图1)。克隆至PMD18-T载体并进行测序,序列拼接后得到618 bp片段 (GenBank登录号:JX195182)。根据无脊椎动物线粒体遗传编码推断该序列中无终止密码子和移码突变,基因编码206个氨基酸,所得序列为线粒体COI基因片段。
2.2 桑蟥CO I基因序列分析
利用在线BLAST程序进行序列的同源性分析,结果不同个体桑蟥的COI基因序列完全一致,与家蚕和野桑蚕该段线粒体基因序列的一致性达99%。对其碱基组成情况进行分析,结果见表1。桑蟥COI基因序列中碱基T的含量为38%,碱基C的含量为15.6%,碱基A的含量为32.2%,碱基G的含量为13.9%,A+T的含量为70.2%,与苏州野桑蚕和安康野桑蚕线粒体COI基因该区段的A+T含量相同,较其他野桑蚕和家蚕的A+T含量低。在密码子的碱基使用频率上,桑蟥和野桑蚕、家蚕的密码子第1、2位的A+T含量均相同,而密码子第三位上,桑蟥的T含量最高,为14.2%,南充、荣昌和青木关野桑蚕为14.1%,其他野桑蚕和家蚕T含量为13.8%和13.9%。对各COI基因序列碱基组成的Skewness分析结果见表1,桑蟥COI基因序列的AT偏向度最高为-0.083,较野桑蚕和家蚕更偏好于使用T。GC偏向度分析没有表现出类似的倾向。
2.3 桑蟥与其他蚕类昆虫基于COI的序列比较
对来自蚕蛾科和大蚕蛾科共9个蚕类昆虫的10条NCBI公开的COI基因序列进行分析,比对后产生574 bp的对齐序列,其中有保守性位点419个,变异位点48个,简约性信息位点107个。2个不同桑蟥个体的COI基因完全一致,序列一致性100%。在氨基酸组成上,全部10条序列共有13个位点发生变异,而蚕蛾科昆虫间只有2个氨基酸发生变异。
表1 COI基因序列的碱基组成及偏好性
在蚕蛾科的3种蚕类昆虫中,桑蟥与野桑蚕的亲缘关系最近,共鉴定到2个转换核酸位点,桑蟥与家蚕间共鉴定2个颠换位点,4个转化位点,而野桑蚕和家蚕间则发生了4个为位点的变化。与大蚕蛾科蚕类昆虫的变异位点较多,与柞蚕和印度柞蚕分别鉴定69和82个变异位点,与栗蚕、柳蚕间有90和74个变异位点,与大乌桕蚕、蓖麻蚕间有83和80个变异位点,变异位点情况见表2。基于K2P计算各蚕类昆虫间的遗传距离见表2,桑蟥与野桑蚕间的遗传距离为序列的遗传距离为0.003,与家蚕的遗传距离为0.011,与大蚕蛾科栗蚕的遗传距离最大,为0.179,与柞蚕的遗传距离最小为0.135。
表2 9种蚕类昆虫的遗传距离(下三角)与发生的颠换/转换数(上三角)
2.4 基于桑蟥和其他蚕类昆虫的COI基因的分子进化树
利用MEGA X软件基于K2P遗传距离构建了9个蚕类昆虫的COI基因序列的进化树。在根据NJ法和UPGMA法得到的分子树(图2)中,大蚕蛾科和蚕蛾科昆虫明显分为两个支系,桑蟥与野桑蚕聚合在一起后在共同与家蚕聚合。大蚕蛾科的昆虫又分2个支系,一个包括柳蚕、柞蚕和栗蚕,另一个是蓖麻蚕和大乌桕蚕,与传统分类学的研究结果一致。
3 讨论
鳞翅目昆虫是昆虫纲的第二大目,全世界已知约180 000种,是哺乳动物的30倍,但尚有30万鳞翅目昆虫有待我们去发现、描述和命名,因此其物种鉴定任务复杂而艰巨[10]。目前,鳞翅目有卷蛾科、弄蝶科、毒蛾科、夜蛾科、凤蝶科、天蚕蛾科等进行过DNA条形码研究[11],Hebert等[7]分析200个亲缘关系较近的鳞翅目昆虫长为658 bp的COI片段,结果表明COI片段能够100%成功鉴别各昆虫。根据882个鳞翅目昆虫推算鳞翅目昆虫间遗传差异为6.6%,DNA条形码可以广泛用于鳞翅目昆虫的分类和鉴定[12]。家蚕和野桑蚕的线粒体以及COI基因已进行了比较多的研究,桑蟥与家蚕和野桑蚕同属家蚕蛾科,本研究解析了桑蟥COI基因5’端的618 bp的序列,经BLAST比对该片段与野桑蚕和家蚕序列的一致性达99%,而在使用的574 bp碱基的比对中,桑蟥与野桑蚕的吻合程度最高,这表明二者非常相近。但桑蟥较家蚕和野桑蚕更偏好于使用碱基T,本研究采用的LYQ3和LYQ4通用引物可以有效的扩增,并且不同桑蟥个体的基因完全一致,说明该片段可以作为DNA条形码进行桑蟥种的鉴别。
同时本研究利用解析的桑蟥DNA条形码探讨的其与其它蚕蛾科和大蚕蛾科的蚕类昆虫系统进化关系,结果桑蟥首先和野桑蚕聚在一起,然后再和家蚕聚在一起,说明桑蟥COI序列与野桑蚕更相近。目前国际公认的研究结果是家蚕、野桑蚕为同一祖先[13],但因同为蚕蛾科的桑蟥的系统发育研究报道较少,而家蚕和野桑蚕分化后,家蚕进行了长期的人工选择,而野桑蚕和桑蟥所处的野外环境及其进化压力比较一致,也可能是造成二者比较相近的原因,但桑蟥与野桑蚕和家蚕的进化关系还有待更多的证据来证明。