脊尾白虾线粒体基因组SNP位点的筛选及其特征分析
2021-05-24朱佶轩段健诚阎斌伦
朱佶轩,戴 琴,段健诚,高 娜,高 威,阎斌伦,2,高 焕,2,3
( 1.江苏海洋大学,江苏省海洋生物技术重点实验室,江苏省海洋生物资源与生态环境重点实验室, 江苏 连云港 222005; 2.江苏省海洋生物产业技术协同创新中心,江苏 连云港 222005; 3.江苏省农业种质资源保护与利用平台,江苏 南京 210014 )
单核苷酸多态性(SNP)指不同个体间基因组上同一位点上的单核苷酸序列存在差异,这种多态性位点具有密度高、遗传稳定、代表性强、易实现自动化分析等优点[1],因此成为第三代分子标记的典型代表,在亲缘鉴定、分子标记、遗传育种和疾病防控等领域有着广泛的应用[2-3]。线粒体基因组具有母性遗传的特点,因此其上的分子标记,尤其是SNP标记,已经成为亲缘鉴定[4]、遗传多样性分析[5]的重要工具。目前该技术在经济甲壳动物的研究中应用广泛,如对斑节对虾(Penaeusmonodon)的PmCatL、PmTry以及PmAmy基因进行检测后发现了56个能够控制生长性状的SNP位点[6];Zhang等[7]在合浦绒螯蟹(Eriocheirhepuensis)和中华绒螯蟹(E.sinensis)中找到的能够稳定遗传的SNP位点,开发出了DNA条形码。
SNP的检测技术经历过许多的探索和改进,从限制性片段长度多态性法(PCR-RFLP)、单链构象多态性法(PCR-SSCP)、变性梯度凝胶电泳(DGGE)等以凝胶电泳为基础的传统方法到近年来发展运用的DNA测序法、DNA芯片检测、变性高效液相色谱法(DHPLC)、高分辨率熔解曲线(HRM)等技术,对SNP的检测越发注重于自动化和高通量[8]。高分辨率熔解曲线技术可以通过实时监测不同个体熔解曲线的形状和位置上的差异检测出序列变化,与其他技术相比,具有低成本、易操作、高通量、高灵敏度等优势,适合用于对未知SNP位点的筛查和分析。
脊尾白虾(Exopalaemoncarinicauda)是我国特有的养殖虾类,具有繁殖能力强、生长速度快、环境适应性强等特点,是开展甲壳动物生物学研究的良好生物材料,加之脊尾白虾具有重要的养殖经济价值[9],很多甲壳类研究者都倾向于将其当作海水甲壳类物种研究的模式生物使用[10],近年来不仅在养殖技术[11]、养殖模式[12]等方面受到诸多关注,在遗传学研究方面也受到了广泛的关注,如利用微卫星对脊尾白虾野生群体和近交群体的遗传多样性进行分析[13-14]。作为一个潜在的甲壳类研究模式物种,它在很多方面的遗传信息还有待进一步挖掘,如其线粒体基因组中的SNP位点还不清楚,这一定程度上限制了该虾在家系识别、遗传多样性分析,甚至进化生物学方面的研究。笔者希望通过利用高分辨率熔解曲线技术对脊尾白虾线粒体全基因组(mtDNA)中的SNP位点进行筛查,为进一步开展该虾的遗传育种、家系鉴定等工作提供理论基础[15-16]。
1 材料与方法
1.1 试验材料
试验所用的脊尾白虾为实验室分3个时间段在连云港沿海地区(柘汪镇、海头镇和青口镇)的养殖池塘和南通吕四港附近(1次)采集获得的样本,每次采集样本30~100尾,并在每个批次中选取6~10尾组成本试验的样本群体,以实现样本遗传背景来源的多样化。试验前将采集样本置于循环水养殖系统内暂养7 d,暂养期间连续充气,每日早晚各投饵1次,投饵0.5 h后清污[17]。
1.2 样品DNA的提取
从30~50尾备选群体中选取健康活跃、大小合适的成年脊尾白虾30尾(编号为1~30),体长(5.23±0.33) cm、体质量(0.91±0.19) g。取其新鲜肌肉组织,液氮研磨后用生工生物工程(上海)股份有限公司生产的动物基因组DNA快速抽提试剂盒来提取脊尾白虾总基因组DNA,经GeneQuant Pro测定基因组DNA样品质量浓度后,均一化为20 ng/μL,-20 ℃保存备用。
1.3 引物设计及筛选优化
1.3.1 引物的设计与验证
根据美国国立生物技术信息中心数据库中得到的脊尾白虾线粒体全基因组序列(EF560650.1),利用Primer Premier 5.0(Premier biosoft international, USA)通过步移法设计出覆盖mtDNA全长的引物,其产物扩增长度为100~150 bp[18]。本次试验共设计出109对引物,交由生工生物工程(上海)股份有限公司合成,按说明书要求稀释后进行PCR扩增,反应体系总体积为10 μL:ddH2O 7.0 μL,10×PCR Buffer 1.0 μL,MgCl2(25 mmol/L) 0.6 μL,dNTP(10 μmol/L) 0.2 μL,Taq DNA聚合酶 0.2 μL,上下游引物各0.4 μL,DNA(20 ng/μL)0.2 μL。用Touch-down PCR程序进行验证:95 ℃预变性3 min;95 ℃变性30 s,65 ℃退火30 s,72 ℃延伸1 min,其中退火温度每循环降低1 ℃,共15个循环;95 ℃变性30 s,50 ℃退火30 s,72 ℃延伸1 min,共25个循环;72 ℃延伸10 min。用1.5%琼脂糖凝胶电泳验证扩增产物,排除未得到目的条带的引物。
1.3.2 引物优化
为防止引物二聚体对后续高分辨率熔解曲线检测产生影响,对初筛引物进行温度梯度优化,确定其最佳退火温度。PCR反应体系总体积为10 μL(成分比例同1.3.1),用温度梯度PCR程序进行优化:95 ℃预变性3 min;95 ℃变性30 s,梯度退火30 s,72 ℃延伸1 min,共35个循环;72 ℃延伸10 min;4 ℃保存。用1.5%琼脂糖凝胶电泳对PCR产物进行验证并对比,确定引物的最佳退火温度。
1.4 高分辨率熔解曲线检测
对提取的30尾脊尾白虾DNA样品进行分组混样,以10尾为1组,共分为3组混合DNA样品,编号分别为H1(1~10)、H2(11~20)、H3(21~30)[19]。本试验首先在混合DNA中进行第1次高分辨率熔解曲线检测,将存在差异峰的引物在对应混合DNA的单个体样品DNA中进行第2次高分辨率熔解曲线检测,从而确定存在突变的单个体DNA样品。
1.4.1 PCR扩增
PCR反应体系总体积为35 μL:ddH2O 24.5 μL,10×PCR Buffer 3.5 μL,MgCl2(25 mmol/L) 2.1 μL,dNTP(10 μmol/L) 0.7 μL,Taq DNA聚合酶 0.7 μL,上下游引物各1.4 μL,混合DNA模板(20 ng/μL)0.7 μL。PCR程序:95 ℃预变性3 min;95 ℃变性30 s,相应温度退火30 s,72 ℃延伸1 min,共35个循环;72 ℃延伸10 min;4 ℃保存。
1.4.2 高低温内标合成
高低温内标分别为:5′-GCGGTCAGTCGGC CTAGCGGTAGCCAGCTGCGGCACTGCGTGAC GCTCAG-3′、5′-ATCGTGATTTCTATAGTTAT CTAAGTAGTTGGCATTAATTTCATTTT-3′及各自的反向互补序列,且3′端进行磷酸化封闭,由生工生物工程(上海)股份有限公司合成[18]。反应体系为:饱和NaCl 1.0 μL,正反引物各1.0 μL,ddH2O 7.0 μL,共10 μL的体系。放入PCR仪,95 ℃反应3 min,4 ℃保存。程序结束后,将高低温内标等比混合弹匀备用。
1.4.3 高分辨率熔解曲线检测
在每管PCR扩增产物中加入7 μL高低温内标混合溶液,混合均匀后放入PCR仪,95 ℃变性3 min,25 ℃复性2 min,4 ℃保存。吸取10 μL PCR扩增产物加到96孔板中,每组3个平行。再加入1 μL LC Green染料及25 μL矿物油,放入微孔板离心机中短暂离心,利用LightScanner 96系统进行检测,分析所得溶解曲线,判断同一引物在不同个体间是否发生差异,记录存在差异峰的引物及其对应的个体数。
1.4.4 序列测序分析
将高分辨率熔解曲线检测出的每个差异峰所对应的扩增样品(3~5个)送至生工生物工程(上海)股份有限公司进行测序,经过对比分析后统计脊尾白虾线粒体基因组中SNP位点的数目、类型及位置。
2 结 果
2.1 引物筛选及优化结果
根据脊尾白虾mtDNA序列设计出的109对引物中,有29对未出现扩增产物,对剩下的80对引物进行温度梯度PCR优化,确定其最佳退火温度。
根据最佳退火温度,将80对筛选后的引物分别在H1、H2、H3 3组混合DNA样品中进行高分辨率熔解曲线检测。检测分析发现,共有13对引物在3组混合DNA样品中出现了不同的熔解曲线和熔解峰。进一步将存在差异峰的引物在其对应的混合DNA组中分别进行单个体DNA样本的扩增及高分辨率熔解曲线检测,分析出现差异的单个DNA样品。同一引物扩增片段在不同DNA个体间出现了显著的差异峰(图1),由此可以判断这一段序列在不同个体之间存在差异性,可能发生了碱基突变现象。
2.2 SNP分析
经序列比较表明,在上述13对引物扩增序列中有9对引物的扩增序列中含有SNP突变位点(表1)。
图1 同一引物在不同单个体(a)和(b)中的熔解曲线Fig.1 The melting curves of the same primer in different individuals (a) and (b) 4和H1为同一引物在混合DNA H1中的4号单个体和其他单个体中检测出的熔解曲线,曲线的差异说明它们之间存在SNP突变位点. 4 and H1 are the melting curves of the same primers detected in the single DNA No. 4 and other single bodies in the mixed DNA H1; the difference in the curves indicates that there are SNP mutation sites between them.
表1 脊尾白虾线粒体基因组SNP引物
在这9对引物的扩增序列中,共筛查到16个SNP突变位点,在脊尾白虾线粒体全基因组上的分布频率为0.10/100 bp。其中包括14个转换突变(C/T和G/A),2个颠换突变(A/T),转换和颠换突变形式的比率为87.5%和12.5%。进一步将检测得到的16个SNP位点与公布的脊尾白虾mtDNA序列进行定位分析,发现所得SNP位点主要分布在脊尾白虾mtDNA的COX1、COX2、tRNAAsp、nad1、nad4、nad5、cob 7个区域,其中COX1基因区域的SNP位点数量最多,共有5个,占总SNP位点的26.7%,其次为cob的突变位点数目为3个,占所得总突变量的20%,在COX2、tRNAAsp及nad1、nad4、nad5等区域各发现1~2个SNP位点(表2)。进一步比对所得SNP位点突变前后对应密码子所编码的氨基酸种类变化,统计SNP位点的突变类型和比例。结果显示,16个SNP位点均位于蛋白基因编码区,其中不改变氨基酸种类的同义SNP位点有7个,占已获所有SNP位点的43.7%,能够导致氨基酸种类改变的非同义SNP位点有9个,占已获所有SNP位点的56.3%。
表2 脊尾白虾线粒体基因组SNP位点信息Tab.2 SNP site information of the mitochondrial genome in ridgetail white prawn E. carinicauda
3 讨 论
高分辨率熔解曲线技术是一种简单、高效的SNP检测方法,无需使用序列特异性探针,便可高通量检测SNP、SSR多态性等多种遗传变异以及相同序列的甲基化差异[20-21]。本研究基于公布的脊尾白虾mtDNA序列,利用小片段扩增高分辨率熔解曲线检测技术对脊尾白虾基因组片段进行检测。在设计的109对引物中,筛选出了9对扩增产物中存在碱基突变的引物,进一步筛选出了16个SNP位点,证明了高分辨率熔解曲线技术是筛选SNP突变位点的有效手段[22-23]。
根据美国国立生物技术信息中心数据库得到的脊尾白虾线粒体基因组全序列长度为15 730 bp,本研究在引物扩增区域实际检测出了16个SNP位点,因此SNP分布频率为0.10/100 bp。据已有的报道,不同物种中的SNP位点分布频率存在差异,如人类基因组中SNP位点的分布频率为0.10/100 bp,在江豚(Neophocaenaphocaenoides)中为0.18/100 bp[24],在甲壳类的三疣梭子蟹(Portunustrituberculatus)中为0.15/100 bp[4],虽然本研究中脊尾白虾的SNP位点分布频率和以上物种的有所差异,但可以视为同一个水平上的SNP位点分布频率。本研究中,除了在COX1、COX2、cob、tRNAAsp、nad1、nad4、nad5 7个区域中发现SNP位点以外,在其他区域均未筛查出SNP位点。其原因可能在于:一是试验所用脊尾白虾材料仅来自于连云港和南通两地,虽然在取样时尽量保证了样本来源的多样性,但是遗传背景仍然较为单一;二是脊尾白虾本身由于繁殖能力强,在同一个地区的遗传多样性不够丰富[25];三是在进化上,关键基因位点容错率低,也会导致很多基因序列区检测不到SNP位点。因此,进一步扩大筛选的样本量,有望获得更多在本研究中未被发现的SNP突变位点。同时,研究发现,不同基因区域的SNP位点数目存在较大差别,如在COX1区域共检测出5个SNP位点,其次在cob区域中检测出3个SNP位点,而在COX2和nad1区域分别只检测出1个SNP位点。其原因可能与基因组不同部位的保守性与特异性有关,如三疣梭子蟹线粒体基因组的16S rRNA区域具有很高的保守性及特异性,与之相比,其cyt b基因的进化速率约快4倍,因此在cyt b区域发现的SNP位点数目显著高于16S rRNA区域[26]。与同源染色体相比,线粒体基因组中的基因和SNP位点均属单倍型,尤其是线粒体基因组为母系遗传,一旦母体中出现新的SNP基因型,则子代个体均可遗传这些SNP基因型,因此试验发现的线粒体基因组SNP位点对于系谱鉴定具有重要意义。
此外,所得脊尾白虾线粒体基因组SNP位点中,转换所占的比例为87.5%,颠换的比例为12.5%,未出现插入、缺失等突变形式。由此可见,转换类型的SNP位点所占比例远远大于颠换类型,符合“transition bias”原理[27],与刘九美等[28]在脊尾白虾特定生长相关基因中得到的SNP位点分型规律相似。进一步对SNP位点进行定位分析和对应的氨基酸比对,发现所得SNP位点中非同义SNP位点较多,占总个数的56.3%,而同义SNP位点占43.7%,说明脊尾白虾的线粒体基因受到正向选择,进化速度较快。据已有研究报道,约20%~30%的非同义SNP位点能够导致编码蛋白质的变化,最终影响蛋白质的性质,因此非同义SNP在功能研究中更具意义[29]。另外,筛选出的9个非同义SNP位点分布于COX1、tRNAAsp、nad1、nad4、nad5、cob这6个区域中,其对于脊尾白虾相关性状的改变值得进一步研究,为后续脊尾白虾遗传育种、家系鉴定等工作的展开奠定基础。
4 结 论
本研究通过高分辨率熔解曲线技术对脊尾白虾mtDNA上的SNP位点进行筛查和分析,得出以下结论:
(1)本研究共筛选出16个SNP位点,分布频率为0.10/100 bp,在脊尾白虾mtDNA的COX1、cob、COX2、tRNAAsp、nad1、nad4、nad5 7个区域均有分布,其中COX1基因区域的SNP位点最多,其原因可能与mtDNA上不同区域的发育速度存在差异有关。
(2)所得SNP位点中只出现转换和颠换两种类型,其中87.5%为转换类型,所占比例远远大于颠换类型;且非同义SNP位点较多,占总个数的56.3%,最终可能导致蛋白质的性质发生改变。
(3)所得线粒体基因组中的SNP位点均属于单倍型,且具有母系遗传特征,因此在系谱鉴定中具有重要意义。