基于转录组数据的银鲴微卫星位点筛选
2018-07-13赵良杰彭新亮郭旭升
赵良杰,彭新亮,郭旭升
(信阳农林学院水产学院,河南省渔业生物工程技术研究中心,河南信阳 464000)
微卫星,又称简单重复序列(simple sequence repeat,SSR)或者短串联重复序列(short tandem repeat,STR)[1],具有高稳定性、高多态性、引物通用性、位点特异性、检测方便和呈共显性遗传等特点[2],其作为一种良好的分子标记,在水产科学中被广泛应用。近年来,随着二代测序技术的发展,利用二代测序为基础的微卫星数据开发使得大规模开发微卫星位点成为可能[3],基于二代测序的转录组数据平台可以提供大量的微卫星位点信息[2]。
银鲴(Xenocyprisargentea)属于鲤形目(Cypriniformes)鲴亚科(Xenocyprininae)鲴属(Xenocypris),是一种小型淡水经济鱼类,广泛分布于海南至黑龙江的国内各江河、湖泊等水体[4],是一种重要的淡水渔业捕捞对象[5];由于其喜食底栖碎屑和着生藻类等食物,该种常常被作为水库和池塘中净化水质和优化养殖结构的工具鱼[6]。但是,随着近年来环境污染、水体富营养化、过度捕捞等原因,银鲴的野外种群数量也在快速下降。同时,尽管目前有人工繁殖银鲴的相关报道[7,8],但是该种的遗传选育工作尚未开展,仅见少量野生群体的遗传学研究:肖武汉等[9]采用RFLP技术对长江和闽江流域的若干群体进行遗传分析;胡玉婷等[10]结合形态学和线粒体CytB基因对鄱阳湖及其邻近水系的银鲴进行了遗传学研究;刘军等[11]采用线粒体COI序列对长江、黑龙江以及钱塘江的银鲴群体进行了研究。目前仍然缺乏对于银鲴遗传资源状况的全面认识,开发大规模的银鲴微卫星遗传标记,对于银鲴遗传资源的调查和分子标记辅助育种工作的开展具有重要意义。为了更好地保护和利用这一物种,本研究采用转录组测序数据,对银鲴的微卫星位点进行开发和筛选,以期为银鲴的遗传资源进行开发利用、银鲴的分子标记辅助育种和种质保护等工作提供技术支持。
1 材料和方法
1.1 样品采集与DNA提取
32尾样品采集自洞庭湖岳阳湖区,形态鉴定依据《中国动物志》[4],体长为(18.0±4.8) cm,取尾鳍置于95%乙醇中带回实验室。取0.1 g尾鳍组织用灭菌双蒸水洗去乙醇后,置于1.5 mL离心管中剪碎,采用酚/氯仿法提取DNA,后用0.8%琼脂糖凝胶电泳检测DNA质量,模板DNA保存于-20 ℃冰箱中待用。
1.2 转录组数据的微卫星挖掘
转录组数据集来自于本实验室自测数据(数据上传至NCBI公共数据库,登录号为SRP102051),对质控后的数据进行组装,组装采用Trinity软件(http://trinityrnaseq.sourceforge.net/)完成。采用MISA(Microsatellite identification tool)(http://pgrc.ipk-gatersleben.de/misa/misa.html)软件进行转录组数据中微卫星序列的分析,共鉴定6和类型的微卫星序列:Mono-nucleotide(单碱基),Di-nucleotide(双碱基),Tri-nucleotide(三碱基),Tetra-nucleotide(四碱基),Penta-nucleotide(五碱基),Hexa-nucleotide(六碱基)。微卫星序列的重复数阈值依次设置为10、6、5、5、5、5。
1.3 引物设计与合成
本研究选取四碱基,五碱基和六碱基微卫星序列,使用Primer 5.0软件进行引物设计,引物长度在20~23 bp,扩增片段长度在100~400 bp之间,共设计48对引物序列。引物由上海迈浦生物科技有限公司合成。
1.4 PCR扩增和产物检测
为验证各引物的扩增效果,取4个模板DNA样品,进行PCR扩增和琼脂糖凝胶电泳检测。10 μL PCR反应体系包括:10×Easy Taq Buffer 1 μL(20 mmol/L Mg2+),dNTPs(0.25 mmol/L)1 μL,引物各0.5 μL(μmol/L), Taq DNA聚合酶1 U,模板DNA约为2 ng。PCR扩增的反应条件为:95 ℃预变性5 min;95 ℃变性60 s,55 ℃退火45 s,72 ℃延伸1 min,共35个循环;72 ℃延伸10 min,4 ℃保存。PCR扩增产物用1.2%的琼脂糖凝胶电泳检测。
1.5 微卫星位点分析和多态性验证
根据PCR检测结果,取上述32个样品的模板DNA,对能够成功扩增的引物经上海迈浦生物科技有限公司荧光标记后,加入分子量内标,利用ABI 3730XL 分析仪进行毛细管电泳分型。结合Genemapper 4.0进行DNA片段长度分析。确定具有多态性的微卫星位点。
1.6 数据分析
对上述获得的多态性位点进行种群遗传参数的统计。利用PopGene32软件计算每个微卫星位点的等位基因数Na(allele number),观测杂合度Ho(observed heterozygosity),期望杂合度He(expected heterozygosity),香农-威尔指数H(Shannon-Wiener Index),同时进行哈代-温伯格平衡HWE(Hardy-Weinberg equilibrium)检验。采用PIC_CALC 软件计算各个位点的多态信息含量PIC(polymorphism information content)。
2 结果
2.1 转录组数据的微卫星挖掘
使用MISA软件对银鲴肝脏转录组数据进行微卫星数据挖掘,结果如表1所示。根据重复单元的类型和重复次数,将不同的SSR位点进行分类(表1),其中数量最多的SSR类型为单核苷酸重复,比例占全部重复序列的65.86%,其次是二核苷酸和三核苷酸重复,比例分别为20.75%和12.39%,四、五、六核苷酸重复的SSR类型较少,所占比例分别为0.84%、0.10%以及0.07%。
表1 转录组中SSR标记分析结果Tab.1 Output statistics of SSR makers in transcriptome
2.2 微卫星序列的引物设计和反应条件的摸索
本研究中,共选择了48个微卫星位点进行引物设计,48个位点分别包括了40个四碱基重复微卫星位点,3个五碱基重复微卫星位点,5个六碱基重复微卫星位点(48个微卫星序列已上传至NCBI,序列号:MF693180-MF693227)。本实验设计的48对引物序列及相关信息见附表1。参考引物tm值,将PCR反应的退火温度均设置在55 ℃。对这48对引物进行PCR扩增,扩增产物在105~378 bp之间,除DN24390-p4位点外,其余47个位点均获得稳定点的PCR产物(图1)。对DN24390-p4进行梯度PCR验证(温度范围为50~60 ℃),仍未得到有效扩增产物。
图1 48对引物扩增的PCR验证结果Fig.1 PCR amplification results of 48 pairs of primers
2.3 微卫星分型和遗传多态性分析
从上述可以成功扩增的47对引物中选取26个位点对洞庭湖银鲴群体进行分型和遗传多样性分析。发现其中5对引物表现出单态,21对引物表现出多态性。呈现多态性的21个位点的等位基因数见表2。21个具有多态性的位点中,四碱基重复微卫星位点为15个,五碱基重复微卫星位点为2个,六碱基重复微卫星位点为4个。
根据21对多态性引物在该群体中的分型数据进行统计,观测杂合度(Ho)在0.187 5~0.968 8之间,期望杂合度(He)在0.228 7~0.916 2之间,香浓-威尔指数在0.468 7~2.520 1之间。多态信息含量(PIC)在0.210 9~0.893 7范围内,其中12个位点PIC值大于0.5,8个位点的PIC值在0.25~0.5之间,1个位点的PIC值小于0.25。卡方检验Hardy-Weinberg平衡结果表明,有6个位点(DN17679-p4,DN21251-p4,DN21454-p5,DN21477-p4,DN23059-p6,DN23506-p5)极显著偏离(P<0.01),其余15个位点表现为符合Hardy-Weinberg平衡(P>0.05) (表2)。
图2 部分微卫星位点(位点DN12410-p4)的分型鉴定峰图Fig.2 The peak figure of partial microsatellite loci (Loci DN12410-p4)
表2 26位点在洞庭湖银鲴群体的分型情况及其遗传参数描述Tab.2 The genetic parameters description of 26 loci in the Dongting Lake population
3 讨论
以往的资源调查和研究显示[11],长江流域的银鲴群体具有最高的种群遗传多样性和最广泛的资源分布,是开展银鲴遗传育种理想的种质资源库,其中湖南洞庭湖和江西鄱阳湖是该种种群数量最为丰富的地区,长江流域部分繁育场长期将洞庭湖银鲴群体作为亲本开展该种的人工繁育工作。本研究的结果也再一次证明,洞庭湖群体的银鲴具有良好的种群遗传多样性,适合作为银鲴遗传育种的候选群体。
利用二代测序技术获得的转录组数据,是大规模开发微卫星标记的良好途径。随着二代测序技术的发展,该方法已经成为微卫星位点开发的主流方法之一。目前许多鱼类利用该技术获取了多态性良好的微卫星序列:蔡磊等[12]对诸氏鲻虾虎鱼转录组序列中微卫星标记的初步筛选,55对引物中有32对表现出多态性;龚诗琦等[13]对黄姑鱼转录组SSR进行了开发验证,从38对引物中筛选出18对具有多态性的引物;岳华梅等[3]使用转录组数据对兴国红鲤的微卫星标记进行了筛选,在20对引物中筛选出9对具有多态性的引物。上述研究均取得了较好的微卫星筛选效果。本研究采用转录组测序方法,同样取得了较好的筛选效果,并从26个成功扩增的位点中获得了21个具有多态性的位点,多态微卫星位点筛选效率高于上述研究,上述研究微卫星筛选所用群体或者是养殖群体(如诸氏鲻虾虎[12]和兴国红鲤[3]),或者其筛选过程中采用的样本数过少(黄姑鱼的SSR开发中仅用两个野生群体和一个养殖群体的各5个样本混合进行筛选[13]);而本研究中,我们选取洞庭湖野生群体作为转录组开发和微卫星多态性筛选的材料,且采用了较大的群体样本数(32尾),因此获得了更多的多态性位点。本研究采用了四碱基以上微卫星重复类型的位点作为筛选目标。在一些物种例如两栖有尾目和鳞翅目昆虫的研究中,由于二碱基位点更容易受到微卫星DNA家族的影响,因此其筛选效率要要低于四碱基位点[14,15]。尽管鱼类目前尚未见微卫星DNA家族的报道,但是考虑到两碱基重复的微卫星可能处于演化的初期,而四碱基以上重复的微卫星序列则经历了较长的演化历史,其对于突变的积累更加稳定[14],目前已有一些鱼类微卫星引物的开发如红唇薄鳅[16]、圆口铜鱼[17]等采用了四碱基以上的位点。尽管有文献报道在鱼类中二碱基位点具有更好的多态性和更多的重复次数,但在本研究中,我们选取了四碱基,五碱基,六碱基位点依然获得了很好的多态性。PIC检测表明,26个验证位点中,具有多态性的位点有21个,占80.7%;其中高度多态位点(1>PIC>0.5)为12个,中度多态位点(0.5>PIC>0.25)8个,仅有1个位点为低度多态位点(PIC<0.25)。重复次数上,本研究的四碱基以上重复位点均在10次以下,红唇薄鳅、中国明对虾和圆口铜鱼四碱基和五碱基重复也以10次以下的居多[16-18],本研究的结果与其他的研究结果一致。另外,在具有多态性的21个微卫星位点中,有6个显著偏离哈代-温伯格平衡(HWE)。这些哈温平衡偏离可能是由自然选择、基因突变或者遗传漂变等因素造成[3]。
本研究对于引物设计的成功率进行了探讨,首先转录组数据和微卫星开发采用的样本都来自洞庭湖,避免了种群遗传差异带来的引物设计失败;其次,通过引物设计位置的选择和同源比对,可以使得引物的设计成功率大大提升。本研究中,在48对引物中,有47对设计引物都成功获得了微卫星序列扩增产物,引物设计成功率为97.9%。另外,有报道认为四碱基以上重复位点可能具有比二碱基位点具有更好的侧翼序列保守性[14],这也是本研究引物设计成功率高的可能原因,但在鱼类中,这一问题尚需要进一步探讨。