APP下载

鲢EST-SSR标记的开发及其与生长性状关联性分析

2020-06-12邹桂伟罗相忠

水生生物学报 2020年3期
关键词:多态碱基基因型

王 丹 邹桂伟 罗相忠

(中国水产科学研究院长江水产研究所, 武汉 430223)

鲢(Hypophthalmichthys molitrix), 是我国“四大家鱼”之一, 是老百姓重要的动物蛋白来源之一。近年来, 人工近亲繁殖和亲本选育等问题已导致鲢的主要经济性状退化、生长速度减慢、性成熟个体变小、抗逆性下降等问题, 环境污染导致鲢天然种群数量明显下降和种质资源破坏较严重[1,2]。然而利用传统的育种技术培育优良品种或品系需要进行多代选育, 费时费力。分子标记辅助育种技术可快速、准确地检测到与性状基因紧密连锁的分子标记, 在亲子鉴定、回交育种、杂种优势预测和品种鉴定等各个育种阶段发挥重要作用, 从而加速育种进程, 提高育种效率[3]。开展鲢功能基因组学研究, 筛选鉴定鲢生长相关的分子标记及QTL, 对鲢的分子标记辅助育种体系具有重要的理论意义和生产价值。

分子标记可按有无基因功能分为Type Ⅰ与Type Ⅱ标记两大类。Type Ⅰ标记指来源于基因编码区, 与功能基因相联系的标记; Type Ⅱ标记则指与未知功能片段关联的标记。Type Ⅰ标记在群体遗传研究、比较基因组学研究、基因组进化研究、候选基因鉴定、数量性状位点定位、分子标记辅助育种等方面比Type Ⅱ标记更具优势[4]。

来自EST的SSR标记通常被称作EST-SSR标记,属于Type Ⅰ标记, 它结合了SSR和EST标记的优点:(1)如果发现某个EST-SSR标记与某个遗传性状相连锁, 这个EST可能是直接影响这个性状的基因片段。(2)EST来自基因编码区, 具有一定的保守性,因此在近缘种中有良好的通用性。(3)利用ESTSSR标记进行种群遗传多样性分析时, 所揭示的是在不同群体中基因的功能多样。

在遗传连锁图谱构建和分子标记辅助育种研究中, Liu等[5]报道了15个二碱基重复的EST-SSR标记用于斑点叉尾鮰(Ictalurus punctatus)的图谱构建。Wang等[6]用数据挖掘的方法得到25个鲤(Cyprinus carpioL.)的EST-SSR标记, 其中有23条ESTSSR序列与已知基因功能相关, 如编码新陈代谢的酶、抗病因子、结构蛋白、以及转录因子等。Fuji等[7]得到牙鲆(Paralichthys olivaceus)抗淋巴囊肿病的微卫星标记, 利用这个位点辅助培育的牙鲆品种在日本市场的占有率为35%。鲁翠云等[8]找到4个QTL位点与镜鲤的体质量、体长性状具有相关性,可作为指导镜鲤家系选配的首选标记用于新品系培育。郭薇等[9]研究筛选出与鲫(Carassius auratus)体重、体厚、生长相关的EST-SSRs标记及基因型,为鲫的分子标记辅助育种及目标性状的遗传改良提供依据。

在种质资源研究中, Vasemg等[10]将EST-SSR标记用于分析波罗的海五个大西洋鲑(Salmo salarL.)自然群体和四个人工养殖群体的遗传多样性和遗传分化, 结果发现人工养殖群体中有一个等位基因丢失。鲁翠云等[11]用鲤的EST-SSR引物分析了长江鲤和黑龙江鲤的种群结构, 找到2个位点在长江鲤的多态信息含量明显高于黑龙江鲤, 可以作为两个群体的鉴别。赫崇波等[12]用EST-SSR标记对我国斑点叉尾鮰种质资源进行评估, 认为斑点叉尾鮰的遗传分化程度很弱。郑国栋等[13]利用EST-SSR标记对不同地域草鱼(Ctenopharyngodon idellus)群体进行鉴定和遗传多样性分析, 对草鱼的种质资源保存、种群鉴定和良种选育具有重要意义。

迄今, 有关鲢在遗传连锁图谱构建[14—16]和种质资源遗传结构[1,2,17]的研究中已取得重要进展, 但是缺乏分子标记辅助育种的研究。本实验通过鲢的卵组织转录组数据挖掘EST-SSR标记, 从中筛选出与生长性状相关或连锁的位点, 探讨其用于分子标记辅助育种的应用潜力, 为鲢遗传育种的亲本选择提供理论基础。

1 材料与方法

1.1 实验

用于检测引物多态的鲢采自石首老河野生群体共16尾。转录组测序材料和构建全同胞家系的实验鱼由中国水产科学研究院长江水产研究所窑湾试验场提供。转录组测序材料取自鲢的卵组织。TaKaRa试剂盒提取总RNA, 反转录得到cDNA,对cDNA片段进行末端修复并连接测序接头, 进行Illumina HighSeq 2000高通量测序。本实验构建鲢的全同胞家系, 随机挑选子代共计144尾。采集的鳍条置于95%的酒精中。基因组DNA的提取参照盐析法[18]。对144尾鲢的外观性状体长和体重进行测量, 并计算肥满度(K=100W/L3,W为体重,L为体长)。

1.2 实验方法

转录组测序和微卫星的查找将测序原始数据进行初步拼接, 去除低质量和短序列, 获得高质量的序列, 然后进行参考序列组装和de novo组装。基于转录组SSR检测是以组装出来Unigene作为参考序列, 用SSR软件MicroSatellite (MISA)来找出所有的SSR。Primer 6设计鲢EST-SSR引物。

PCR反应条件94℃预变性5min; 94℃变性35s, 退火温度为35s, 72℃延伸50s, 循环35次; 最后72℃终延伸10min。PCR反应体系: 总体积25 μL,包括大约20 ng总DNA, 上、下游引物各1 μL(5 μmol/L), 1 μL dNTP(10 mmol/L), 0.6UTaq聚合酶(TIANGEN), 2.5 μL缓冲液(含Mg2+1.5 mmol/L)。本实验参照Schuelke[19]发明的单管巢式PCR扩增方法进行基因型分型研究, GeneMapper4.0分析基因型数据。

数据处理与分析多态位点和生长性状指标的关联性分析用SPSS软件中的广义线性模型(General linear model)处理。显著性检验用新复极差法(Duncan’s new multiple range test)[20]。

2 结果

2.1 鲢转录组序列特征

通过Illumina Hiseq2000平台测序, 总计产出28691557200nt数据。组装结果总Unigene77129个,总长98834445nt, 平均长度1281nt, N50达到2228nt。Unigene功能注释, 注释到NR、NT、Swiss-Prot、KEGG、COG、GO库的Unigene分别是46540个、64879个、41522个、35574个、16426个、30224个,所有注释上的Unigene是66985个。预测编码蛋白框(CDS), 比对到蛋白库的CDS有46113个, 预测出的CDS有1512个, 共47625个。SSR共24458个, 占所测EST数据的31.7%。

鲢转录组微卫星类型特征如图1所示。鲢包含SSR的EST序列主要有二碱基、三碱基、四碱基和五碱基组成。二碱基中, AC/GT含量最丰富, CG含量最少。三碱基重复的序列最多类型是ATC和ATG。

2.2 鲢EST-SSR多态筛选

我们从所测序列挑选175条鲢的EST进行SSR引物设计。PCR检测结果显示, 共有148对引物有扩增产物, 其中单态有60对, 杂带有52对, 多态有36对。36对多态引物的核心重复类型、退火温度、引物序列和Blast结果见表1。

2.3 与生长性状相关的关联性分析

我们一共测量了144尾鲢。体长最大值为17.0 cm,最小值为11.2 cm, 平均值为14.1 cm;体重最大值是82.3 g, 最小值为25.8 g, 平均值为49.4 g; 肥满度最大值为2.07, 最小值为1.41, 平均值为1.7(表2)。

本研究共筛选得到两个与鲢生长性状有关的SCE位点, SCE26和SCE65。如表3所示, 2个SCE位点按基因型分类, SCE26位点有3种基因型, A148-148、A148-154和A154-154。其中A148-154为优势基因型, 基因频率为0.68。基因型A148-154和A154-154与体长和体重性状差异显著, 而与肥满度性状无相关性。

SCE65有四种基因型, A149-157、A157-159、A149-159和A159-159, 与体长和体重性状均无显著相关性, 但基因型A149-159和A159-159与肥满度性状差异显著。

图1 鲢转录组数据微卫星类型特征Fig. 1 Characterization of SSR from silver carp transcriptome data

表1 鲢36对EST-SSR引物特征Tab. 1 Characterization of 36 EST-SSR in silver carp

续表1

表2 144尾鲢测量指标Tab. 2 Measurements from 144 silver carp individuals

3 讨论

3.1 鲢卵组织转录组的微卫星分布特点

Serapion等[21]的方法从斑点叉尾鮰开发TypeⅠ标记(EST-SSR), 首次报道鱼类用此方法研究的先例。随后, 在其他鱼类[22—24]、虾类[25,26]和贝类[27]中也有EST-SSR标记开发报道。本研究, 我们得到的结果有31.7%的鲢EST序列包含SSR, 这个比例远远高于斑节对虾(13.7%)[26]、河豚(11.5%)[28]和斑点叉尾鮰(11.2%)[21]、中国对虾(2.2%)[29]、海湾扇贝(4%)[27]和真鲷(4%)[24]。植物包含SSR的EST序列百分比在1%—5%[30,31]。可见, 水生生物包含SSR的EST序列是非常丰富的。本研究中SSR丰富度较高, 可能是因为测序方法、序列拼接方式和计算法则更优化, 去除了更多的冗余数据, 提高了SSR的百分比。也有可能是鲢卵组织EST序列的一个自身特点, 有待我们进一步研究。

3.2 鲢转录组微卫星分布类型和多态率

大多数动物的EST数据库中SSR核心重复类型以二碱基居多数, 而植物则是三碱基重复最丰富[30,31]。在鲤科鱼中, 包括非编码区SSR和编码区SSR中的研究[28,32], 二碱基CA重复的序列最多[6,33,34]。也有少数学者提出相反观点, 认为AT二碱基重复次数最常见[22]。在本研究中, 鲢EST数据中二碱基CA重复次数最多, 与大部分鲤科鱼类研究相同。

多态位点不仅仅依赖于核心重复次数, 有些二碱基重复五次检测结果是多态, 而重复六次甚至更多却是单态[35,36]。编码区的突变概率要小于非编码区, 源于基因受选择压力的影响[35]。与Type Ⅱ标记的SSR(来自非编码区)相比, EST-SSR的多态比例略低[25,37]。本研究的结果, 共设计了175对ESTSSR引物, 有148对有扩增产物, 说明测序的EST质量是可靠的。多态有36对, 占总比例24.3%; 单态有60对, 占40.1%, 可能是源于基因的保守性。有27对无扩增产物, 可能是因为引物设计位点跨外显子扩增[37]。

表3 鲢生长性状有关的EST-SSR多态位点信息Tab. 3 Effects of EST-SSR polymorphisms on growth traits of silver carp

3.3 鲢生长性状相关的功能基因标记

本研究共筛选得到两个与鲢生长性状有关的EST-SSR位点, SCE26和SCE65。如表3所示, 两个位点按基因型分类, SCE26位点A148-154为优势基因型, 基因型频率为0.68。A148-154与A154-154的体长和体重差异显著, 而肥满度无相关性。SCE65的基因型A149-159和A159-159的肥满度差异显著, 体长和体重则无显著相关。群体的等位基因频率受人工选择、亲本数目及随机遗传漂变的影响较大[38]。本研究的实验材料144尾鲢不受这些情况的影响。因此, 可以排除上述可能干扰等位基因频率的因素。

候选基因的效应可能只存在某个群体或者特定世代, 即这种数量性状的连锁关系需要在该群体子代、同品种不同群体及不同品种中进行验证[39]。因此本研究对鲢微卫星的多态位点与外观性状的关系将进一步验证, 以期得到更准确的结果。这两个标记有可能作为生长有关的候选基因, 进行鲢分子标记辅助育种研究。

有关鲢EST-SSR标记的报道比较少。Wang等[6]用鲤的EST-SSR引物对鲢进行跨种扩增研究, 得到的EST-SSR多态率偏低。Guo等[16]构建鲢的微卫星文库, 筛选的大部分EST-SSR引物以GT二碱基核心重复为主。本研究直接从鲢的转录组测序产物中寻找SSR进行验证, 属于测序的副产品研究, 省时省力, 且涉及的引物核心重复序列覆盖二碱基、三碱基、四碱基和五碱基。

Blast结果显示, 36条鲢EST-SSR序列中有10条序列确定已知基因功能, 如转运蛋白、蛋白激酶、去甲基化酶及白细胞介素等, 有助于已知功能基因的定位。在目前的研究中, 关于鲢生长、繁殖、抗病等分子标记的相关报道较少。可根据不同的生产目的选择相应的基因型标记进行标记辅助育种研究, 重点研究生长速度快、耐低氧、抗病性强的基因, 全基因组测序工作的开展, 将加快研究进程。

猜你喜欢

多态碱基基因型
应用思维进阶构建模型 例谈培养学生创造性思维
参差多态而功不唐捐
中国科学家创建出新型糖基化酶碱基编辑器
生命“字母表”迎来新成员
生命“字母表”迎来4名新成员
《C++面向对象程序设计》中引用类型的教学实践
人多巴胺D2基因启动子区—350A/G多态位点荧光素酶表达载体的构建与鉴定及活性检测
西安地区育龄妇女MTHFRC677T基因型分布研究
作物遗传育种研究进展Ⅴ.表型选择与基因型选择
烟碱型乙酰胆碱受体基因多态与早发性精神分裂症的关联研究