混合分离分析法在水产动物基因定位中的应用
2023-12-29郭亚东王文权孟乾徐大凤李雪燕于雯雯
郭亚东,王文权,孟乾,徐大凤,李雪燕,于雯雯*
(1.如东县渔政监督大队,江苏 南通 226241;2.江苏省海洋水产研究所,江苏省鱼类遗传育种重点实验室,江苏 南通 226007;3.烟台市芝罘区现代海洋产业发展促进中心,山东 烟台 264001)
对目标性状关联基因进行筛选和定位,是水产动物遗传育种研究的前提和基础。传统的基因定位方法,需要对整个遗传群体进行多态性标记分析,成本较高。混合分离分析法(Bulked segregant analysis, BSA),是根据研究的目的性状,从子代分离群体中,选取2 组表型差异的极端个体,分别等量混合构建DNA 池,进行标记差异分析,2 池间的DNA 差异片段即为候选区域。该方法可以相对较低的成本,快速检测分子标记与目标性状的关联,常被用于生物体极端性状相关基因的定位与挖掘[1]。
BSA 技术最早由Michelmore 等[2],于1991年应用于莴苣抗霜霉病基因相关标记的筛选,成功获得3 个与霜霉病抗性基因Dm5/8 紧密连锁的RAPD标记。BSA 法在农作物基因筛选与定位中应用最为普遍[3],在畜禽[4]、林木[5]、水产动物[6]研究中,也显示出巨大的应用潜力和发展前景。随着分子标记技术和近10年来新一代测序(NGS)技术的发展,BSA 方法和技术体系也逐渐得到发展和完善。与此同时,不断降低的测序成本加速了基于NGS 的BSA 在水产中的应用。现对BSA 技术在水产动物方面的应用研究,特别是基于测序的BSA 方法在基因定位上最新研究进展进行综述。
1 基于传统分子标记的BSA 法
BSA 技术的进步,依赖于分子标记技术的发展。在测序成本大幅降低之前,BSA 方法主要采用传统分子标记技术,如限制性片段长度多态性(RFLP)、随机扩增多态性DNA(RAPD)、简单序列重复(SSR)、扩增片段长度多态性(AFLP)等。
1999年,Palti 等[7]首次将BSA 方法用于水产动物目标基因筛选,利用抗传染性造血器官坏死病(IHN)的切喉鳟(Oncorhynchus clarki)与虹鳟(Oncorhynchus mykiss),杂交获得16 个全同胞杂交家系,这些家系在受IHN 病毒攻击后,收集易感群体和耐受群体,采用RFLP 标记技术和BSA 方法,获得33 个差异性位点。此后,BSA 被广泛应用于水产动物目标基因的筛选与定位研究,尤其是在性别研究领域。Felip 等[8]利用BSA-AFLP 法,在虹鳟中筛选出19 对与性别相关的AFLP 引物,并将其中15 个转化为特异性序列扩增(SCAR)标记,其中1个标记被成功定位于Y 染色体的性位点附近。Lee等[9-10]采用BSA 方法,从尼罗罗非鱼(Oreochromis niloticus)中分别获得了与性别相关的8 个SSR 标记和3 个AFLP 标记。此外,BSA 法结合传统分子标记技术,还被应用于日本对虾(Penaeus japonicus)[11]、斑节对虾(Penaeus monodon)[12]、巨骨舌鱼(Arapaima gigas)[13]性别基因相关研究中。BSA 法在贝类壳色和鱼类耐温、虾类生长相关研究中,也取得一些进展。Qin 等[14]通过将橙壳色与白壳色海湾扇贝(Argopecten irradians)杂交,获得F1 代分离群体,采用BSAAFLP 方法,筛选出6 个与壳色显著相关的标记,这6 个标记全部位于同一个连锁群,且其中一个标记(F1f335)与橙壳基因完全连锁。Ge 等[15]采用BSA法,在太平洋牡蛎(Crassostrea gigas)中筛选出7 个与壳色紧密相关的多态性AFLP 片段,成功开发了1 个共显性SCAR 标记,并将其整合到先前构建的连锁图谱中。Chen 等[16]使用BSA 方法,筛选和鉴定了与大黄鱼(Larimichthys crocea)耐热性相关的4 个SSR 扩增片段,这些片段被克隆和测序后,显示核心序列都是“AC”重复。袁晨浩[17]也采用BSA-SSR 技术,在红鳍东方鲀(Takifugu rubripes)耐低温和不耐低温群体间,筛选出3 个有显著差异的扩增片段。在生长性状相关基因的研究方面,He 等[18]采用BSA方法,结合RAPD 技术,筛选与中国对虾(Fenneropenaeus chinensis)生长性状相关的候选标记,获得了9 个与生长性状相关的RAPD 标记,其中包括7 个正相关和2 个负相关,并最终转化获得2 个差异性的SCAR 标记。随着NGS 技术的发展,传统分子标记技术逐渐被边缘化,基于传统分子标记技术BSA在水产动物基因定位中,也逐渐被淘汰。
2 基于转录组测序的BSA 法
随着NGS 技术的研究进展,使得通过转录组测序(RNA-seq)分析,可以在转录组水平上快速、全面的了解变异,将BSA 与RNA-seq 相结合的综合技术方案又被称为BSR(Bulked segregant RNAseq),将对基因表达和基因定位的研究相结合,通过检测单核苷酸多态性(SNP)和计算基因频率,寻找控制不同性状的关键基因[19]。
BSR 技术于2012年在植物研究中被较早报道[20-21]。2013年,Wang 等[22]较早将BSR 技术应用于水产动物基因研究,筛选(Ictalurus sp.)肠道败血症(ESC)抗病相关基因,在易感鱼和抗性鱼中,分别鉴定出1 240 和224 个基因于ESC 感染后差异表达,获得17 个可能与抗病相关的候选基因。该研究认为,BSR 技术较基因芯片分析技术更加灵敏、成本更低,尤其适用于对各种表型性状相关基因进行分析。Dai 等[23]使用剩余采食量(RFI)作为饲料效率的衡量标准,通过BSR 分析,获得11 026 个在凡纳滨对虾(Litopenaeus vannamei)高效和低效集群之间表现出显著等位基因失衡的SNP 标记,其中568 个标记位于差异表达基因中。Wang 等[24]在凡纳滨对虾Zoea I 幼体阶段,获得了60 个雌性和雄性之间的差异表达基因,注释了其中41 个基因,并最终获得了2 个与性别完全连锁的基因,这2 个基因可能位于凡纳滨对虾的性别决定区域。Liu 等[25]利用基于基因组和遗传连锁群的BSR 分析,将卵形鲳鲹(Trachinotus blochii)的耐缺氧相关SNPs,定位于18 和22 号连锁群,并在肝脏中获得17 个差异表达基因。对这些基因的注释分析表明,葡萄糖和脂质代谢的平衡,在鱼类缺氧耐受性中起着关键作用。2019年,Wan 等[26]将BSR 与GWAS 分析方法相结合,在大黄鱼中发现了IL10、THBS1、IGSF21 等9 个抗香鱼假单胞菌(Pseudomonas plecoglossicida)感染的基因,获得了5 个可以解释56.6%的遗传变异的SNP 标记。上述研究表明,借助BSR 与GWAS 方法,分别在转录组和基因组水平鉴定候选基因,可以有效提高候选基因筛选的准确性。
3 基于基因组测序的BSA 法
随着NGS 成本的不断降低以及第三代测序(PacBio 或Nanopore 测序)和Hi-C 技术的广泛应用,主要水产养殖动物全基因组测序均已完成[27],为表型性状相关基因的筛选和定位提供了极大的便利。尽管测序成本大幅下降,但在种群规模上,对每个个体的基因组重测序进行遗传分析,仍然局限于少数模式物种。采用BSA 方法,从2 个具有相对性状的群体中,构建DNA 混合池,进行混池测序(Poolseq),可大幅降低测序成本,且可无偏地从大量个体中确定全基因组等位基因频率[28],快速检测和注释与性状相关的基因位点,是一种经济高效的方法,适合在表型性状明显分离的群体中定位相关基因。
2019年,Wan 等[29]采用全基因组重测序和BSA方法,鉴定了与团头鲂(Megalobrama amblycephala)肌间刺(IB)数相关的SNP。分别在6 号和11 号染色体,获得了2 个SNP 富集区域,使用52 个SNP 进行数据可靠性验证,其中5 个SNP 与IB 数性状显著相关。Cui 等[6]也采用此方法获得了3 个与IB 数量显著相关的SNP,这些标记有效提高了IB 性状的表型解释率,对鲤标记辅助选择育种具有重要意义。在基因组数据的基础上,将BSA 法与其他基因定位方法相结合或采用多种BSA 算法联合分析,可有效提高基因定位精度。Luo 等[30]在基因组重测序基础上,通过BSA 结合全基因组关联分析(GWAS),在转基因黄河鲤(Cyprinus carpio L)中,从最初筛选出的含48 个SNP 标记的23 个生长相关候选基因中,成功鉴定了2 个生长相关基因。Zhang 等[31]收集了37 个黄姑鱼(Nibea albiflora)红头病易感和抗病群体的样本,进行Pool-seq 测序后,采用χ2检验、logit 回归分析和G'值算法3 种BSA 算法联合分析,将抗红头病基因定位在22 号染色体上10.90~13.11 Mb。通过功能基因注释,在该区域发现了12 个参与免疫反应的基因,主要基因均存在于NF-κB 信号通路,提示该信号通路可能在红头病抗性中起重要作用。
4 讨论
随着NGS 技术的发展,基于测序的BSA 技术,在许多物种检测中得以应用,大大减少了整体测序量和数据分析的工作量,该技术不仅提高了性状相关基因的检测效率,而且降低了测序成本,成为目前较为流行的基因定位方法。该技术也存在不足之处,如无法精细定位基因的区间,比较适合于质量性状基因定位。对于数量性状位点(QTL)来说,只能对其主效的QTL 进行标记定位,对于微效QTL 则无能为力,而且灵敏度和精确度要低于其他的QTL 定位方法。所以在数量性状基因定位方面,BSA 法应用较少,主要集中在抗性性状相关基因方面。目前大多数与BSA 相关的报告,仅提供性状的初始定位结果,通常具有几兆的碱基的分辨率。因此,如何在BSA 作图的基础上精细作图,尤其是提高数量性状相关基因定位精度,可采取以下策略进一步提高定位精度。
(1)增加具有极端表型的分离群体的大小,水产动物一般繁殖能力较强,适当扩大群体规模,可以覆盖更多的重组体,从而提高重组热点区域的定位分辨率。
(2)采用BSA 方法进行初级作图,得到一个峰相对较高(可靠性高)的作图区间,设计一个均匀分布的基于SNP 的竞争性等位基因特异性PCR(KASP)标记,或裂解扩增多态性序列(CAPS),从不包含在极端池中个体的分离群体中,随机选择数百个体进行基因分型,构建目标区间的遗传图谱和QTL 图谱[32]。
(3)将BSA 与多组学相结合,也是实现精细定位和候选基因筛选的有力策略。例如,BSA 和转录组分析联合,进行共定位,在定位区间内的差异表达分析,有利于候选基因筛选[33];BSA 结合自然种群的GWAS 分析,能提高定位精度[34]。
(4)采用合适的算法或多种算法联合分析。欧氏距离法(ED)、SNP-index 法和G' 值法是目前常用的几种定位算法。ED 法无须双亲基因信息,但高度依赖遗传分离群体(如,双亲杂合度高的F1 群体),适合对水产动物进行基因定位,但易产生假阳性;SNP-index 法得到的定位区间较大,但显著性较低,对数量性状基因定位的敏感度较低;G'值法具有较低的假阳性率,定位精度也更高,但不具备校正其他干扰因素的能力[35]。综合采用多种算法进行基因定位,也可有效提高定位精度[31]。
随着越来越多的水产动物全基因组测序完成,以及相关算法和软件的逐步完善,采用BSA 方法进行基因定位的精度和准确性,都会有很大提高,在水产动物性别、体色、抗性、生长等性状相关基因精细定位中的重要性,将日益凸显,成为水产动物遗传育种研究的重要工具。