数量遗传性状基因定位方法研究进展
2021-12-06田玉马春红宋丽华温之雨董文琦赵璞
田玉,马春红,宋丽华,温之雨,董文琦,赵璞*
(1.河北省农林科学院,河北 石家庄 050031;2.河北省农林科学院生物技术与食品科学研究所/河北省植物转基因中心,河北石家庄 050051;3.饶阳县农业农村局,河北 饶阳 053900)
植物的大部分农艺性状、产量性状和品质性状属于数量遗传性状[1,2]。数量遗传性状由多基因调控,在分离群体中表现为连续分布,且易受到环境影响。数量遗传性状的深度解析与现代分子生物学技术的发展密切相关,分子标记、作图群体以及统计分析方法的应用和发展显著提高了数量遗传性状基因定位效率。
1 分子标记
分子标记反映不同个体间DNA序列的变异,可以较为直观地反映DNA水平的遗传多态性,具有共显性的特点[3]。与利用表型进行目标性状筛选相比,分子标记具有不影响目标性状表达、不受环境影响、数量极多、能够对隐性遗传性状准确筛选、与基因变异直接相关、不与其他性状连锁等优点。分子标记检测手段简单、迅速,因此作为作物遗传改良的重要工具广泛应用于遗传育种、基因挖掘、基因定位、基因库的设计与构建等方面。根据其基础技术发展的过程,分子标记可分为3代:
第1代:以分子杂交技术为基础的RFLP标记。DNA序列改变时酶切位点会同时发生变化,从而产生RFLP标记扩增条带的多态性。RFLP标记因其要求DNA模板量大、分析过程繁琐、价格高昂、灵敏度不高等问题,目前逐渐被新兴分子标记所取代[4]。
第2代:以PCR技术为基础的分子标记。第2代分子标记主要有RAPD标记、ISSR标记、SSR标记、STS标记、AFLP标记、SCAR标记、SRAP标记和CAPS标记等。其中,SSR标记在整个基因组中分布较为均匀,具有较高的重复率和可靠性,是热门遗传标记[5],广泛应用于遗传多样性分析,以及种子纯度和品种鉴定等方面。利用SSR标记进行遗传背景分析时需要大量覆盖目标区段的引物,而引物的设计需建立在明确简单重复序列两端核酸信息的基础上,因此在实际应用中受到了一定限制[6,7]。AFLP标记利用特异性引物对限制性内切酶酶切片段进行PCR扩增来鉴定DNA多态性[8],具有稳定可靠、易重复、操作简单便捷、成本较低等优点,被广泛应用于植物遗传育种、遗传多样性分析以及种质资源鉴定等方面[9],但由于受专利保护,目前仅在非盈利性的研究中应用。
第3代:基于全基因组测序技术的分子标记。随着测序技术的进步,作为第3代分子标记代表的SNP标记被越来越多地应用于QTL定位。其多态性表现为单碱基变异,即不同等位基因间同一位点的单个碱基插入、缺失或者替换[10]。与前2代分子标记相比,第3代分子标记具有一定的优越性:(1)数量更多,密度更大,在全基因组分布更加均匀;(2)突变率低,稳定性高;(3)大部分情况下表现为二等位多态性,组成的碱基类型少;(4)SNP本身就可能是候选基因位点,当SNP发生在基因内部时就有可能影响基因表达或导致蛋白质结构发生变化。SNP标记主要依托基因组测序或者基因芯片,检测成本和技术要求较高,目前广泛应用于群体结构和群体亲缘关系、种质资源遗传演化等方面[11,12]。根据不同应用技术,SNP标记具有不同的开发方式。
混合群体分离分析法(BSA)是利用具有2个极端性状的个体分别组成混池测序来开发SNP标记的一种方法。其主要原理是通过对比群体中极端性状或代表性性状个体组成的混池的DNA序列,筛选显著的差异位点。随着技术革新使得测序成本降低,目前BSA技术已成为QTL定位、候选基因挖掘等研究的有力工具[13~15]。
简化基因组测序技术也是SNP标记开发的一类方法,其中SLAF-Seq技术、RAD-seq技术和GBS-seq应用较为广泛。该方法首先通过限制性内切酶分割基因组,选择性地回收一定长度范围内的酶切片段进行测序,从而将基因组的复杂程度大幅简化,操作相对更简便,对特定区域鉴定到SNP位点密度更高,试验周期短,不要求必须是具有参考基因组的物种,适用于大样本量研究,从而有效地实现遗传进化基因分析以及重要性状候选基因的预测[16~22]。
全基因组重测序技术是对已知基因组序列物种中的个体再次进行基因测序并分析比较个体间的遗传差异性,是开发SNP标记的另一类方法。与简化基因组技术测序采用酶切技术不同,重测序技术利用超声波将DNA随机打断,获得不受酶切位点的限制DNA片段,从而大大提高获取SNP的数量以及密度[23,24]。
SNP标记还可以通过芯片方式进行DNA多态性检测。该种芯片的开发需要全基因组信息,根据参考基因组序列设计包含特定SNP位点的荧光信号探针。参试样本DNA与芯片上被标记的核酸探针进行杂交,根据产生的信号强弱即可判断样本DNA与核酸探针互补序列的区段是否存在SNP突变。基于全基因组开发的SNP芯片,通常包含数以万计的SNP位点,具有高效、便捷的特点[25~30]。
2 作图群体
大部分QTL定位方法均需要构建遗传群体,遗传群体是构建遗传图谱和QTL定位的基石。根据遗传背景的差异大小,遗传群体被分为初级群体和高级群体2种。
初级作图群体个体间遗传背景差异较大,根据遗传稳定性又可分为临时性分离群体和永久性分离群体,主要包括F2、F3、BC1、单倍体群体(DH)、重组自交系群体(RIL)等。其中,F2群体及其衍生家系、回交群体属于临时性分离群体,具有易配制、群体基因型丰富、作图分析效率高的特点,但重复率低,不能进行有效连续性研究;DH、RIL和永久F2群体(IF2)属于永久性群体,具有后代稳定、可开展多年多点试验的特点,但也存在一定缺点,如DH群体构建时易受诱导加倍影响造成群体遗传背景偏分离而影响作图的准确性,RIL群体只能计算加性效应但不能够计算显性效应,IF2群体变异丰富但不适于精细定位。
高级作图群体的群体基因组背景高度一致且与轮回亲本相同,个体仅含少量供体亲本片段,主要包括近等基因系类群体(NILs)、单片段代换系(SSSL)群体和染色体片段置换系(CSSL)群体。高级作图群体具有精度高、群体遗传背景稳定、检测效率高的特点,被广泛应用于QTL精细定位和图位克隆,但存在群体构建周期长、工作量大的缺点。
3 数量遗传性状基因定位分析方法
3.1 连锁分析
连锁分析基于遗传的连锁原理。QTL连锁分析常用的统计分析方法有区间作图法(IM)、复合区间作图法(CIM)、混合线性模型(MLM)、完备区间作图法(ICIM)等。IM以回归模型为基础,通过遗传群体开发多态性标记并构建连锁图谱,每2个相邻标记间存在QTL的可能性(LOD值)依据极大似然函数进行分析并对其进行假设检测,当LOD值高于给定阈值时即认为检测到了相关QTL;其缺点是同一条染色体上存在多个调控性状QTL的情况时,精度会下降。CIM是在IM中引入多元线性回归分析,可以大幅度提高作图的精度。MLM是基于混合线性模型的CIM,其通过多环境下的QTL定位联合分析,使作图精度和效率都得到有效提高。ICIM是王建康课题组在前人研究的基础上提出的,可以对各种效应成分进行有效预测,还能接近无偏估计,更重要的是提高了QTL的精度和效率。
3.2 关联分析
连锁分析可以解析两亲本间的遗传变异,但在挖掘种质资源中等位变异时效率低、成本高,且由于连锁分析依赖作图群体,在群体数量和研究目标性状方面仍存在一定的缺陷。关联分析法很好地解决了这些问题。全基因组关联分析(GWAS)是一种通过检验全基因组遗传标记与表型变异关联的显著性来定位与性状相关的遗传位点,在群体水平上解析性状遗传基础的方法[31]。关联分析具有许多优点,如,可以直接使用自然群体或种质资源,不需要专门构建作图群体;检测效率高,可同时检测同一座位的多个等位基因;节省研究时间;分辨率高。但相应地,GWAS也存在一定的缺点,如,当群体结构分化明显时容易造成假阳性;需要的样本量较大,足够多的样本才能保证p值足够低,从而避免假阳性和假阴性。同时,精确的表型鉴定是GWAS成功定位的重要保障。
近年来,QTL定位发展出了新的策略,如Ho-LAMap(ho index unified linkage and association mapping)、Pool-Seq、QTG-Seq等。Ho-LAMap是一种GWAS与连锁分析相结合的、快速鉴定控制复杂农艺性状候选基因的方法,由中国农业大学李自超教授团队提出。水稻大部分农艺性状是由多基因控制的数量性状,随着测序技术和数量性状定位分析方法的发展,大量水稻种质资源深度测序的完成使得水稻种质资源群体中存在的自然等位变异得以通过GWAS鉴定。但是,由于水稻基因组的LD衰减较慢,因此造成关联分析的精度无法达到单基因的水平。李自超教授团队利用水稻种质资源和海量SNP数据进行产量相关基因的挖掘,将GWAS与连锁分析相结合,鉴定了2个控制水稻子粒长度的新基因OsLG3b和OsLG3。Pool-seq混池测序,即混合样本测序,其原理是假设每个样本的检测概率相等,理想情况下表型差异显著的混合样本,其相关基因等位基因频率的差异也显著。Pool-seq一般是选择表型极端或目标性状具有差异的个体混合,构建一个文库进行测序,在混合样本量足够大且测序深度提高的情况下,能够准确评估等位基因频率。QTG-Seq由QTL-Seq发展而来,能够更快、更精确地进行基因定位。Zhang等通过QTG-Seq,构建2个亲本的F2群体初步定位到4个株高相关QTL。之后构建两亲本的BC1F1群体,并选择其余3个QTL纯合而目标QTL杂合的单株继续构建BC2F2家系,从中筛选获得近1 200个具有极端株高表型的单株作为混池。通过对极端表型单株混池进行全基因组测序,并通过最大似然算法(smoothLOD)直接鉴定候选基因,仅用4个世代就从双亲组配的群体中挖掘出候选基因,极大地节省了时间[32]。
4 发展策略与展望
分子标记技术是解析重要性状基因遗传效应,分析基因间、基因与环境间互作的重要手段,在进行数量性状分析和分子标记育种方面具有不可或缺的作用。创新分子标记开发技术,获得更多的分子标记和有利用价值的新基因,明析基因功能,可以提高我国分子育种效率,逐步建立并完善植物基因组选择[33],并在植物育种中发挥重要作用。