小鼠胆固醇性状的核质互作QTL定位研究
2014-08-14吴方楠周伊婷鞠秀峰汤在祥
王 也,吴方楠,周伊婷,鞠秀峰,汤在祥
(苏州大学医学部公共卫生学院流行病与卫生统计学系,遗传流行病与基因组学研究中心,苏州,江苏 215123)
生物性状的表达有赖于基因间的上位性作用,上位性作用构成了复杂的网络,调节了几乎全部的基因表达[1]。目前研究人员已经发展出一系列解析核内基因间上位性的统计模型和分析方法,在实际研究中也检测到了具有显著上位性的基因[2]。随着对复杂性状遗传基础研究的不断深入,细胞质环境对于基因表达的影响作用正在受到研究人员的关注。在模式生物上线粒体与细胞核间的上位性效应对性状表达有明显的影响[3-5],核质之间的紧密联系多次得到了证实。虽然这些研究结果为深入认识复杂性状的遗传表达以及核质互作遗传机制提供了一定的依据,然而,如何在分子水平上探明核质互作的遗传学基础,仍然有待研究。长期以来,由于相关统计学方法的缺乏,核质上位性在复杂数量性状遗传中的重要性常常被研究人员忽视[6]。尚没有将核质互作效应在分子水平上作进一步的遗传剖析,因而,无法追踪在一定细胞质背景下哪些基因表达,表达的基因所在位置,表达效应的方向和大小,以及重要的核质上位互作效应等。
Tang等[7]在2007年较早地提出核质互作的quantitative trait locus (QTL)分析思想,在分离群体中引入细胞质变异,即将双亲杂交衍生的正交分离群体和反交分离群体进行混合分析,有效地分解控制复杂性状的细胞质效应、核内QTL效应以及QTL和细胞质的互作效应。本研究将在前期研究工作的基础上[7-9],拟进一步改善该模型和方法,并以公开发表的小鼠胆固醇含量等复杂性状的数据为例,展示该分析方法和模型的有效性和实用性,并在现有数据基础上发现新的遗传机制。
1 材料和方法
1.1 遗传设计
本研究采用QTL Archive 网站上的公共数据,其遗传设计如下:取DBA/2J (D2)和CAST/EiJ (CAST)两种品系的小鼠,采用正反遗传交配设计。亲代小鼠以及F1和F2均在相同的环境条件下饲养繁殖[10,11]。F1代小鼠由D2和CAST两种品系的小鼠相互交配产生,两种杂交形式为CAST(父本)×D2(母本)和D2(父本)×CAST(母本)。F2代由F1代个体随机组合交配产生。遗传设计如图1所示。
图1 正反杂交遗传设计
1.2 表型数据收集和分析
根据原作者描述,研究采用了F2代小鼠全部为雄性,共278只,年龄在16~18周。F2代小鼠生长至6~8周后进行连续十周的高脂肪饮食喂养[12],实验前禁食4 h后眼窝静脉窦进行采血。血液在4℃环境下保存,然后通过离心(1 000 r/min,5 min)将血浆分离,在分析前储存在-20℃环境下。采用自动生化分析仪及配套的试剂对高密度脂蛋白胆固醇和总胆固醇进行分析[13,14]。非高密度脂蛋白通过计算总胆固醇与高密度胆固醇之间的差值而确定。
1.3 DNA标记
采用在DBA/2J (D2)和CAST/EiJ (CAST)小鼠间具有多态性的微卫星遗传标记,其数量选择依染色体长度而定。标记间平均遗传距离约20 cM, 覆盖小鼠除性染色体以外全部19条染色体。
1.4 原理
(1)
记Xj=(1xcjx1jx2jx3jx4j)为一行向量,b=(b0cadiaciad)Τ,则模型(1)可以矩阵语言表示为:
(2)
表1 个体基因型及基因型值组成分量
(3)
(4)
以上二式中的“E”表示有关缺失变量的期望值,其计算方法概述如下:
(7)
(8)
进而有EM算法实现的极大似然估计步骤如下:
(4)重复(2)和(3)两步,直至收敛为止。收敛时的参数估计值即为相应参数的极大似然估计值。
1.4.3 似然比检验:本研究主要进行两方面检验,首先是是否有无QTL的检验,其次是关于该QTL是否存在核质交互作用的检验,具体如下:
(9)
上式中的Xj=(1xcj)。获得相关参数估计值后,计算H0假设下的对数似然函数值L0为:
其中
而H1下的对数似然函数lnL1,则以模型(1)中相应参数的极大似然估计值代入(4)式计算获得,从而有似然比测验统计量:
(10)
用于测验H0,该统计量服从自由度为4的χ2分布。
(11)
该统计量服从自由度为2的χ2分布。
1.4.4 核质互作QTL定位:在进行QTL定位和核质上位性分析时,首先利用(9)进行全基因组搜索,获得QTL的似然图谱,并以之推断各染色体上是否存在QTL,以及各个QTL可能的位置,然后进一步进行似然比检验,确定该QTL是否存在显著的基因型效应,以及QTL与细胞质遗传物质是否存在上位性效应。本研究以LOD值3.0为显著性的阈值。
2 结果
2.1 细胞质效应差异显著性分析
细胞质效应分析,采用正反交之间比较,胆固醇相关性状指标的细胞质效应分析见表2。由表2可见,仅HDL在不同的细胞质背景下呈现出显著的差异(P<0.05),该结果暗示了细胞质效应的存在,为进一步进行核质互作QTL分析奠定了基础。需要指出的是,细胞质效应不显著,并不表示不存在QTL与细胞质背景的互作效应。
2.2 核质互作QTL定位
图2~图4展示了3个性状全基因组扫描的结果,该结果表明,CHOL在第9染色体上存在一个QTL,HDL在第2,4,6染色体上共有4个QTL,nonHDL在第9染色体上存在1个QTL,各个QTL的参数估计见表3。采用上述显著性检验方法,对各个QTL是否存在显著核质互作效应进行了检验,表中LOD1为QTL似然比检验统计量,LOD2为QTL与细胞质交互作用似然比检验统计量,该统计量大于3.0表示,存在QTL或存在显著的核质互作效应。结果表明在第6染色体上,影响HDL的一个QTL存在显著核质效应,且以加性与细胞质互作效应为主。在第9染色体上,影响CHOL的QTL也存在较大的核质互作效应,尽管没有通过显著性检验,仍然提示可能存在核质交互作用。
表2 F2群体血浆总胆固醇、高密度脂蛋白、非高密度脂蛋白浓度分析
表3 核质互作QTL定位结果
图2 小鼠总胆固醇量各连锁群QTL定位的似然图谱
图4 小鼠非高密度脂蛋白各连锁群QTL定位的似然图谱
3 讨论
本研究改进了业已构建的核质互作统计遗传模型,增加了对核质效应的检验,有利于发掘具有显著核质互作效应的基因。利用公共数据库的数据,分析了小鼠正反F2家系数据,不仅验证了前任研究的结果,而且进一步明确了有关QTL的核质互作作用,为进一步解释相关性状的核质互作机制奠定了初步的研究结果。
在前人的研究结果中[16-18],对CHOL,HDL和nsn-HDL 3个性状,采用常用的区间作图方法共定位到了6个QTL。它们分别是影响CHOL的QTL,位于第9染色体第8 cM位置的Chol6;影响HDL的4个QTL,分别位于第2染色体上48 cM处Hdl1,第4染色体的20 cM处Hdlq10,以及第6染色体的48 cM 处的Hdl11,和68 cM位置上的Hdl12;影响non-HDL的QTL,位于第9染色体8 cM处Chol6。本研究QTL的定位于上述QTL定位结果相似,特别是在QTL位置的置信区间上相互重叠。这证明了本研究的模型方法以及分析结果正确性,也说明了这些QTL的事实存在。因此,本研究的意义在于,采用新的统计遗传模型发掘现有数据,并得出新的结论,为进一步全面深入了解小鼠复杂性状的遗传机制奠定基础。
参考文献:
[1] Malmberg RL, Held S, Waits A, et al. Epistasis for fitness-related quantitative traits in Arabidopsis thaliana grown in the field and in the greenhouse [J]. Genetics,2005, 171(4):2013-2027.
[2] Hua J, Xing Y, Wu W, et al. Single-locus heterotic effects and dominance by dominance interactions can adequately explain the genetic basis of heterosis in an elite rice hybrid [J]. Proc Nat Acad Sci U S A,2003, 100(5):2574-2579.
[3] Allen JO. Effect of teosinte cytoplasmic genomes on maize phenotype [J]. Genetics,2005, 169(2):863-880.
[4] Rand DM, Haney RA, Fry AJ. Cytonuclear coevolution: the genomics of cooperation [J]. Trends Ecol Evol,2004, 19(12):645-653.
[5] Roubertoux P L, Sluyter F, Carlier M, et al. Mitochondrial DNA modifies cognition in interaction with the nuclear genome and age in mice [J]. Nat Genet,2003, 35(1):65-69.
[6] Carlborg O, Haley CS. Epistasis: too often neglected in complex trait studies [J]. Nature Rev Genet,2004, 5(8):618-625.
[7] Tang Z, Wang X, Hu Z, et al. Genetic dissection of cytonuclear epistasis in line cross [J]. Genetics, 2007, 177:669-672.
[8] Hang Y, Jiang B, Zhu J, et al. Bayesian models for detecting epistatic interactions from genetic data [J]. Ann Hum Genet,2011b, 75(1):183-93.
[9] 王曦, 李红霞, 王靖宇. 鼠数量性状QTL定位的研究进展 [J]. 中国比较医学杂志, 2006, 16(4):249-254.
[10] Valdar W, Solberg LC, Gauguier D, et al. Genetic and environmental effects on complex traits in mice [J]. Genetics, 2006, 174:959-984.
[11] 周淑佩, 张晓红, 刘国庆, 等. 混合性高甘油三酯/高胆固醇血症小鼠模型的培育 [J]. 中国比较医学杂志, 2005, 15(6):368-371.
[12] 杨小毅, 杨永宗, 谭健苗, 等. 一种纯系小鼠动脉粥样硬化病理模型的建立 [J].中国动脉硬化杂志, 1996, 4(1): 54-57.
[13] Allain CC, Poon LS, Chan CS, et al. Enzymatic determination of total serum cholesterol [J]. Clin Chem,1974, 20:470-475.
[14] Roeschlau P, Bernt E, Gruber W. Enzymatic determination of total cholesterol in serum [J]. Z Klin Chem Klin Biochem,1974, 12(9):403-407.
[15] Xu C, He X, Xu S. Mapping quantitative trait loci underlying triploid endosperm traits [J]. Heredity,2003, 90(3):228-235.
[16] Lyons MA, Wittenburg H, Li R, et al. Quantitative trait loci that determine lipoprotein cholesterol levels in DBA/2J and CAST/Ei inbred mice [J]. J Lipid Res,2003, 44(5):953-967.
[17] Lyons MA, Wittenburg H, Li R, et al. Lith6: a new QTL for cholesterol gallstones from an intercross of CAST/Ei and DBA/2J inbred mouse strains [J]. J Lipid Res,2003, 44(9):1763-1771.
[18] Li R, Lyons MA, Wittenburg H, et al. Combining data from multiple inbred line crosses improves the power and resolution of quantitative trait loci mapping [J]. Genetics,2005, 169(3):1699-1709.