APP下载

牛XY 染色体差异分析及特异性基因的精准定位

2022-11-17史佩华陶晨雨

中国畜牧杂志 2022年11期
关键词:染色体基因组定位

史佩华,陶晨雨

(河北农业大学动物科技学院,河北保定 071000)

性别鉴定在畜禽动物生产中有着重要的意义,因此对于性染色体及特异基因的分析十分必要。性染色体由一对获得性别决定基因的祖先常染色体进化而来,在结构和基因含量上存在差异[1]。人类Y 染色体上男性特有序列MSY 占Y 染色体序列的95%,全长23 Mb,包含短臂(Yp)的8Mb 和长臂(Yq)的14.50 Mb。在MSY 中存在1 个着丝粒异染色质区域(约1Mb)和一个跨度约400 kb 的异染色质区[2]。人类的PAR1 和PAR2 位于性染色体长臂的顶端[3]。像人类一样,PAR和性别决定基因(SRY)位于黑猩猩的长臂末端,但是在大猩猩Y 染色体中却位于短臂末端[4-6]。在雌性哺乳动物中,X 染色体全长大约155 Mb,共有1 098 个基因(7.10 Mb),在X 染色体上基因密度较低,同时基因长度也较短[7]。但是X 染色体上包含人类基因组中已知的一个特异性基因PLP1与性连锁遗传相关。PLP1是位于X 染色体的高度保守的编码髓鞘蛋白脂蛋白(PLP)基因,构成中枢神经系统髓鞘的主要蛋白质[8]。Y 染色体较短但却携带着较多的功能基因,其中SRY[9-10]是研究最多的基因之一。SRY基因位于Y 染色体短臂(Yp)上,是目前公认的睾丸决定因子,在哺乳动物的性别决定中至关重要。

牛肉产业从雄性动物的生产中受益,而乳制品产业从雌性动物的牛奶生产中受益。因此需要具有理想性别的动物促进生产。虽然目前有对牛的Y 染色体基因进行定位和功能分析的相关研究[11],但是由于测序技术的限制,测得的片段很难区分X 与Y 染色体,无法从短序列读取复杂且高度重复的Y 扩增子区域,Y 染色体相关数据有限。因此,对牛性染色体的了解仍然不够全面。本实验根据已有的牛参考基因组对牛的性染色体序列做了系统的基因组生物信息学分析,选择特异性基因PLP1和SRY进行精准定位,为研究牛性染色体提供理论支撑,有助于推进后续的性别鉴定工作。

1 材料与方法

1.1 参考基因组下载和XY 染色体序列比对分析 本文中牛的最新参考基因组(assembly ARS-USD 1.2)下载于NCBI 数据库(https://www.ncbi.nlm.nih.gov)。在下载的参考基因组文件中,保留了完整的XY 染色体序列信息。通过序列相似性BLAST 比对,对牛X 染色体和Y 染色体比对分析,找到牛X 染色体和Y 染色体的基因富集区域。

1.2 XY 染色体特有基因GO 分析 在Ensembl 数据库(http://www.ensembl.org/biomart/martview)下载牛的XY 染色体特有基因ID 及GO 功能注释信息(LU_Bosgru_v3.0),在Omicshare 云平台(https://www.omicshare.com/tools)进行GO 二级分类。分析X 染色体特有基因PLP1和Y 染色体特有基因SRY的GO 二级功能注释结果。

1.3PLP1、SRY基因结构分析 将X 染色体上基因密度最高的前15 个区域和Y 染色体上基因密度最高的前10 个区域定义为热点区域。R 语言包“Rideogram”绘制染色体基因密度图[12]。R 语言包“Sushi”显示靶基因PLP1和SRY的结构[13]。

2 结果

2.1 XY 染色体基因组特征 基于牛XY 染色体基因密度分析,本研究获得了XY 染色体上的基因富集区域,整个X 和Y 染色体分别在图的左侧和右侧使用相同的比例显示。图谱上的基因密度信息映射为热图中的重叠特征,并在图谱旁边添加轨道标签,三角形标记为热点区域(图1)。但是在X 染色体上存在部分区域基因缺失,尤其在末端有大量空白区域,Y 染色体只有末端区域存在部分基因缺失。Y 染色体基因密度整体较高,X染色体基因密度比较低。说明XY 染色体上基因分布不均匀,X 染色体区域上基因含量较少,Y 染色体上基因含量丰富。其中X 染色体上包含130 个特有基因区域,而Y 染色体上包含42 个特有基因区域,XY 染色体上前10 个高密度基因区域如表1 所示。

表1 XY 染色体基因富集的前10 位热点区域

图1 XY 染色体的长度和基因密度

2.2 XY 染色体特异基因GO 分析 把XY 染色体特有基因进行GO 二级分类,注释绘制成图表并进行结果筛选(图2、表2)。虽然XY 染色体整体功能组差异不大,但是仍然存在一些功能特异性差异,比如在多细胞生物进程、应激反应、发育过程、分子功能调节、免疫过程中X 染色体比Y 染色体比例更高。甚至有关定位、运动方式、生殖过程、繁殖、生长、行为、规律性进程、细胞连接、超分子复合物、结构分子活性和转录因子活性以及蛋白质结合只注释到X 染色体,但是电子载体活性只注释到Y 染色体。另外X 染色体保守基因PLP1注释到生物调节、单一生物体过程、新陈代谢过程、应激反应、细胞成分组织或生物生成、多细胞生物体过程、发育过程相关二级功能。Y 染色体保守基因SRY注释到生物调节、单一生物体过程、多细胞生物体过程、发育过程、繁殖、生殖过程、细胞、细胞器、凝集、核酸结合转录因子活性相关二级功能,可见PLP1与SRY存在部分相同功能例如生物调节、单一生物体过程、多细胞生物体过程、发育过程。

图2 性染色体GO 注释的统计分类

XY 染色体特有基因被分成3 个功能组,包括生物过程、细胞组分、分子功能,X 染色体包括PLP1、MECP2、AR、ATRX、FOXO4、CASK、GATA1、HDAC6、FOXP3等特异基因共1 062 个(表3),多数基因的GO 二级功能主要富集在生物调节、代谢过程、应激反应、细胞器部分、大分子复合物、催化活性等(表2)。Y 染色体包括TLR7、ADGRG2、MSL3、PRPS2、GLRA2、PRKX、GPR143、ANOS1、SRY等特有基因共197 个(表3),多数基因的GO 二级功能主要富集在生物调节、单一生物过程、代谢过程、应激反应、组织或生物发生、细胞结合、催化活性、信号部分等(表2)。

表2 XY 染色体GO 注释条目及基因数目

表3 XY 染色体部分特异性基因

2.3PLP1、SRY定位分析PLP1与SRY基因是广泛研究的XY 染色体特异基因,在性别鉴定等领域有着广泛应用,又因基因保守性较好,因此本研究挑选了PLP1与SRY2 个基因进行分析。分析得出PLP1基因定位在X 染色体上52.00~53.00 Mb 区域,基因含量比较高,具体介于52.40~52.60 Mb 之间,包含7 个外显子,6 个内含子(图3)。对SRY基因定位发现,SRY基因位于Y 染色体上42.00~43.00 Mb 极高密度区域,在42.20~42.40 Mb 之间有6 个外显子、5 个内含子(图4)。基因的复制总是在特定位置开始,许多基因疾病的发生由某个基因的突变与复制错误造成,进行基因定位将有助于为疾病的治疗发现重要的靶点。PLP1与SRY是性别鉴定中的常见基因,可以为性别鉴定与疾病治疗等技术提供理论基础。

图3 PLP1 在X 染色体上的定位分析

图4 SRY 在Y 染色体上的定位

3 讨 论

3.1 XY 染色体基因组特征分析 关于XY 染色体进化差异的学说经历了多个时代,近几十年来的基因组研究认为哺乳动物X 染色体在种间大小和结构上与常染色体相似,并保留了大部分祖先X 基因[2]。进化过程中XY 染色体片段增加扩展了PAR 区,因此X 染色体基因高度保守,基因丰富。哺乳动物的Y 染色体却发生了实质性的进化差异,积累了雄性特有的基因和参与性别决定的基因,丢失了95% 的祖传基因,Y 染色体与基因组的其他部分不同,它是雄性特有的并表现出独特的结构和功能特征[14]。本研究通过对XY 染色体部分的个体基因研究表明X 染色体基因密度较Y 染色体来说要低得多,X 染色体中基因含量较高,但是基因密度不均匀,分布比较分散,部分末端明显没有基因分布,Y 染色体退化导致虽然基因含量不多却分布比较集中。这与Y 染色体进化过程中具有基因谱系特异性而导致的基因含量比较保守的情况是一致的[15-17]。Y 染色体比X染色体小得多,是基因组中最小的染色体,主要由假常染色体(PAR)、X-简并(X-D)和扩增子区域组成[2]。XY 染色体只在假常染色体区域PAR1 和PAR2 的末端发生重组,基因的大量重组导致序列测定很难进行[18],单倍体对Y 染色体重复序列的影响最大。Y 染色体的大部分长度不受染色体配对要求的限制,这些重复序列通过染色体内重组促进频繁的染色体重排,导致高度的结构变异[19-21]。基因密度信息可应用于多种不同情况,如单核苷酸多态性(SNP)和候选标记、DNA 甲基化动力学、转录因子(TF)结合位点和候选靶基因[12]。除了在染色体水平上可视化整个基因组的一些特定基因组特征,Rideogram 还可以用于比较2 个相关的基因组特征,这将为更好地理解这2 个特征的染色体分布之间的相关性提供一些重要的启示。本研究利用生物信息学分析技术对XY 染色体进行差异分析,结果获得了可视化的性染色体上相关基因组特征。

3.2PLP1、SRY基因特征分析 XY 染色体不同于常染色体,它含有许多与性发育和生殖有关的偏向基因,特定的性染色体基因可以通过偏向性别的表达和在大脑中的功能导致发育中的性别差异,例如PLP1基因等[22]。本实验结果显示PLP1基因定位到牛的X 染色体内一个基因密度较高的区域,位置在52.4~52.6 Mb,具有7个外显子。Chanchani 等[23]报道了人类的PLP1基因位于X 染色体长臂Xq22.2 q23 一个复杂的基因组区域,表明灵长类和牛的X 染色体的基因结构在进化过程中存在物种特异性。SRY定位到Y 染色体末端的假常染色体区域,具有6 个外显子。但是在人的Y 染色体上SRY标记为单外显子基因[24],说明在进化的过程中Y染色体可能依赖基因谱系。最近的研究发现小鼠SRY的第2 外显子和其相对应的SRY转录本(SRY-T)才是真正的睾丸决定因素[25]。有研究表明虽然SRY基因作为单拷贝基因存在于几乎所有哺乳动物中,但大鼠携带6 个拷贝,而小鼠SRY基因由于存在长倒置重复序列而具有与其他哺乳动物SRY基因不同的结构[26]。类似的研究结果显示SRY基因定位到Y 染色体的Yp 非常接近PAR1,Yp 上的PAR1 和Yq 上的PAR2 是Y 染色体中唯一在男性精子发生过程中与X 染色体同源序列进行减数分裂重组的区域,SRY与PAR1 的接近性使其容易在异常重组后易位到X 染色体[27]。当有XY 个体发生性别反转时,SRY基因在DNA 结合域有严重的突变[28]。有研究用FISH 法将SRY定位到牛Y 染色体正常编码区,但是表型特征却显示这头母牛没有发育睾丸,而是发育了有缺陷的卵巢[29]。事实上,SRY基因座的突变和缺失仅占 XY 的15%[30-31]。

3.3PLP1、SRY基因功能及应用分析 性别分化涉及一系列事件,其性腺和生殖器逐渐获得男性或女性特征依赖于一个复杂的功能基因网络,性染色体基因的正常功能保证了生物体发育的动态平衡。GO 分析结果显示XY 染色体候选基因在发育与性别差异等功能中有性别偏向表达,许多X 连锁基因在分子功能上与Y 连锁基因有较大差异的表达。与本研究一致的基因表达分析也说明X 连锁基因在大脑和其他组织中有很强的性别偏向性,往往偏向于女性[32]。

PLP1具有调节细胞成熟、炎症反应、中枢神经系统髓鞘形成、基因上调等方面的功能,PLP1中的点突变和重复会导致X 连锁的髓鞘障碍疾病,例如Pelizaeus-Merzbacher(PMD)病或2 型痉挛性截瘫,PMD 病是一种罕见的X~连锁脑白质营养不良症,患者的临床特征可能受到PLP1重复序列的影响[23]。该基因特异性表达于少突胶质细胞的髓鞘[33]。有研究表明PLP1基因在胚胎中枢神经系统中表达较早,早于少突胶质细胞的产生,采用遗传学方法显示胚胎表达PLP1的胶质祖细胞生成的出生后星形胶质细胞仅存在于脊髓腹侧,在胚胎神经发育过程中PLP1的表达展现了细胞的动态特性[34]。女性常见的染色体疾病很可能与XY染色体特有的基因单倍体不足有关,例如特纳综合征(Turner syndrome)是具有SRY基因导致的混合型性腺发育不全和外部性别分化的疾病[35]。SRY基因的表达在不同的物种间有差异。在人体内SRY基因在生殖嵴中的一小部分细胞中表达并启动睾丸的形成,人类SRY基因在性腺表达开始于妊娠后期,到成年仍有表达并见于其他组织[36]。与人类相似,在小鼠体内SRY基因仅在生殖嵴的中心区域低表达,但随着性腺的发育,一旦生殖嵴发生性别分化,SRY基因表达量就开始减少。SRY基因在睾丸开始形成之前到结束的瞬时表达验证了SRY基因启动睾丸的发育但却不维持睾丸的发育这一结论[37]。PLP1与SRY的定位与功能对于胚胎的生长及基因疾病有很大的指导意义。对牛早期胚胎进行性别鉴定和选择可以极大提高养牛行业生产效益和经济效益。通过检测性染色体Y 上是否含有SRY基因来确定胚胎的性别是一种精确度高且灵敏的方法,准确率可达90% 以上,应用前景可观[38]。Sherry[39]等人对来自妊娠3~6 周的82 个样品的cfDNA 进行Y 染色体特异性序列SRY的实时荧光定量PCR 成功检测出SRY 阴性为女胎,阳性为男胎。另有研究通过在患有X 连锁隐性疾病的母体中检测母体血浆中无细胞胎儿DNA 的Y染色体序列,在产前确定胎儿性别[40]。通过对植入前胚胎的性别预测来控制性别比,不仅有利于牲畜的管理、生产和育种计划,而且有利于诊断产前阶段的遗传疾病。性别鉴定技术是有价值的生物技术,有可能彻底改变养牛业。随着分子生物学和细胞生物学的发展,性别检测策略将有助于改善临床遗传疾病。哺乳动物性染色体系统是高度保守的,性别决定是一个复杂的过程,受到各种内部和外部因素的影响[41]。进一步探索性别决定机制可以为畜牧业生产提供动力。

4 结 论

本研究通过对牛的性染色体进行生物信息学分析发现X 染色体特有基因高密度区域共15 个,Y 染色体上10 个特有基因高密度区域,并且对XY 染色体上较保守的基因PLP1和SRY进行了精准定位,结合GO 分析为解释性别调控机制及候选基因的研究提供了基础资料。

致谢:感谢所有作者对本研究的贡献,感谢学校提供的平台支持。

猜你喜欢

染色体基因组定位
“植物界大熊猫”完整基因组图谱首次发布
牛参考基因组中发现被忽视基因
科学家找到母爱改变基因组的证据
血清HBV前基因组RNA的研究进展
《导航定位与授时》征稿简则
银行业对外开放再定位
多一条X染色体,寿命会更长
为什么男性要有一条X染色体?
少儿智能定位鞋服成新宠
把握新定位、新要求 推动人大工作创新发展