郏县红牛Y 染色体基因组遗传多样性与父系起源研究
2022-10-12常振华王世康亐开兴夏小婷黄永震雷初朝
常振华,王世康,亐开兴,夏小婷,黄永震,雷初朝*
(1.渭南职业技术学院,陕西渭南 714026;2.西北农林科技大学动物科技学院,陕西杨凌 712100;3.楚雄师范学院,云南楚雄 675000)
郏县红牛是我国优良地方黄牛品种,主要分布于河南省平顶山市郏县、宝丰县和鲁山县,分布区域位于东经112°14'~113°45'、北纬33°08'~34°20',属于暖温带大陆性季风气候。郏县红牛具有体格大、耐粗饲、适应性强、肉质红润细嫩等特点。但目前郏县红牛育种工作中仍存在诸多问题,如良种的保护与开发不足所导致种群数量逐年减少、品种生产水平较低等,需要通过现代育种原理与方法进一步选育提高与开发利用。
动物Y 染色体常被作为研究动物父系遗传进化和亲缘关系的重要工具。种公牛对牛品种选育具有重要作用,因此需要分析其Y 染色体基因组遗传变异(主要是Y 染色体单拷贝区SNP)来研究家牛的起源。家牛Y染色体包括拟常染色体区(Pseudoautosomal Region,PAR)和雄性特异区(Male-Specific Region,MSY)。家牛MSY 区在减数分裂期间不与X 染色体重组。家牛MSY 区包含X-退化区、X-转移区和扩增区。其中X-退化区位于MSY 区的两端,包含2 段单拷贝区域。经过注释,共有12 个单拷贝基因位于X-退化区,分别为。Chen 等对世界家牛的Y 染色体雄性特异区SNP 进行扫描,将家牛父系起源更细致地划分为:Y1、Y2a、Y2b、Y3a 和Y3b。然而,关于郏县红牛品种父系起源的研究,目前只采用Y 染色体雄性特异基因SNP 与微卫星标记方法进行过研究,尚未对郏县红牛进行Y 染色体基因组水平的系统研究。因此,本研究使用郏县红牛MSY 区中X-退化区单拷贝基因进行全基因组扫描,以分析郏县红牛的父系遗传多样性与起源。
1 材料与方法
1.1 数据来源 本研究使用的16 头郏县红牛Y 染色体基因组数据来源于本团队发表的黄牛全基因组文献,但Xia 等发表的论文并未分析郏县红牛Y 染色体基因组的多样性。本研究选取Chen 等研究中使用的5 个Y 染色体基因组单倍型:Y1(SRR1365144,安格斯牛)、Y2a(SRR5507257,哈萨克牛)、Y2b(SRR934415,韩牛)、Y3a(SRR5507285,广丰牛)和Y3b(SRR2016752,吉尔牛)作为对照,对照个体数据从NCBI 下载。
1.2 Y 染色体基因组遗传多样性与父系起源分析 使用GATK3.8 软件的GenotypeGVCFs 模块对16 头郏县红牛和5 头对照组牛Y 染色体基因组数据进行基因分型。使用VCFtools-0.1.16 软件提取集合中牛Y 染色体X-退化区单拷贝基因SNP 做后续分析。用SnpEFF 软件对Y 染色体X-退化区SNP 进行注释,DnaSP v5 软件进行序列比对,计算单倍型多样度Hd 和核苷酸多样度Pi。随后,使用RAxML-master v8.2.12 软件构建系统发育树。参数设置为:-f a -x 123 -p 23 -# 100 -m GTRGAMMA,结果文件通过FigTree v1.4.3 实现可视化。最后使用Network 10.2.0.0 软件构建Y-SNP 单倍型网络图。
2 结果与分析
2.1 郏县红牛Y 染色体SNP 多态性 对16 头郏县红牛和5 头对照组牛Y 染色体X-退化区单拷贝基因位点进行提取,共筛选到1 346 个位点,去掉存在缺失的位点后剩余827 个位点,其中有210 个位点存在多态性,在郏县红牛群体中有178 个Y-SNP 多态位点。转换和颠换比值(Ts/Tv)为1.69,表明转换比例大于颠换比例,符合碱基替换的特征。使用snpEFF 注释这些位点,共包含7 个基因,分别是。郏县红牛的平均变异数(K)为51.14,单倍型多样度(Hd±SD)为0.717±0.095,核苷酸多样度(Pi±SD)为0.061 8±0.019 8。遗传多态性分析结果表明郏县红牛Y 染色体序列遗传多样性丰富。
2.2 群体结构分析 以5 头已知Y 染色体单倍型组的家牛个体作为对照组,对郏县红牛Y 染色体基因组的序列变异进行分析,使用Fig Tree v1.4.3 软件构建郏县红牛的最大似然树(图1)。结果表明郏县红牛中共定义了5 种单倍型(JXR1~5),JXR4 属于主要单倍型,占50%(8/16);最大似然树将郏县红牛Y 染色体基因组序列分为3 个单倍型组:Y1、Y2 和Y3。Y2 被细分为Y2a 和Y2b;Y3 又分为Y3a 和Y3b。郏县红牛中81.25%(13/16)属于Y2 单倍型组,还有18.75%(3/16)的郏县红牛属于Y3 单倍型组。参考个体均位于对应支系中,说明构树结果正确。
图1 郏县红牛Y 染色体进化树
2.3 构建单倍型网络图 为进一步分析单倍型之间的系统发育关系,本研究利用Network 5.0 软件构建郏县红牛的Network 网络图(图2)。单倍型分析共鉴定10个单倍型,其中郏县红牛有5 个单倍型,各单倍型分布与构建的最大似然树相符,单倍型信息见表1。结果显示,所研究的郏县红牛群体可分为普通牛(Y2a 和Y2b)单倍型组和瘤牛(Y3a)单倍型组。其中Y2b 为主要亚单倍型组,占75%(12/16),其次是Y3a,占18.75%(3/16),Y2a 最低,占6.25%(1/16),没有Y1 和Y3b 单倍型组。
图2 郏县红牛Y 染色体单倍型网络图
表1 郏县红牛单倍型信息表
3 讨 论
Y 染色体的MSY 区域已经广泛应用于遗传多样性与父系起源的研究。从Y-SNPs到Y-STR再到二者的合用,对于MSY 区域的研究手段也层出不穷。先前的研究仅将郏县红牛划分为Y2 和Y3 2 个单倍型组。本研究利用全基因组重测序数据,对郏县红牛Y 染色体MSY 的X-退化区Y-SNPs 进行扫描、聚类分析,结果显示郏县红牛品种中Y2b 亚单倍型组占绝对优势,这与Chen 等的结论基本一致,但与之不同的是,Chen 等的研究结果中5 头郏县红牛仅存在Y2b 和Y3a 亚单倍型组,而未在郏县红牛中检测到Y2a 亚单倍型组,可能是其用到的样本量太少所致。本研究首次在郏县红牛品种中发现Y2a 亚单倍型组,表明郏县红牛作为中国中原地区黄牛,同时受到北方普通牛和南方瘤牛的影响。该结论与之前有关郏县红牛Y 染色体形态与线粒体D-loop 区核苷酸变异的结果一致。
单倍型多样性描述了从群体中随机选取的两条序列间存在核苷酸差异的概率,使用不同的标记计算所得单倍型多样度会有所不同。以郏县红牛为例,Li 等使用基因序列标记位点计算所得单倍型多样度明显小于使用4 个Y-SNPs 和2 个Y-STRs 计算的单倍型多样度。本研究中郏县红牛的Y 染色体单倍型多样度(H±SD)为0.717±0.095,略高于Li 等所发现的郏县红牛Y 染色体单倍型多样度(0.623±0.073),其原因是本研究所使用的Y-SNP 位点数增多从而提高了其单倍型多样度。与此同时,该结果也大于中国地方黄牛的平均单倍型多样度(0.607±0.016),说明郏县红牛具有丰富的遗传资源。
中国黄牛主要有Y2a、Y2b 和Y3a 3 个父系起源,少量的Y1 单倍型组可能是最近欧洲肉牛品种杂交的结果。在郏县红牛中未检测到Y1 单倍型,说明采集的样本较纯,未受到杂交影响。近年来,受到外来引入品种和存栏量下降的影响,许多地方品种到达濒危的边缘,郏县红牛也不例外。在引入外来品种的同时,需要采取措施保护郏县红牛等地方黄牛品种资源,避免造成种质不纯等问题。
4 结 论
本研究以Y 染色体X-退化区单拷贝基因为目标研究郏县红牛的父系遗传背景,将郏县红牛的父系起源进一步明确和细化。在郏县红牛品种中共检测到Y2a、Y2b 和Y3a 3 种亚单倍型组,并以Y2b 亚单倍型组为主;16 个郏县红牛共分为5 个单倍型(JXR1-5),JXR1 属于Y2a;JXR2、JXR3 和JXR4 均属于Y2b;JXR5 属于Y3a 亚单倍型组。郏县红牛为北方普通牛和南方瘤牛父系基因交流的产物,具有较为复杂的父系起源、较高的单倍型多样性与核苷酸多样性。