西藏小型猪多组织组蛋白修饰谱研究
2019-06-05于欣鑫顾为望
陈 娜,刘 闻,秦 锐,于欣鑫,顾为望,高 飞*
(1. 中国农业科学院深圳农业基因组研究所,广东 深圳 518116; 2. 南方医科大学实验动物中心,广州 510515; 3. 东莞松山湖明珠实验动物科技有限公司,广东 东莞 523808)
与啮齿类小型实验动物相比,猪在解剖生理学、血液生化值、疾病发生和器官发育等方面具有与人类更加相似的特点,且无灵长类实验动物可能存在的伦理问题,因此成为人体生长发育和疾病发生等研究的优良实验模型。小型猪与人体重相似,具有体型小便于实验操作、饲养成本低的优点,在生物医药领域有着更加广阔的应用前景[1]。特别小型猪在疾病动物模型制作、新药安全性评价、异种器官移植等领域应用更广,已成为生物医学研究中重要的实验动物[2]。
基因组(genome)是分子生物学研究的基础,基因组学(genomics)的研究对生物医学模型的持续开发具有重要意义。2012年,猪基因组测序协会发布第一个完整测序的家猪基因组,其大小约为2.6 G[3]。比较基因组学研究结果显示家猪基因组与人类基因组在序列和染色体结构上具有极高的同源性,其基因集注释已经比较完整,最新的参考基因注释集包括30173个基因[4]。另外一方面,对基因组的染色质结构、表观遗传修饰、转录因子结合等等功能注释与序列注释具有同等的重要性,这些注释可以将基因组序列与物种外在的生物学特性有效的对应起来。表观遗传学(epigenetics)包括DNA甲基化、组蛋白修饰、染色质重塑及非编码RNA调控等研究内容。表观遗传信息的变化对包括人在内的哺乳动物基因组有广泛而重要的调控效应,如转录抑制、基因组印记、细胞凋亡、染色体灭活等[5]。目前,针对人类基因组的功能注释已经广泛开展并获得了重要成果。1998年,欧盟启动了人类“表观基因组学计划”和“基因组的表观遗传可塑性”研究计划,旨在解析人类DNA甲基化模式,并阐明其建立和维持的机制。而美国则发起并主导了人类及小鼠基因组大百科全书计划(ENCODE和mENCODE),提供最为全面的基因组功能注释[6-7]。针对其他哺乳动物基因组的注释还相对缺少,较为知名的有FANNG项目,旨在构建饲养动物的基因组功能元件注释图谱,但目前获得的数据和成果有限[8]。
目前一些主要物种的基因组功能注释信息定期更新,如人、小鼠、斑马鱼等,而猪的基因组功能注释相对滞后,且不同类型的猪基因组有所差别。西藏小型猪目前尚缺乏完善的表观基因组注释数据,限制其作为生物医学模型的广泛应用。本研究采用染色质免疫共沉淀(chromatin immunoprecipitation,ChIP)结合高通量测序技术,完成了西藏小型猪四种组织的组蛋白修饰谱,并进行了深入的基因组表观遗传修饰谱鉴定及不同组织间的比较分析。本研究的数据结果将为西藏小型猪作为生物医学模型的应用奠定基础。
1 材料和方法
1.1 实验动物
普通级西藏小型猪2头(3月龄,雄性,非同胎),体重(3.0 ±0.3) kg,于东莞松山湖明珠实验动物科技有限公司购买并进行组织取样[SCXK(粤)2017-0030][SYXK(粤)2017-0123]。饲养和实验过程中遵循了实验动物使用的3R原则。本研究经东莞松山湖明珠实验动物科技有限公司实验动物管理和使用委员会批准实施[IACUC决议编号S-20170611-01]。
1.2 主要试剂与仪器
组蛋白修饰抗体购自艾博抗(Abcam)上海贸易有限公司。微量移液器和离心管购自艾本德(Eppendorf)中国有限公司;PCR扩增仪购自德国耶拿分析仪器股份公司(型号:Analytikjena Easycycler);高通量测序平台为Illumina Hiseq X Ten(PE150)。
1.3 实验方法
1.3.1 组织取样
实验动物安乐死前采集静脉血液(≥60 mL)于肝素钠抗凝管中制备血液样品;安乐死后分离出肝器官、回肠肠段、背最长肌等(≥20 g),分别分离成小块组织(≥1 g)于冻存管中,液氮速冻后置于干冰箱内冷冻保存。
1.3.2 染色质免疫共沉淀实验
用上述组织样品进行染色质免疫共沉淀实验,选择6种组蛋白修饰抗体:H3K4me3、H3K9me3、H3K9ac、H3K27me3、H3K27ac、H3K36me3,经甲醛固定、细胞核提取、染色质破碎、免疫沉淀、解交联等步骤,收集特异性捕获的DNA片段。将DNA片段超声打断为150~200 bp片段后补齐末端、加测序接头并进行PCR扩增,构建文库用于上机测序。
1.3.3 ChIP-Seq及其数据处理
文库质量检测合格后,经Illumina高通量测序平台测序,下机后的原始数据使用软件Trimmomatic(Version 0.30)进行过滤,得到的clean reads数据使用BWA软件比对到家猪参考基因组(Sscrofa11.1)上,使用MACS(Version 1.4.2)软件统计reads在基因组的富集情况,并结合家猪基因组注释信息,统计reads富集区间在基因组各区域的分布情况。
2 结果
2.1 数据产出及质控
利用Illumina测序平台对西藏小型猪四个组织的ChIP样本进行双端测序,经统计,原始数据过滤后每个样品的Q30均大于95%,GC含量分布曲线接近正态分布,说明碱基质量稳定、序列组成均一,能保证后续分析的正常进行。
2.2 西藏小型猪组蛋白修饰的整体特征
基因启动子区含有转录必需的关键调控元件,在功能基因的表达与调控方面起着重要作用。为了从全基因组水平上展示四种不同组织各种组蛋白修饰类型的特征,我们选取了基因启动子区域并统计在这一区域内的组蛋白修饰值。定义每个基因的转录起始位点(transcription start site, TSS)上、下游各2000 bp为启动子区域,并将其平均分为400个bin,每个bin的长度为10 bp。组蛋白修饰标准化值的计算参考基因表达量RPKM的计算,具体公式如下:
式中ni为落在此区域内的reads数,n为测序深度,li为区域长度,每个bin的组蛋白修饰水平为全部基因在此区域内组蛋白修饰值的平均值。根据计算结果绘制了TSS附近区域组蛋白修饰的分布图(图1),横坐标为距离TSS的位置,纵坐标为标准化后的组蛋白修饰值。
从图中可以看出,不同组蛋白修饰在基因启动子区域中分布的位置不同,各组蛋白修饰的分布规律大致可以分为两类,第一类如H3K4me3(图1 A),H3K9ac(图1B)和H3K27ac(图1D),组蛋白修饰信号富集于TSS两侧,并在距离TSS较近的下游位置出现一个宽度较窄的明显的峰值;另一类如H3K9me3(图1C),H3K27me3(图1E)和H3K36me3(图1F),组蛋白修饰值较低且在整个启动子区域内分布较为平均,在TSS位点处出现明显的下降,在-1500 bp处有一个不明显的小峰,整体呈现出中间低两边高的宽峰形状。这与文献中报导的人类及其他哺乳类动物基因组的组蛋白修饰特征相似[9]。组蛋白修饰峰值分布位置的不同显示了其具有的不同基因转录调控功能和特征。
注:A:组蛋白修饰H3K4me3在TSS附近的分布;B:组蛋白修饰H3K9ac在TSS附近的分布;C:组蛋白修饰H3K9me3在TSS附近的分布;D:组蛋白修饰H3K27ac在TSS附近的分布;E:组蛋白修饰H3K27me3在TSS附近的分布;F:组蛋白修饰H3K36me3在TSS附近的分布。图1 TSS附近组蛋白修饰的分布Note. A, Histone modification H3K4me3 near transcription start sites. B, Histone modification H3K9ac near transcription start sites. C, Histone modification H3K9me3 near transcription start sites. D, Histone modification H3K27ac near transcription start sites. E, Histone modification H3K27me3 near transcription start sites. F, Histone modification H3K36me3 near transcription start sites.Figure 1 Histone modifications near the transcription start sites
2.3 西藏小型猪组织间组蛋白修饰分布特征
为了进一步探讨组蛋白修饰的结合位点特征及组织特异性,理解组蛋白修饰对基因调控的机制,我们结合了物种的基因组注释信息,对组蛋白修饰富集区间在整个基因组范围内的分布特征进行了分析。首先利用MACS软件进行组蛋白修饰的富集区间分析,得到每种组蛋白在基因组不同位置、不同数量的富集区间,然后将富集区间的信息与基因组注释信息结合,得到富集区间在基因组六个功能区域内的分布情况。如图2所示,横坐标表示不同的组蛋白修饰类型,纵坐标表示富集区间在各个区域内所占的百分比。可以看到四种组织中组蛋白修饰分布有一定的相似性,所有类型的修饰在基因间区(intergenic region)和内含子(intron)区的分布比例均高于其他功能区,特别是H3K9me3;而同一组蛋白位点的乙酰化修饰H3K9ac在不同组织中的分布模式差异很大,具有组织特异性,在血液和肌肉组织中基因间区所占比例较大,而在肝和回肠组织中各功能区分布比例较为平均;H3K4me3在各组织的分布模式相似,且启动子区所占的比例高于其他修饰类型。组蛋白修饰在各组织间的不同,造成特异性基因的表达发生改变,影响了细胞分化、组织形成等过程。
图2 全基因组六个功能区域的组蛋白修饰分布Figure 2 Distribution of histone modifications in six functional regions of the genome
2.4 组织间差异修饰基因的功能富集分析
为探究组蛋白的不同修饰对组织差异性的影响,我们对在4种组织间启动子区组蛋白修饰有显著差异的基因进行了统计。图3显示了各类组蛋白修饰对应的差异基因的重叠情况,可以看出各类修饰实际影响的基因存在差异,对于每种修饰约有半数差异基因与其他修饰没有交叉,为此种修饰类型特有,如H3K9ac。接着我们将差异基因名称输入到DAVID数据库(https://david.ncifcrf.gov/tools.jsp)中进行了GO(gene ontology)功能分析,结果显示,尽管组织特异性组蛋白修饰所覆盖的功能通路比较广泛,但几乎都参与了RNA聚合酶II启动子的转录调控。转录的正、负调控及转录抑制、转录激活的差异导致了不同组织之间多种基因的表达差异。
图3 组蛋白差异修饰基因的重叠Figure 3 Overlapping of the differential histone modification genes
3 讨论
西藏小型猪原产于我国藏区高原,是体型较小的实验用猪种之一,2004年由南方医科大学实验动物中心将其从西藏林芝地区引进广东省,并完成了风土驯化及实验动物化培育。免疫学、遗传学和病原组织学等方面的研究表明,西藏小型猪具有独特的免疫指标和种质资源特性,其血液生理生化指标与普通猪差异较大,与人类水平接近,是一种优良的人类疾病实验动物模型[10]。包括组蛋白修饰在内的生物表观遗传学修饰能够激活或抑制基因转录,调节基因表达,已成为遗传学研究的一个重要分支,与DNA序列水平上的变化同样重要,特定位点的组蛋白修饰已经成为肿瘤检查标志物[11]。目前对西藏小型猪开展的研究主要围绕相关动物模型、药物实验及转基因克隆猪等方面,但是对其基因组功能及表观组注释的研究还是空白。本研究从全基因组水平初步解析了西藏小型猪组蛋白修饰的特征,各种组蛋白修饰在启动子区的分布模式有所差别,这与此前在的报道结果一致[12-13]。此前对于组蛋白各位点修饰的功能研究表明,转录起始位点的H3K4me3、H3K9ac和H3K27ac修饰有利于激活基因转录,活性转录基因的gene body区富集H3K36me3,而基因的转录抑制与H3K9me3和H3K27me3有关[14-15]。对其基因组的注释解析将有利于西藏小型猪在转基因克隆发育等方面的研究和应用。
组蛋白修饰通过改变染色质结构,影响转录因子与靶基因各种顺式作用元件之间的亲和性,发挥调控基因转录调控的作用,正确识别它们的富集部位对理解发育和细胞功能至关重要。启动子是关键的基因功能元件之一,启动子区域范围广泛,包含核心启动子区域和调控区域。核心启动子区域通常位于转录起始点上游2000 bp以内,负责基因基础水平的转录,调控区域能够对不同环境因素或信号传导作出应答,调节相应的基因表达[16]。本研究选取了转录起始位点上下游各2000 bp的区域作为启动子区域,统计此区域内组蛋白修饰密度并进行标准化,结果表明组蛋白修饰在启动子区的富集模式主要有宽峰和窄峰两种,宽峰覆盖整个启动子区且无明显峰值,窄峰在转录起始位点附近有明显的富集高峰。组蛋白修饰信号的富集模式的不同,,决定了其转录调控功能的差异。这几种组蛋白修饰类型的具体作用方式,后续可结合基因表达数据展开深入探究。
此外,本研究发现有大量的组蛋白修饰富集区间落在了基因间区和内含子区,意味着同人类和小鼠基因组一样,小型猪基因组存在着大量未鉴定的转录本和新基因。因此,本研究的数据结果将为后续西藏小型猪的基于基因发掘、转录调控的生物医学模型研究奠定重要基础。