高通量互作蛋白组图谱研究揭示U6 snRNA在肿瘤细胞中多维度调控mRNA加工成熟过程
2022-03-16杨芝芝杨兵田彬廖建友
杨芝芝,杨兵,田彬,廖建友
非编码RNA(non⁃coding RNA,ncRNA)是指不编码蛋白质的RNA,其中包括核糖体RNA(ribo⁃somal RNA,rRNA)、转运RNA(tRNA)、核小RNA(small nuclear RNA,snRNA)、核仁小 RNA(small nucleolar RNA,snoRNA)、小干扰RNA(microRNA)、长链非编码RNA(long noncoding RNA)等[1-3],这些RNA 的共同特点都是能在RNA 水平上行使各自的生物学功能。snRNA共有6种,由于含U丰富,故编号为U1~U7。snRNA只存在于细胞核中,其中U3存在于核仁中,其他6 种存在于核质中。snRNA 具有修饰的碱基,并在5'末端有一个三甲基鸟苷酸(TMG)的类似“帽”结构,3'末端有自身抗体识别的Sm 抗原结合的保守序列[4],其特点是稳定且含量丰富,如U1 分子在每个核中的含量可有106个。snRNA 序列高度保守,如人和爪蟾的U1 snRNA 有90%的序列相同[5]。snRNA 不参与蛋白质合成活动,其重要功能是构成RNA 剪接体(spliceosome)的主要成分,在mRNA 前体剪接和加工方面起着重要作用,也参与其他各种RNA 前体的转录后加工过程[6],同时也对维持rRNA 构象,起着辅助的作用。U3 snRNA 与核仁内 28S rRNA 的成熟有关[7],而U1 则是在核浆中与前体mRNA 的剪接加工有关[8],U7 参与组蛋白 mRNA 3'⁃末端的形成[9]。
U6 snRNA(以下简称U6)是pre⁃mRNA 剪接体催化核心的重要组成部分,是细胞生长的一个重要调控因子[10]。研究显示U6 的紊乱与包括肿瘤在内的多种疾病发生发展密切相关,如Lou 等发现U6 在各种肿瘤中广泛异常表达[11]。Tao 等[12]发现U6 相关sm 样蛋白LSm3、小核糖核蛋白D2 多肽(SNRPD2)、核糖体蛋白S3a(RPS3A)、S100 钙结合蛋白A8(S100A8)等既是轻度认知功能障碍(MCI)的主要致病基因,也是桥接基因。不仅是U6 与肿瘤等疾病相关,其相互作用蛋白也与肿瘤等密切相关,比如U6 的相互作用蛋白LSM1 在87%的胰腺癌病人[13]、40%的前列腺癌[14]、20%的乳腺癌中显著异常高表达[15]。研究显示LSM1 只要在肿瘤细胞中有轻微的改变都能引起肿瘤细胞生长的显著变化[15]。这说明U6 调控网络的异常对肿瘤的发生发展调控是至关重要的。尽管如此,关于U6参与肿瘤调控方面的研究还较少,对U6 如何调控肿瘤发生发展的分子机制知道得还很少,其中一个主要原因是受限于对其分子功能的全面认识。目前还不清楚U6 的功能是否仅限于参与形成剪接复合体进行对pre⁃mRNA 的剪接和加工。探索U6 新的生物学功能和调控机制有助于帮助理解肿瘤发生发展的分子机制。
ncRNA 一般通过其结合的RNA 结合蛋白(RBP)去发挥生物学功能[16],如一种核仁特异性lncRNA(LoNA),它的5'部分能够结合核仁蛋白NCL以抑制 rRNA 转录[17],以 snoRNA 为末端的长非编码RNA(lncRNA)SLERT 能够结合和改变DDX21分子构像,消除DDX21 对Pol I 转录的抑制,促进蛋白翻译[18];rRNA 则通过与核糖体相关蛋白共同组成核糖体来行使翻译功能,而miRNA则通过与AGO蛋白的结合来抑制mRNA 翻译或者促进mRNA 降解来调控基因表达[19]。因此要了解非编码RNA 的功能,确定其在体内所结合的蛋白至关重要。研究显示非编码RNA 在体内所结合蛋白的种类和复杂性远远超出人们的预期,目前已知的剪接体相关基因总共才143 个,但利用ChIRP⁃MS(Chromatin isolation by RNA purification and masss pectrmetry)技术鉴定出来的与U1 结合的蛋白有418 个,与U2结合的蛋白有370 个,这提示U1 和U2 snRNA 参与了大量与RNA剪接不相关的细胞过程[20]。
在本研究中,为了系统认识U6 的生物学功能和调控机制,我们采用RNA 相互作用蛋白组技术ChIRP 来纯化肿瘤细胞中U6 snRNA 所结合的所有RBP,然后结合高灵敏度质谱分析技术(LC⁃MS)去定性识别这些蛋白,从而建立U6 在肿瘤细胞中的相互作用蛋白组图谱,系统解析U6 所参与的调控通路和生物学功能。本研究将能帮助理解U6 参与肿瘤调控的机制,为肿瘤的诊断和治疗提供新的理论基础。
1 材料与方法
1.1 CHIRP 实验
1.1.1 探针设计 在NCBI 上查询人源的U6 基因序列(表1)。在https://www.biosearchtech.com/chirp⁃designer/上设置合适的参数获得探针,并在广州锐博生物订购两条带有3'末端BiotinTEG 修饰的反向探针。
1.1.2 细胞交联 使用胰酶消化293T 细胞,PBS清洗两遍,计数,收集2×108个细胞;加入3%甲醛溶液(Sigma,用PBS 配置,10 mL/107 个细胞)重悬细胞。混匀后室温孵育30 min。加入甘氨酸(gly⁃cine)使终浓度为0.125 M,混匀后室温孵育5 min终止交联。4℃离心弃上清。预冷PBS 洗一次,离心弃上清。
1.1.3 裂解细胞 称取1.5 mL 蛋白低吸附管重量以推算细胞团重量。加入10 倍体积的含有蛋白酶抑制剂和RNA 酶抑制剂的Lysis Buffer(0.05 M Tris⁃HCl pH:7.0,0.1 mM EDTA,1% SDS),重悬混匀。以30 s on,45 s off 的参数来超声细胞悬液。待细胞裂解液澄清后,吸5 μL 消化掉蛋白后跑琼脂糖胶,检测超声效果。直至DNA 大小在100~500 bp,超声完成。
1.1.4 探针杂交 将超声样品离心取上清。取1/100作为 Input 对照。取 10 μL C⁃1 beads(invitrogen)用100 μL Lysis Buffer 洗三次。将细胞裂解液转移到15 mL 管中,按照每mL Lysis Buffer 加入2 mL Hybridization Buffer(750 mM NaCl,1% SDS,0.05 M Tris⁃HCl pH:7.0,1 mM EDTA pH8.0,15%甲酰胺)加入杂交液。加入10 μL C⁃1 beads,在杂交炉中37 ℃旋转孵育30 min。去除珠子,取蛋白上清每毫升体积加入1 μL 100 μM 探针杂交过夜。取100 μL C⁃1 beads,等体积的 Lysis Buffer 来将磁珠悬浮加到蛋白上清中,37 ℃旋转孵育30 min。用Wash Buffer(2× SSC,0.5% SDS)洗 5 次磁珠。最后加入磁珠等体积的Wash Buffer,取10 μL 磁珠用于提取RNA。剩下所有磁珠用于获取蛋白。
1.1.5 蛋白获取 弃上清留磁珠,加入等体积的 Biotin elution Buffer(12.5 mM D⁃Biotin、7.5 mM HEPES pH:7.5、75 mM NaCl、1 mM EDTA pH:8.0,0.15% SDS、0.075% sarkosyl、0.02% Na⁃Deoxycho⁃late、6.4 mM NaOH),涡旋后室温静置20 min,65 度干浴1 h,收集上清。再次加入与磁珠等体积的Biotin elution Buffer,重复操作获得上清,合并两次上清。加入4 倍体积预冷丙酮,⁃20 度沉淀过夜。
1.2 MS 样品前处理
4 度离心弃上清,分别加入70%乙醇和冷丙酮各洗一次。加入 UA buffer(8 M Urea,100 mM Tris⁃HCl)回溶蛋白,室温震荡2 h 溶解;加入二硫苏糖醇DTT 对蛋白进行还原(30 度,1 h);加入碘乙酰胺IAA 进行烷基化(室温,45 min),然后加入质谱级的trypsin 37 度酶解过夜。加入10% TFA 终止酶解,悬干后进行脱盐处理,然后上机检测所富集到的蛋白。
1.3 RT⁃QPCR
在 10 μL RNA Input 和 10 μL 磁珠中分别加入85 μL RNA PK Buffer pH:7.0(100 mM NaCl、10 mM Tris⁃HCl pH:8.0、1 mM EDTA pH:8.0、0.5%SDS)和5 μL Proteinease K,在水浴锅中 45 度孵育45 min。加入DEPC 水补齐体积200 μL,再分别加入200 μL氯仿和 200 μL 水饱和酚,涡旋后 13 000 r/min,4 ℃离心10 min。取上清加入25 μL 3M NaAc,0.5 μL糖原(Glycogen Blue),3 倍体积无水乙醇,-80 ℃沉淀过夜。13 000 r/min,4℃离心20 min,弃上清,95%乙醇洗一次,风干后用少量DEPC 水回溶。对于RT⁃qPCR,使用带 RT Primer Mix 的 PrimeScript RT Enzyme Mix I(TAKARA)和 5× PrimeScript Buffer 2进行cDNA 合成。采用TB Green Premix Ex TaqⅡ(TAKARA)和CFX96TM 实时系统(BIO⁃RAD)进行QPCR。qPCR检测目标RNA U6和GAPDH的丰度。
1.4 RIP⁃QPCR
293T 细胞在冷 PBS 中紫外照射(254 nm,1500 kJ),交联后收集细胞,离心后去除上清,加入含有蛋白酶抑制剂和RNA 酶抑制剂的RIPA 缓冲液(50 mM Tris⁃HCl pH:7.4、150 mM NaCl、1 mM EDTA、0.1% SDS、1% NP40、0.5%脱氧胆酸钠、0.5 mM DTT)重悬细胞,在冰上孵育30 min,然后用Bioruptor Plus(Diagenode)对裂解液进行超声处理。超声处理后,用DynabeadsTMprotein G(invitrogen)在4 ℃下预洗裂解液1 h,然后用相应抗体在4 ℃下与裂解液旋转孵育4 h,加入等量同源Normal IgG作为空白对照,然后加入protein G 4 ℃孵育过夜。使用RIPA 缓冲液洗涤2 次磁珠,1 M RIPA 缓冲液(7 mL RIPA 缓冲液+ 3 mL 3 M NaCl)洗涤 4 次。用 RIPA缓冲液回溶磁珠,蛋白酶 K 消化(45 min,45 ℃)后,用苯酚和氯仿分离RNA,然后与gDNA Eraser(TAKARA)孵育,进行cDNA合成和qPCR。
1.5 GO 和 pathway 富集分析
为了有效提取蛋白组可能参与的生物学过程和可能的分子机制信息,我们试图采用GO(gene ontology)分析对蛋白组进行注释。GO 是一个提供基因及其产物功能注释信息的数据库,分为分子功能(molecular function)、生物学过程(biological process)和细胞组成(cellular component)三方面。而 KEGG(Kyoto Encyclopedia of Genes and Genomes)是一个综合数据库,包含基因、通路、疾病和药物等信息,能够准确预测基因及其产物可能参与的信号通路。联合这两种分析方法对鉴定到的U6互作蛋白组进行综合注释,预测这些蛋白可能参与的分子功能、生物过程、细胞组成和信号通路,从而挖掘U6 可能的新的生物学功能和分子调控机制。
1.6 蛋白复合体富集分析与PPI 网络构建
为了更好地了解U6 可能参与的生物学过程和分子调控机制,我们利用ConsensusPathDB 这个数据库,它整合了超过30 个分子互作相关数据库,包括蛋白与蛋白互作、生化反应、基因调控互作以及4601条通路信息。利用ConsensusPathDB分析获得U6 互作蛋白组的蛋白复合体富集信息,同时使用STRING 数据库(Search Tool for the Retrival of Interating Genes/Proteins Database),帮助有效搜寻蛋白质之间互作关系信息,包括蛋白质之间的直接物理互作,和间接功能相关性。借助Cyto⁃scape 软件,一款将蛋白质互作网络可视化并能够进行编辑和分析的软件,将STRING 数据库查询的蛋白互作信息可视化并构建蛋白与蛋白互作网络(protein⁃protein interaction network,PPI)。
2 结果与分析
2.1 肿瘤细胞内源U6 snRNP 复合体的高效捕获
CHIRP⁃MS 技术是近年来逐渐发展起来的用于系统检测内源RNA 互作蛋白组的技术。首先,它利用3%甲醛室温对活的Hela 细胞进行交联,使原本有互作的蛋白和RNA 紧密结合在一起,然后再利用CHIRP⁃designer 这个网站设计U6 探针和NC 空白对照探针,探针序列见表1。利用ChIRP⁃designer 找到了两条U6 的探针(表1),将这两条探针都进行了合成。利用所合成的带生物素修饰的U6 特异的探针与U6 snRNP 复合体进行杂交,再利用链霉亲和素磁珠将蛋白和RNA 复合体进行捕获。为了确认两条U6 特异探针的捕获效果,首先取了部分蛋白和RNA复合体,使用蛋白酶K对其进行消化。然后去除其中的蛋白并提取RNA。通过逆转录结合qPCR 检测两条U6 snRNA 探针所捕获到的U6 的量,发现U6⁃1 探针具有很好的富集效果,其能够富集到65.4%的内源U6 snRNA(图2A),而U6⁃2 探针只富集到了9.3%的内源U6,而NC 探针只富集到了0.09%的内源U6,这说明U6⁃1 探针拥有极高的特异性和效率。因此后续研究使用U6⁃1 探针所捕获的U6 snRNP 复合体进行液质联用质谱进行检测。
表1 本研究中的序列
2.2 U6 snRNA 肿瘤细胞互作蛋白组图谱建立
通过高效液相色谱⁃质谱联用技术(LC⁃MS)定性识别所富集到的U6 snRNP(图1A),获得了超过300 个U6 结合蛋白。进一步剔除了角蛋白、低丰度蛋白以及NC 空白对照组富集到的蛋白,最后获得了135 个高可靠的U6 结合蛋白(图1B)。表2 显示了丰度排名最高的前20 的U6 结合蛋白。
图1 (A)ChIRP⁃MS 技术流程(B)生信分析手段
表2 U6肿瘤细胞互作蛋白组中质谱信号排名前20的蛋白
为了进一步说明使用CHIRP⁃MS 实验技术获得的U6 互作蛋白组的可信度,选择其中1 个蛋白核磷素NCL 进行反向验证,采用RIP⁃qPCR 实验技术验证NCL 是否内源结合U6。首先采用紫外交联的方式使目的蛋白和互作RNA 紧密结合在一起,然后使用蛋白对应的抗体NCL(abcam,ab136649)进行免疫共沉淀,获得RNA 和蛋白复合物。通过western blot 发现NCL 抗体能够有效富集NCL 蛋白,而IgG 阴性对照则不能富集NCL 蛋白(图2B),提示抗体能高效结合NCL 蛋白。然后使用蛋白酶K 消化掉其中的蛋白质并提取RNA,对RNA 进行逆转录和qPCR,提示核磷蛋白NCL 在体内能结合U6(图2B)。该结果说明了使用CHIRP⁃MS 技术富集到的U6 互作蛋白组是可靠的。
图2 U6 互作蛋白组图谱建立(A)U6 探针富集效率检测;(B)RIP⁃qPCR 验证NCL 蛋白结合U6
2.3 GO 和KEGG 分析显示U6 多维度参与肿瘤细胞的mRNA 加工成熟调控
传统上认为U6 主要参与mRNA 内含子剪接。为了研究U6 所参与的生物学过程,我们将获得的U6 互作蛋白组利用ConsensusPathDB 进行GO分析(图3A)。GO 细胞组分(CC)分析显示U6 富集到的蛋白主要参与组成剪接体复合物,核小核糖核蛋白复合物,核糖核蛋白体以及Lsm2⁃8 复合物,该复合物是由7 个Lsm 蛋白(Lsm2⁃8)组成的杂七聚体影响核内小而稳定的RNA(包括tRNAs、RNAs)和 pre⁃mRNA 的加工,是 U6 的一部分。这些复合物主要参与mRNA 前体剪接和加工成熟的生物学过程,这与我们已有的对U6 的功能认识一致,进一步证明了我们所获得的U6 互作蛋白组是可靠的。此外CC 结果还显示U6 snRNP 中有大量蛋白属于细胞核蛋白(nuclear part),猜测U6 可能在细胞核内参与基因表达或加工成熟的调控过程。CC 分析结果还显示U6 snRNP 参与细胞器内腔与细胞内外囊泡组成,提示U6 可能参与囊泡运输这一生物学过程。GO 的生物过程(BP)分析结果除了提示U6 参与mRNA 前体剪接之外,还显示可能参与有机化合物代谢过程,以及参与了RNA定位过程,这一过程与CC 分析中可能参与细胞内外囊泡运输过程联系起来,可以推测U6 可能以囊泡的形式参与RNA的运输,从而参与RNA定位过程。再看 GO 分子功能(MF)分析则显示 U6 snRNP 不仅和核酸结合,也和ATP,蛋白,酶等结合,提示U6 功能的多样性。利用 ConsensusPathDB 对 U6 互作蛋白组进行KEGG 分析显示,除了显著富集到mRNA 前体剪接和加工通路外,还富集到RNA 聚合酶Ⅱ的转录终止、来自内含子转录本的成熟mRNA 的运输和成熟转录本转运到胞质的过程。综合 GO 和 KEGG 分析的结果,U6 参与了 mRNA 转录、加工、运输和mRNA 原料的生物合成等多个过程的调控,这大大拓宽了我们对U6 只参与mRNA前体剪接调控这单一功能的认识,提示U6 异常相关疾病细胞中mRNA 加工成熟过程可能受到了比原先预想的更为深远的影响。
图3 肿瘤细胞U6 snRNA 互作蛋白组的GO 分析
2.4 复合体富集分析和PPI 网络构建揭示U6 snRNA 功能的多样性
对U6 互作蛋白组进行蛋白复合体富集分析(图4A)分析显示U6 互作蛋白组主要富集了与mRNA 剪接相关的复合体,如Spliceosome、C com⁃plex spliceosome、hnRNP complex、U4:U5:U6 tri⁃snRNP complex、CDC5L complex、CBC complex、SNW1 complex、ATAC A/B complex、Large Dorsha complex、PGC⁃1⁃SRp40⁃SRp75 complex、post exon ligation complex 等。此外,同时也富集了一些剪接功能外的复合物,如 TLE1 corepressor complex(MASH1 promoter⁃corepressor complex)、Lsm1 ⁃7 complex、DGCR8 multiprotein complex 等,这些与转录调控、序列特异性 DNA 结合、mRNA 降解和 microRNA 加工成熟等生物学功能相关,这些结果表明U6 sn⁃RNA 可能不仅仅参与mRNA 前体的剪接,还可能参与mRNA 转录调控、降解、运输和转录后调控等一些生物学过程。这些过程在病理状态下受到异常调控可能与U6 snRNA 功能紊乱相关。
进一步利用STRING 数据库对U6 互作蛋白组进行PPI 蛋白互作网络分析显示U6 互作蛋白之间存在复杂的相互联系(图4B)。其构成的PPI 网络主体主要有SRSF 蛋白家族、PRPF 蛋白家族、HNRNP 家族、ATP 家族和 DDX5 蛋白等。这些蛋白在细胞中都发挥着重要的生物学功能,这些功能主要包括mRNA 前体剪接和加工、成熟mRNA的出核运输、mRNA 降解、核糖体构成、RNA 定位以及化合物代谢和嘌呤代谢等。这些功能揭示了U6 肿瘤细胞生物学功能的多样性。为进一步展开对U6 snRNA 的生物学功能和分子机制探索以及U6 在肿瘤中扮演什么样的角色提供了方向。
3 讨 论
RNA 与蛋白之间的互作模式解析是它们功能的关键。RNA 蛋白互作模式的改变也是肿瘤发生发展的一个推动因素。研究RNA 与蛋白互作的方法很多,确定与某个蛋白互作的RNA,常采用高通量测序的方法,比如 eCLIP⁃seq[22],RIP⁃seq[23],ChIP⁃seq[24]等。而确定与某个 RNA 互作的蛋白组,相对来说有效的研究方法较为缺乏,前期主要是外源 RNA pull⁃down[25],但 RNA pull⁃down 存在稳定性和特异性较差、通量低等缺点,很难用来确定某个RNA 的相互作用蛋白组图谱。相比之下,近年来出现的 ChIRP⁃MS[21]是一种较为有效的 RNA 相互作用蛋白图谱解析方法,该方法是联合了基于探针的高效获取RNA 与蛋白复合体捕获方法和LC⁃MS,能高效识别RNA 的互作蛋白组图谱,帮助我们对RNA 的功能和机制有了更加全面和深入的认识。在 2015 年,Chu 等[21]利用 ChIRP⁃MS这个策略系统获得调控X 染色体失活的长链非编码RNA Xist 的RNA 结合蛋白,使得其互作蛋白从以往的不到十种一下子增加到了八十一种,使得大家重新认识了经典lncRNA Xist 的细胞功能。在 2020 年,Lan 等[26]利用 ChIRP⁃MS 技术分离了长链非编码RNA SNHG6 的互作蛋白,结合LC⁃MS对蛋白进行了系统鉴定,获得了高达467 个互作蛋白。对其进行功能注释,从而发现了SNHG6 参与可变剪接等功能,极大地丰富了我们对目标RNA的生物学功能的认识。再比如2020 年,Sun 等[27]通过ChIRP⁃MS 技术发现长链非编码RNA PFI互作蛋白SRSF1,并发现其通过与剪接调节因子SRSF1 相互作用保护肺纤维化的分子机制,表明ChIRP⁃MS 技术的可行性,并对RNA 的功能和机制研究提供了很大的便利,方便解析RNA 互作图谱改变对肿瘤发生发展的影响。
本研究采用了ChIRP⁃MS 技术系统高效地建立起了国际上首个肿瘤细胞U6 互作蛋白组图谱,为研究U6 的肿瘤生物学功能和调控机制奠定了坚实的基础。我们所建立的U6 肿瘤细胞互作蛋白组图谱。
一共包括135 个蛋白,其中包括了大量已知U6 的互作蛋白(表2,图3,4),这证明了我们方法能有效地鉴定到U6 的互作蛋白。此外我们还鉴定出一些新的U6 互作蛋白,包括ACTB、NCL、MYH7 等等,这些新的互作蛋白是发掘新的U6 功能的基础。进一步采用GO 和KEGG 分析,发现除了显著富集到与mRNA 前体剪接和加工功能相关蛋白外,我们还发现了一些U6 所参与的其它生物学功能,包括囊泡运输、成熟mRNA 的转运出核、成熟mRNA 的降解、调控RNA 定位等(表3,图3),同时注释结果显示U6 互作蛋白组可能也参与了体内一些有机环状物化合物的代谢和一些病理生理学过程的调控,比如嘌呤代谢、乳糖不耐症等,说明U6 在肿瘤细胞中扮演着复杂多样的功能。同时我们又对U6 snRNA 互作蛋白组进行了蛋白复合物富集分析以及PPI 蛋白互作网络分析,发现他们来自一些功能蛋白复合体,这些复合物除了参与mRNA 的剪接和加工外,还参与了成熟mRNA 转运出核、mRNA 降解、microRNA 加工成熟,转录调控,序列特异性DNA 结合等生物学功能(图4A,B)。总之,以上结果均提示U6 在肿瘤细胞中除了参与mRNA 前体剪接和加工外,还参与了mRNA 从产生到转录后调控等一系列生物学过程,提示U6 多维度地参与了肿瘤细胞mRNA 生物学发生的全过程调控。这些发现极大地扩展了U6 可能的肿瘤生物学功能范围,为展开U6 sn⁃RNA 如何参与肿瘤发生发展进程提供了一些思路,为肿瘤的预防和治疗提供理论基础。
表3 U6 snRNA 互作蛋白组KEGG 通路富集分析
图4 A:U6 互作蛋白组复合体富集分析;B:U6 互作蛋白组PPI 网络