人SMAD4全长及剪接体在HEK-293T细胞中的亚细胞定位及转录活性分析
2021-06-01方晋仁尹小慧李国庆杨南扬
方晋仁,尹小慧,周 涛,李国庆,秦 辉,杨南扬
(南华大学衡阳医学院细胞与遗传研究所生态健康与人类重要疾病防控湖南省高校重点实验室细胞应激生物学衡阳市重点实验室,中国湖南衡阳421000)
转化生长因子-β(transforming growth factor-β,TGF-β)/Smads信号通路在调节细胞增殖、生长、分化、凋亡以及转移黏附等方面均具有重要作用,该信号通路的异常被认为与多种癌症的发生和发展密切相关[1~2]。在许多正常的细胞类型中,TGF-β作为一种主要的负生长调控因子,通过细胞膜上的TGF-β受体和胞内信号转导分子SMAD蛋白共同发挥抑制细胞生长的作用。当细胞外存在TGF-β配体分子时,该配体分子可以依次激活细胞膜上的TGF-βⅡ型和Ⅰ型受体,继而磷酸化激活胞质中的受体调节型SMAD(R-SMAD分子,SMAD2或SMAD3),后者进一步与通用型SMAD分子Co-SMAD(SMAD4)形成异源复合体入核,最终调节靶基因的转录。在该过程中,SMAD4作为TGF-β/Smads信号通路中唯一的通用型SMAD分子,是信号转导过程的关键核心分子。已有研究表明,多种由TGF-β/Smads信号转导异常所导致的肿瘤中,常常被发现有SMAD4的基因突变或/和表达下调甚至缺失,例如胰腺癌、头颈部鳞状癌和结直肠癌等[3~8]。在这些癌细胞中,过表达SMAD4可增加细胞凋亡,抑制细胞增殖[7,9~10]。但在部分癌症种类(比如恶性胶质瘤、肾细胞癌、前列腺癌等)中,研究者却极少能观察到SMAD4的基因突变或表达异常[1,11]。
在哺乳动物细胞中,基因的mRNA选择性剪接可以产生多种具有不同功能甚至相反功能的蛋白质差异剪接体。SMAD4全长蛋白质共包含11个外显子,本文中研究的6种剪接体在3号外显子至7号外显子区段内发生了不同程度的外显子缺失,分别为 SMAD4△3、SMAD4△4、SMAD4△6、SMAD4△5-6、SMAD4△4-6 和 SMAD4△4-7[12],这6种剪接体与全长外显子的组成情况如图1所示。越来越多的研究表明,许多肿瘤的发生与发展同一些转录因子的异常剪接体存在与否密切相关[13~15]。因此,在那些未发现SMAD4基因突变或表达异常的癌症类型中,SMAD4剪接体是否在其发生和发展过程中发挥一定的生物学功能,值得进一步探讨。
图1 SMAD4全长及剪接体示意图SMAD4包括MH1、linker和MH2结构域。外显子表示为带有外显子编号的方框;下面的数字为外显子-外显子边界的氨基酸;NLS:核定位信号;NES:核输出信号;SAD:SMAD蛋白激活区。Fig.1 Schematics of SMAD4 full-length and splicing variantsSMAD4 includes MH1,a linker and MH2 domains.Exons are denoted as boxes with the exon numbers indicated.Numbers below are amino acids at the exon-exon boundaries.NLS,nuclear localization signal;NES,nuclear export signal;SAD,SMAD4 activation domain.
本研究旨在构建带绿色荧光蛋白(green fluorescent protein,GFP)标签的人SMAD4全长及各种剪接体基因的表达载体,观察其在真核细胞HEK-293T中的亚细胞定位,并分析其对SMAD4下游靶基因启动子上的SMAD结合元件(SMAD binding element,SBE)转录活性的影响,为SMAD4剪接体的进一步功能研究提供一定的实验基础。
1 材料与方法
1.1 材料
人胚肾细胞系HEK-293T购自中国典型培养物保藏中心(China Center for Type Culture Collection,CCTCC);pEGFP-C1表达载体、pcDNA3.1-flag空载体、SMAD4全长及各种剪接体过表达载体(带flag标签)、4*SBE-luc报告基因、内参海肾荧光素酶质粒pREP7-RLuc和大肠杆菌DH5α为本实验室存储;DNA凝胶回收试剂盒、质粒DNA小量提取试剂盒、PCR cleanup试剂盒均购自爱思进生物技术有限公司;限制性核酸内切酶EcoRⅠ、SalⅠ及其缓冲液、T4 DNA连接酶及其缓冲液购自宝生物工程(大连)有限公司;无内毒素中量提取试剂盒购自康为世纪生物科技有限公司;转染试剂Lipofectamine 2000购自赛默飞世尔科技公司;双荧光素酶报告基因检测试剂盒(Double-Lu-ciferase Reporter Assay Kit)购于北京全式金生物科技有限公司;引物的合成及质粒的测序由苏州金唯智生物科技有限公司完成。
1.2 HEK-293T细胞培养
将HEK-293T细胞置于含10%胎牛血清、100 μg/mL(终质量浓度)青霉素和链霉素的DMEM培养基中,用37℃、5%CO2的细胞培养箱培养。每天观察细胞生长状态,并根据情况每隔2 d左右换液或传代一次。
1.3 pEGFP-C1-SMAD4全长及剪接体重组质粒的构建及鉴定
在NCBI网站上查询人SMAD4的CDS(coding sequence)序列,并根据文献报道的6种SMAD4剪接体的外显子构成[12],设计用于扩增SMAD4全长及剪接体的PCR通用引物。上游引物:5′-CCGGAATTCCATGGACAATATGTCTATTACG-3′(下划线部分为EcoRⅠ的酶切位点),下游引物:5′-ACGCGTCGACTCAGTCTAAAGGTTGTGGGT-3′(下划线部分为SalⅠ的酶切位点)。分别以本实验室保存的pMD19-T-SMAD4全长及剪接体重组质粒为模板,利用上述引物对SMAD4全长及剪接体片段进行PCR扩增。利用PCR cleanup试剂盒对经1%琼脂糖凝胶电泳鉴定后的PCR扩增产物进行回收。将PCR回收产物与pEGFP-C1载体进行EcoRⅠ和SalⅠ的双酶切反应,并回收酶切产物。所得酶切产物用T4 DNA连接酶在16℃条件下连接4 h;之后将连接产物转化至大肠杆菌DH5α细胞中,于卡那霉素抗性LB固体平板中生长过夜。采用碱裂解法提取单克隆菌落中的质粒并双酶切鉴定,将酶切鉴定阳性的质粒送往苏州金唯智生物科技有限公司进行测序。
1.4 SMAD4全长及剪接体在HEK-293T细胞中的亚定位
转染前一天,按每孔1×105个细胞的密度接种HEK-293T于24孔板中。第2天,待细胞生长至汇合度达60%~70%时,分别转染pEGFP-C1载体、pEGFP-C1-SMAD4全长及剪接体共8种质粒至不同细胞孔中。转染试剂Lipofectamine 2000的用量按转染DNA总量(微克数)的1.5倍体积(微升)的标准使用。转染48 h后去掉培养基,在适量磷酸缓冲盐溶液(phosphate buffer saline,PBS)清洗细胞后,用4%多聚甲醛室温固定细胞30 min。弃4%多聚甲醛,加入适量PBS清洗细胞两次,再加入0.1%Triton X-100室温处理细胞10 min。PBS清洗细胞两次,加入细胞核染液4′,6-二脒基-2-苯基吲哚(4′,6-diamidino-2-phenylindole,DAPI),室温染色5 min。弃染液,PBS清洗细胞3次,于倒置荧光显微镜下观察SMAD4全长及剪接体在HEK-293T细胞中的亚定位。
1.5 SMAD4全长及剪接体在HEK-293T细胞中的转录活性分析
1.6 统计学分析
采用SPSS 18.0软件进行统计学分析;数据符合方差齐性和正态分布,多组间比较采用ANOVA方法,P<0.05为差异具有统计学意义。
2 结果
2.1 SMAD4全长及剪接体基因片段的PCR扩增
以本实验室保存的SMAD4全长及剪接体的pMD19-T载体为模板,对目标片段进行扩增,所得PCR产物的1%琼脂糖凝胶电泳结果如图2所示,条带大小分别为1 542 bp(SMAD4△6)、1 449 bp(SMAD4△4)、1 626 bp(SMAD4△3)、1 422 bp(SMAD4△5-6)、1 212 bp(SMAD4△4-6)、1 158 bp(SMAD4△4-7)和1 659 bp(SMAD4),均与预期大小相一致。
图2 SMAD4全长及剪接体基因的PCR结果M:DL2000 DNA标记;1:SMAD4△6基因的PCR产物;2:SMAD4△4基因的PCR产物;3:SMAD4△3基因的PCR产物;4:SMAD4△5-6基因的PCR产物;5:SMAD4△4-6基因的PCR产物;6:SMAD4△4-7基因的PCR产物;7:SMAD4基因的PCR产物。Fig.2 PCR results of full-length SMAD4 and the splicing variant genesM:DL2000 DNA marker;1:PCR product of SMAD4△6 gene;2:PCR product of SMAD4△4 gene;3:PCR product of SMAD4△3 gene;4:PCRproduct of SMAD4△5-6 gene;5:PCRproduct of SMAD4△4-6 gene;6:PCR product of SMAD4△4-7 gene;7:PCR product of SMAD4 gene.
2.2 pEGFP-C1-SMAD4全长及剪接体重组质粒的构建及鉴定
从筛选目的重组质粒的卡那霉素抗性LB平板上挑取单克隆,经碱裂解法抽提所得质粒,利用EcoRⅠ和SalⅠ进行双酶切,采用1%琼脂糖凝胶电泳进行鉴定,结果如图3所示,泳道1~7均可见两条大小分别与pEGFP-C1空载体和目的基因片段相符的特异性条带。测序结果经NCBI的Blast比对正确,表明pEGFP-C1-SMAD4全长及剪接体重组质粒构建成功。
图3 pEGFP-C1-SMAD4全长及剪接体重组质粒的EcoRⅠ/SalⅠ双酶切结果M1:100 bp DNA标记;M2:1 kb DNA标记;1:重组质粒pEGFP-C1-SMAD4△3双酶切结果;2:重组质粒pEGFPC1-SMAD4△4双酶切结果;3:重组质粒pEGFP-C1-SMAD4△6双酶切结果;4:重组质粒pEGFP-C1-SMAD4△5-6双酶切结果;5:重组质粒pEGFP-C1-SMAD4△4-6双酶切结果;6:重组质粒pEGFP-C1-SMAD4△4-7双酶切结果;7:重组质粒pEGFP-C1-SMAD4双酶切结果。Fig.3 EcoRⅠ/SalⅠ double digestion of recombinant plasmid pEGFP-C1-SMAD4(full-length)and the splicing variant plasmidsM1:100 bp DNA marker;M2:1 kb DNA marker;1:pEGFP-C1-SMAD4△3 digested by EcoRⅠ/SalⅠ;2:pEGFPC1-SMAD4△4 digested by EcoRⅠ/SalⅠ;3:pEGFP-C1-SMAD4△6 digested by EcoRⅠ/SalⅠ;4:pEGFP-C1-SMAD4△5-6 digested by EcoRⅠ/SalⅠ;5:pEGFP-C1-SMAD4△4-6 digested by EcoRⅠ/SalⅠ;6:pEGFP-C1-SMAD4△4-7 digested by EcoRⅠ/SalⅠ;7:pEGFP-C1-SMAD4 digested by EcoRⅠ/SalⅠ.
2.3 SMAD4全长及剪接体在HEK-293T细胞中的亚定位
为了研究SMAD4全长及剪接体在HEK-293T细胞中的亚定位,我们将上述所得重组质粒及空质粒pEGFP-C1分别转染至HEK-293T细胞中,48 h后在倒置荧光显微镜下观察细胞内绿色荧光的分布情况,对SMAD4全长及剪接体转染组在细胞核定位、细胞质定位以及核质均有定位的细胞数分别进行统计,并计算3种分布类型细胞所占百分比。结果显示:在转染pEGFP-C1空载体的对照组中,核质均匀分布的细胞所占比例为99%;与之相比,在SMAD4全长转染组以及SMAD4△4、SMAD4△6、SMAD4△5-6、SMAD4△4-6和SMAD4△4-7五种剪接体转染组中,核质均匀分布的细胞仅在1%~7%,绝大部分细胞呈现出明显的胞质分布(百分比在93%~99%)(图4)。值得注意的是,与上述5种SMAD4剪接体的细胞内定位不同,SMAD4△3在HEK-293T细胞中的分布主要集中于细胞核(占比91%),基本没有呈现明显的胞质分布,说明SMAD4△3呈现过度的细胞核定位。
图4 SMAD4全长及剪接体在HEK-293T中的亚细胞定位(A)SMAD4全长及剪接体亚细胞定位的统计分析结果。随机选取5个不同荧光观察视野共计180~200个细胞进行仅有核内荧光信号、仅有胞质荧光信号以及荧光信号均匀分布在整个细胞内的3种荧光分布类型的细胞数及百分占比统计,并绘制百分比直方图;(B)SMAD4全长及剪接体在HEK-293T细胞中具有代表性的荧光分布图。Fig.4 Subcellular localization of full-length SMAD4 and the splicing variants in HEK-293T cells(A)Statistical analysis results of full-length SMAD4 and splicing variants distribution.Five random fields were selected and the staining pattern of each cell within the field was counted visually according to the three categories including only nucleus distribution,only cytoplasm distribution and whole cell distribution.Plotted is the percentage of cells in each category±standard deviation;(B)Representative fluorescence images of full-length SMAD4 and splicing variants distribution.
2.4 SMAD4全长及剪接体在HEK-293T细胞中的转录活性分析
作为TGF-β/Smads信号通路中核心的转录因子,SMAD4与胞质中的R-SMADs形成复合体入核后,通过识别并结合下游靶基因启动子上的SBE发挥转录激活的功能。为了对比SMAD4全长及剪接体的转录活性,也为了明确SMAD4△3剪接体的核分布是否组成型激活TGF-β/Smads信号通路,我们在HEK-293T细胞中检测了SMAD4全长及剪接体对4*SBE-luc(4拷贝SMAD结合元件报告基因)转录活性的影响。结果如图5所示,与转染flag空载体的对照组相比,6种SMAD4剪接体过表达组中,只有具有核分布的SMAD4△3过表达组呈现出了一定程度SBE报告基因的荧光素酶活性上调趋势。这个结果说明SMAD4△3剪接体较小程度地激活TGF-β/Smads信号通路。值得注意的是,与SMAD4△3过表达组相比,分布于细胞质的全长SMAD4的过表达更加显著地增强了SBE报告基因的荧光素酶活性。
3 讨论
SMAD4蛋白作为TGF-β/Smads信号通路中的核心转录因子,其全长蛋白质在癌症发生与发展中发挥抑制作用的研究报道已有很多,但迄今为止,关于SMAD4各种剪接体的表达及生物学功能的研究报道却还极少。而且,虽有研究报道甲状腺癌组织中存在SMAD4△5-6、SMAD4△4-6和SMAD4△4-7的表达[16];原代神经母细胞瘤组织中存在SMAD4△5-6和SMAD4△4-6的表达[17];乳腺癌细胞系MDA-MB-231中只有SMAD4△5-6剪接型的表达[18];人永生化表皮细胞系HaCaT中有本文提及的6种SMAD4蛋白剪接型的表达,并在辐射照射条件下HaCaT中存在SMAD4B的表达[19],但对于SMAD4蛋白剪接体生物学功能的研究报道几乎是空白。
细胞内蛋白质的亚细胞定位对其功能的发挥十分重要。利用荧光蛋白的定位来确定与荧光蛋白基因融合的目的基因的表达与定位,是目前蛋白质亚细胞定位研究的一种常用方法。GFP因具有相对分子质量小、能很好地与目的基因融合表达、在真核细胞内无内源性表达以及所产生的绿色荧光易于检测等优点[20~21],成为被广泛使用的荧光标签之一。本文通过融合GFP观察了人SMAD4全长蛋白质以及6种剪接体蛋白质在HEK-293T中的表达与定位情况。不同于全长蛋白质以及SMAD4△4、SMAD4△6、SMAD4△5-6、SMAD4△4-6、SMAD4△4-7这5种剪接体的细胞质分布,3号外显子缺失突变体SMAD4△3定位于细胞核(图4)。根据已有的SMAD4全长蛋白质各功能结构域组成的报道[22],推测SMAD4△3剪接体的组成型核定位至少一部分是由于SMAD4的3号外显子中所包含的核输出信号(NES)被剔除了。
许多转录因子的差异剪接体蛋白质因组成型核定位,进而组成型激活(即不需要配体分子存在就能入核介导下游靶基因转录)下游介导的信号转导,例如雄激素受体(androgen receptor,AR)的剪接体蛋白质AR-Vs。目前已报道的AR-Vs均缺乏配体结合结构域,但它们仍然能够在缺乏雄激素配体结合或AR全长蛋白质的情况下实现核定位,组成型激活细胞中的AR信号。AR-Vs核定位的实现,被认为是基于AR-Vs所保留的核定位信号(NLS)的作用;但对于那些缺乏NLS序列的AR-Vs(如AR-V7)来说,促成这种高效核定位的一个因素很可能是它们缺乏由AR六号外显子编码的NES[23]。尽管SMAD4△3剪接体的核定位现象及原因与AR-V7类似,但其并未展现出超越SMAD4全长蛋白质的组成型激活下游TGF-β/Smads信号转导的能力(图5)。有研究显示,大小在60 kD甚至是90 kD左右以下的蛋白质,可通过核孔复合体以自由扩散方式进入细胞核[24]。在TGF-β/Smads信号通路未被激活的情况下,由于SMAD4全长蛋白质的大小约为60 kD且一般以单体形式存在于细胞中[25],所以SMAD4单体及相对分子质量小于全长的各种剪接体单体均可自由入核。但在该信号通路下游转录被激活的过程中,SMAD4蛋白与R-SMAD蛋白异源复合体的形成是必需的;此时SMADs复合物的相对分子质量大于核孔自由扩散的极限蛋白质相对分子质量,该复合物将以主动运输的方式入核,继而激活下游的转录。在我们的研究结果中,SMAD4△3剪接体的转录激活能力不及SMAD4全长蛋白质。尽管SMAD4全长蛋白质只有极少数占比的全细胞分布情况(约1%),但该小部分核内分布的SMAD4,极可能是以与R-SMAD蛋白形成具有高转录激活能力的蛋白复合体形式存在;而相反地,SMAD4△3剪接体则可能因其NES序列缺失导致单体分子过度入核,阻碍了大部分具有高转录激活能力的SMAD4△3与R-SMAD蛋白形成复合体。这也就合理解释了SMAD4△3剪接体的组成型核定位并未组成型激活下游转录的原因。而其显著高于其他5种SMAD4剪接体的转录激活能力,则可能是因为其保留了完整的定位于6号外显子和7号外显子整个区域的SMAD转录激活结构域(SMAD activation domain),该位点被认为是SMAD4转录激活所必需的[1]。
图5 SMAD4全长及剪接体在HEK-293T细胞中的转录活性分析用双荧光素酶报告系统检测SBE报告基因的激活情况。与flag-SMAD4△3组相比,##P<0.01,###P<0.001;与空载体组相比,**P<0.01,***P<0.001。Fig.5 Analysis of transcriptional activity of the full-length SMAD4 and the splicing variants in HEK-293T cellsThe activation of SBE luciferase reporter was detected by dualluciferase reporter assays.##P<0.01,###P<0.001,compared with flag-SMAD4△3;**P<0.01,***P<0.001,compared with vector.
经典的TGF-β/SMAD4信号通路通过R-SMADs/SMAD4激活诱导细胞周期阻滞相关因子(如p15、p21和p27等)和凋亡相关靶蛋白(如GADD45β、Bim等)的转录,抑制早期肿瘤的发生发展,该过程依赖于SMAD4自身的核定位和转录激活能力。但近年来有文献报道了SMAD4不依赖其自身转录激活功能而发挥促进细胞凋亡作用的例子,如Chao等[26]发现SMAD4能促进p53的入核,从而上调p53介导的下游促凋亡靶基因的转录,最终导致酪氨酸激酶抑制剂诱导的肝癌细胞凋亡。因此,尽管本研究中SMAD4△3剪接体未表现出超越SMAD4全长蛋白质的组成型转录激活能力,但其能否通过自身的组成型核定位特性来促进某些转录因子的入核,进而参与细胞的一些生命活动过程,依然值得深入探讨。
另外,早在20年前,Pierreux等[12]就利用flag标签对SMAD4全长及剪接体的亚细胞定位进行过研究。在未进行任何处理的小鼠胚胎成纤维细胞系NIH 3T3中,研究者能观察到显著的外源性人源 SMAD4全长、SMAD4△6、SMAD4△5-6和SMAD4△4-7的胞质分布以及SMAD4△3的胞核分布,这与我们在HEK-293T中的观察结果相对应;但另两种剪接体蛋白质SMAD4△4与SMAD4△4-6在NIH 3T3细胞中的分布,却与我们观察到的在HEK-293T细胞中的胞质定位不同,前者主要分布在细胞核,而后者则呈现胞核和胞质的均匀分布。这提示,同一种蛋白质剪接体在不同细胞类型中发挥的功能以及机制不尽相同。
综上所述,我们对SMAD4全长及剪接体在人胚肾细胞系HEK-293T中的亚定位及转录活性进行了研究,为后续深入研究SMAD4剪接体的功能奠定了一定的基础。