印记基因与肿瘤的发生
2022-04-07谢艳颖胡雪峰
谢艳颖 胡雪峰
(1福建省福州第三中学滨海校区 福建福州 350207 2福建师范大学生命科学学院,福建省发育与神经生物学重点实验室 福建福州 350117)
表观遗传是指生物体的基因序列不改变,而基因的表达发生可遗传变化的一种现象,普遍存在于生物体的生长发育过程中,印记基因是表观遗传现象的一种。本文概述了印记基因的结构、表达机制及其表达异常与肿瘤的关系。
1 印记基因简介
印记基因的发现起始于20世纪70年代报道的父源特异性染色体消除现象,90年代科学家鉴定出3种小鼠的印记基因。随着研究深入,科学家逐步探明了印记基因的结构及其表达机制。
1.1 印记基因的发现 1971年,在研究节肢动物时,克劳斯(Crouse)发现决定性别的关键因素父源特异性染色体消除,提出“染色体印记”的概念[1]。同时,库珀(Cooper)注意到有袋类哺乳动物父源X染色体的特异性失活,也称其为“染色体印记”。1974年,约翰逊(Johnson)在研究17号染色体突变的小鼠时发现,染色体印记不是X染色体特有的现象,而是广泛存在于基因组中。
20世纪80年代,麦格拉斯(McGrath)和索特(Solter)等通过小鼠的细胞核移植实验发现,2个原核分别来自父方和母方时,胚胎能正常发育。若是单亲二倍体(2个原核均来自父方或母方),胚胎死亡。后续的实验证明,在一种性别中发现的被标记的许多基因在另一性别中未被标记,因而只有来自父母双方的基因同时存在,才能互补,使后代正常发育。但胚胎中存在2个相同的标记基因时,就会导致幼崽死亡,这为哺乳动物基因组印记的存在提供了有力的证据。1991年,科学家陆续发现了小鼠的3种印记基因,通过定位克隆,鉴定出Igf2r(insulin-like growth factor type 2 receptor),通过基因敲除鉴定出Igf2(insulin-like growth factor type 2)与H19。
1.2 印记基因簇 迄今为止,约有150个印记基因被定位到17条小鼠染色体上,其中包括X染色体。经鉴定,超过80%的印记基因聚集在16个基因组区域,称为印记基因簇。已鉴定出7个印记基因簇,这7个印记基因簇都包含3个及以上的印记基因。每个印记基因簇都由一个印记控制中心(imprinted control center,ICR)控制,该区域具有亲本特异性表观遗传修饰,例如,DNA甲基化和翻译后组蛋白修饰等。DNA甲基化是公认的一种赋予亲本特异性的表观遗传修饰[2]。ICR中携带有甲基化印记的DNA序列,称为差异性DNA甲基化区域(differentially DNA methylated region,DMR)。DNA甲基化印记发生在配子中,体细胞中仅存于一个亲本染色体上。除了ICR和多个印记基因,大部分印记基因簇都至少含有一个长链非编码RNA(long noncoding RNA,lncRNA)。lncRNA本身不编码蛋白质,却能调控基因的表达。在印记基因簇中,ICR通常与lncRNA的启动子重叠。
1.3 印记基因的表达机制 印记基因簇的结构各异,致使不同印记基因的表达受不同机制的调控。根据调控的结果,可将印记基因分为父源印记基因与母源印记基因两大类。父源印记基因是指父源等位基因抑制而母源等位基因表达的基因,与抑制胚胎发育有关,例如,Igf2r、H19[3-4]。母源印记基因则是父源等位基因表达而母源等位基因受抑制的基因,与促进胚胎发育有关,例如,Igf2。
1.3.1 lncRNA模型 lncRNA介导的表达模型适用于Igf2r印记基因簇。Igf2r位于小鼠17号染色体,是父源印记基因。作为Igf2的一种受体,与其结合后被溶酶体降解,起到抑制生长的作用。在母本染色体上,甲基化的ICR含有lncRNA的启动子,致使lncRNA无法表达,但不影响其他印记基因的表达。而父本染色体ICR未甲基化,lncRNA可表达,使同侧的印记基因沉默。这种机制可能是lncRNA与启动子重叠,导致某种形式的转录干扰或通过覆盖局部染色体区域而招募抑制性组蛋白。
1.3.2 绝缘子模型 绝缘子介导的表达模型适用于Igf2/H19印记基因簇。Igf2与H19位于小鼠17号染色体远端,其中Igf2是母源印记基因,H19位于Igf2下游,是父源印记基因。Igf2/H19受H19上游DMR调控,共用一个增强子,增强子位于H19下游。在母本染色体中,DMR未甲基化,DMR区域有潜在的CCCTC结合位点,可结合绝缘子CTCF因子,形成绝缘子,以阻断增强子和Igf2启动子的作用,但不影响其与H19启动子的作用,使得H19能顺利表达。在父本染色体中,H19的启动子区域甲基化,H19沉默,不形成绝缘子,增强子作用于Igf2启动子,Igf2表达。
2 印记基因与肿瘤的发生
印记基因的正常表达使生物体能正常发育,而印记基因中双亲等位基因若同时表达或同时沉默会导致肿瘤的发生。
2.1 IGF2/H19与肿瘤的发生 IGF2与IGF1R结合后激活酪氨酸激酶受体,通过PI3K/AKT通路抑制细胞凋亡,通过RAS/MAP激酶通路促进细胞增殖[5]。母本染色体DMR失调导致IGF2印记丢失(loss of imprinting,LOI),促进IGF2双等位基因表达,致使细胞过度增殖。在多种肿瘤中发现,IGF2过表达与肿瘤发生相关。LOI最初是在Wilms肿瘤中发现的,随后发现,IGF2的LOI现象普遍存在于肿瘤中。IGF2的LOI在结肠癌表现为近端和远端结肠的弥漫性异常,一些结肠癌患者的正常结肠组织可检测出IGF2的LOI[6]。Sakatani等[7]构建IGF2印记缺失型小鼠,发现结肠癌的发生率提高了2倍,并观察到癌前病变现象。
H19能被折叠成一个特殊的二级结构,这使其能与RNA结合蛋白和DNA/染色质修饰因子等相关蛋白结合,调节相关生理过程。H19于胚胎期高表达,出生后在多数组织中沉默,但肿瘤发生过程中可重新激活。在许多肿瘤中发现,H19能通过不同的机制发挥致癌作用。H19能促进癌细胞增殖并抑制癌细胞死亡。在乳腺癌细胞中,H19促进G1/S转变[8]。高表达的H19可促进EZH2与促凋亡因子BIK启动子的结合,抑制BIK的表达。H19也可降低抑癌因子的水平。在膀胱癌细胞中,H19通过miR-675抑制p53表达。在胃癌中,H19导致p53部分失活。H19还能促进癌细胞的迁移、侵袭和转移。上皮-间质转化(epithelialmesenchymal transition,EMT)是肿瘤扩散的重要机制,在膀胱癌中,H19与EZH2结合,促进wnt/βcatenin的激活,致使上皮标记E-cadherin表达下降,促进 EMT[9]。
2.2 CDKN1C位点与肿瘤的发生 CDKN1C位点位于人类1号染色体上,包含父源印记基因KCNQ1、CDKN1C及母源印记基因KCNQ1OT1,由位于KCNQ1内含子中的KvDMR1调控。
CDKN1C编码p57kip2蛋白,其氨基端含有一个CDK抑制结构域[10],可与细胞周期蛋白CDK复合物结合并抑制细胞周期进程。CDKN1C可促进细胞分化,在横纹肌肉瘤细胞中,转录因子MyoD受损,致使p57kip2转录减少,成肌细胞分化受阻。CDKN1C可调节细胞死亡,促进HeLa细胞线粒体凋亡途径,激活caspase 9和caspase 3。CDKN1C还能抑制胶质瘤细胞迁移和侵袭的能力。
KCNQ1编码电压门控钾离子通道的一个亚基。钾离子通道参与许多类型细胞的增殖,在结、直肠癌与肝细胞性肝癌中,KCNQ1过表达抑制细胞的增殖与侵袭。KCNQ1是wnt/β-catenin通路的靶基因与调控因子,在结、直肠癌细胞中,活化的wnt/β-catenin通过直接结合TCF4复合物抑制KCNQ1蛋白的表达,KCNQ1抑制剂引起β-catenin重新进入细胞质,刺激结、直肠癌细胞增殖[11]。
KCNQ1OT1编码一个lncRNA,能负性调节KCNQ1的表达。在结、直肠癌细胞中,β-catenin与KCNQ1OT1启动子直接结合,使KCNQ1OT1基因的表达显著提高。在肝细胞性肝癌中,KCNQ1OT1基因敲除降低了GSK3β的磷酸化水平,下调β-catenin,抑制抗凋亡基因Bcl-2的表达[12]。
2.3 DLK1/MEG3与肿瘤的发生 DLK1/MEG3位于人类14号染色体上,其中DLK1是母源印记基因,MEG3是父源印记基因,DLK1由IG-DMR调控,MEG3由MEG3-DMR调控。
DLK1编码DLK1蛋白,在胎盘组织高表达,在正常组织中沉默,但在多种肿瘤中异常表达。IG-DMR的甲基化异常与肝母细胞瘤、垂体瘤、肾细胞癌等相关。Yin等[13]发现高表达的DLK1蛋白可使神经胶质瘤细胞的增殖能力明显增强,上调细胞周期蛋白Cyclin D1、CDK2和E2F4的表达。
MEG3编码lncRNA,在许多正常组织中表达,但在肿瘤中表达受抑制。在许多类型的肿瘤中,例如,垂体瘤、成神经细胞瘤、脑膜瘤、肝细胞性肝癌等,均可观察到MEG3-DMR的高甲基化与MEG3的沉默或表达降低。Braconi等[14]发现MEG3在肝细胞性肝癌细胞中的表达增强,显著抑制肿瘤细胞的生长,诱导细胞凋亡。
3 总结
印记基因在生物生长发育过程中起至关重要的作用。通常,印记基因与胚胎发育有关,表现为促进或抑制胚胎发育。若印记基因同时表达或沉默,可造成细胞过度增殖或诱导细胞凋亡,导致肿瘤发生。正是印记基因上携带的特异性表观遗传标记,使双亲等位基因的表达受到严格的调控,才使生物体的各项生命活动正常进行。