高低转移大细胞肺癌细胞株L9981和NL9980间甲基化差异基因的初步研究
2010-09-13吕慧闫惠琴王岷李永文万海粟刘红雨吴蘅周清华
吕慧 闫惠琴 王岷 李永文 万海粟 刘红雨 吴蘅 周清华
肺癌是我国发病率和死亡率增长最快的恶性肿瘤之一,也是人类肿瘤中最容易发生侵袭转移的恶性肿瘤之一。影响肺癌患者预后和生存的最主要原因是肺癌的远处转移[1]。因此,研究和阐明调控肺癌侵袭转移的分子机制具有重要意义。
我们前期的研究[2]从人大细胞肺癌细胞株WCQH29801分离构建不同转移潜能的人大细胞肺癌细胞系NL9980和L9981。L9981细胞在体外具有较强的克隆形成能力和侵袭力,在裸鼠体内的自发性肺转移能力为100%,均显著高于NL9980细胞[2-5]。因此我们推测二者之间差异表达基因可能与L9981的侵袭及克隆能力强有关。表观遗传学是研究无DNA序列变化、可遗传的基因表达(活性)的改变的一门学科[6]。DNA甲基化是表观遗传的主要方式,它是由DNA甲基转移酶介导,在胞嘧啶的第5位碳原子上加上一甲基基团,使之变成5-甲基胞嘧啶(5 mC)的化学修饰过程,当基因启动子高甲基化时使基因失活,去(低)甲基化则使基因重新开放[7]。因此我们采用甲基化芯片杂交技术[8,9]对这两个细胞株的差异甲基化基因进行比较,从而进一步探讨甲基化在肺癌转移中的作用。该技术主要是利用特定抗体对甲基化的胞嘧啶进行免疫沉淀反应(immunoprecipitation)使甲基化和非甲基化的胞嘧啶分离,并对分离出的甲基化DNA片段进行基因芯片杂交,实现高通量的检测。该方法对任意序列背景下的甲基化胞嘧啶均能实现免疫沉淀,分辨率相对较高,信息量较大,有助于发现两者的差异甲基化基因及新基因[10]。
1 材料与方法
1.1 细胞株 NL9980(低转移大细胞肺癌细胞株)、L9981(高转移大细胞肺癌细胞株)均由天津市肺癌研究所提供。
1.2 常用试剂及设备 精制小牛血清和RPMI-1640培养基均购自Gibco公司;使用120 mmol/L的NaOH溶液配成1 mmol/L的贮备液,4oC 贮存;TIANamp Genomic DNA Kit血液/细胞/组织基因组DNA提取试剂盒(Tiangen,Cat. No. DP304-03);Resi: MBD2b蛋白-sepharose-4B柱(上海生物芯片公司);QIAquick PCR purification kit(Qiagen, Cat. No. 28106);Cy3、Cy5 9mer Wobble(50,200 O.D.)(TriLink Bio-technologies, Cat. No. N46-0010)Linker(15P)oligo JW102(40 μM);oligo JW103(40 μM);CPK6 48mer oligos(上海生工生物工程技术服务有限公司合成);NimbleGen Hybridization Kit 40 Refill(Nimblegen, Cat. No. KIT005-2);杂交炉(HB-1000 HYBRIDIZER)美国UVP LAB-ORATORY公司;扫描仪(AXON INSTRUMENTS GENE PIX 4000B)美国AXON公司;NimbleScanTM2.2:购自NimbleGen公司。
1.3 基因芯片 项目所用芯片SBC human CHIP:定制于上海生物芯片有限公司。探针为Nimblegen设计,设计原则是:一段DNA序列>250 bp,GC含量>57%时,认为这一段为CpG岛。探针一共有3 678 702条,每个岛所含的探针个数,从10多到30多不等,大小均为50 nt在芯片中平均分布。
1.4 提取L9981、NL9980细胞株的基因组DNA 用TIANamp Genomic DNA Kit提取基因组DNA,详细操作方法和原理见TIANamp Genomic DNA Kit protocol。并用分光光度计定量及普通凝胶电泳检测质量。
1.5 对L9981、NL9980细胞株的基因组DNA进行超声破碎用超声破碎仪将L9981、NL9980细胞的基因组DNA破碎成DNA片段。并用分光光度计定量及普通凝胶电泳检测质量。
1.6 甲基化免疫沉淀方法富集甲基化DNA 通过Resi:MBD2b蛋白-sepharose-4B柱富集甲基化片断。然后用连接介导PCR(ligation-mediated PCR, LM-PCR)的方法[11]进行2次扩增。并用分光光度计定量及普通凝胶电泳检测质量。
1.7 芯片杂交及分析 应用寡核苷酸直接掺入法分别将Cy3和Cy5标记扩增的L9981及NL9980细胞株的DNA片段,然后NimbleGen Array Hybridization Kit与高通量甲基化芯片进行杂交产生2张芯片。使用NimbleScanTM2.2(NimbleGen)分析结果。用SignalMapTM对所得数据进行分析。对芯片进行标准化,将2张芯片的数据调至同一个水平。
1.8 生物信息学分析 用GenBank注释基因,并将甲基化差异基因分别上传至DAVID数据库(http://david.abcc. ncifcrf.gov/home.jsp)进行基因类型(GENE ONTOLOGY, GO)分类,KEGG数据库进行信号传导通路的分类,以及MILANO网站(http://milano.md.huji.ac.il)进行文献检索。
2 结果
2.1 L9981、NL9980细胞株的基因组DNA 两组细胞抽取提纯后,琼脂糖凝胶电泳结果显示,基因组DNA条带清晰完整,长度约20 kDa,无降解,无蛋白质杂带(图1)。分光光度计结果显示L9981及NL9980 DNA的OD260/OD280的比值均在1.7-2.0之间,提示所提的DNA纯度高。
2.2 超声破碎后的L9981、NL9980细胞株的基因组DNA片段 对基因组DNA进行超声破碎后行凝胶电泳检测,L9981及NL9980 DNA电泳条带呈弥散状,片段长度在500 bp-1 300 bp之间(图2),当DNA片段长度在300 bp-1 300 bp之间时便于与Resi:MBD2b蛋白-sepharose-4B柱结合。
2.3 甲基化DNA 在普通凝胶电泳结果示L9981及NL9980 DNA电泳条带呈弥散条带,与基因破碎后的弥散条带大致相同,在300 bp-1 000 bp之间,在500 bp附近亮度最高(图3)。
2.4 芯片杂交及分析结果 图4所示芯片完整,无高信号和低信号的团块和划痕,芯片的中央、四个角及中线与四个边交点处的红色十字架及平均分布的红点显示完全且清楚,说明芯片的杂交、洗涤、扫描步骤质量良好。Cy3通常显示绿色,Cy5显示红色,当某位点在芯片上呈绿色,则表示Cy3信号强,提示该位点在L9981中表现为高甲基化;反之,当位点呈红色,则表示Cy5信号强,提示该位点在L9981中表现为低甲基化;而位点呈黄色则表示该位点在两个细胞株内无甲基化差异。由图4可见芯片整体呈黄色,意味着大部分的位点无差别,符合小部分位点甲基化程度变化的假设。
表 1 L9981中高甲基化和低甲基化基因数目Tab 1 The number of hypermethylated and hypomethylated genes in L9981
表 2 甲基化差异基因分类Tab 2 The gene ontology of the hypermethylated and hypomethylated genes in L9981
图5所示为标准化前后的M-A图,竖坐标0水平以上为上调基因,0水平以下为下调基因。根据文献[12],我们取Cy3/Cy5>2,即竖坐标log2(Cy3/Cy5)>1表示在L9981中高甲基化的基因;Cy3/Cy5<0.5,即竖坐标log2(Cy3/Cy5)<-1表示在L9981中低甲基化的基因;而当Cy3/Cy5在0.5-2或log2(Cy3/Cy5)在-1-1之间时,表明该基因在L9981及NL9980中无甲基化差异。通过分析,芯片中共显示29 369个甲基化位点,其中19 369个为已知基因CpG岛。其中大部分基因的Cy3/Cy5比值在0.5-2之间,我们认为这些基因在L9981和NL9980之间无甲基化差异,这与芯片扫描图及M-A plot的结果一致。这些无甲基化差异的基因包括nm23-H1基因。只有少量的基因出现了甲基化的差异(表1)。在L9981细胞株中有1 552个高甲基化DNA片断,涉及735个基因,其中包括656个已知基因及79个未知基因。低甲基化DNA片段1 787个,涉及809个基因,其中698个已知基因片段及111个未知基因。
2.5 基因筛选结果 在这些差异基因中无nm23,表示nm23基因在这两个细胞株中无甲基化状态差异。通过GO分类我们发现:这些差异甲基化基因主要集中在细胞生物进程及其调节、代谢及其调节、基因表达、信号传导、细胞通讯、细胞运动、细胞粘附及血管生成等相关的基因,其中基因分类及基因数目的部分结果见表2。通过MILANO对这些差异基因进行文献检索,选出我们感兴趣的基因。高转移潜能细胞株L9981抑癌基因CDKN2A(p16)、RUNX3、HOXA5、PPP2CA、APC2等呈高甲基化,而癌基因Bcl-2、BMI1呈低甲基化。
图 1 L9981和NL9980细胞株基因组DNA凝胶电泳图Fig 1 Gel electrophoresis of genome DNA of L9981 and NL9980
图 2 L9981和NL9980细胞基因组DNA超声破碎后凝胶电泳图Fig 2 Gel electrophoresis of DNA frangments of L9981 and NL9980 by sonication
图 3 甲基化DNA的PCR扩增Fig 3 PCR amplification of methylated DNA
图 4 芯片图片。A:芯片扫描的全景图;B:质控部分的放大图,可以清晰看到中央十字及四角红点。Fig 4 The picture of chip. A: The scanning picture of chip; B: The enlarged picture of quality parts, in which red cross in center and red pots in corner are clear.
图 5 标准化前后的M-A图Fig 5 The M-A plot before and after the normalization
表2所示,大部分甲基化差异基因参与了信号通路的传导,经KEGG进行信号途径的分析,结果发现这些信号途径主要包括:细胞粘附因子、MAPK信号通路、WNT信号通路、TGF-β信号通路等。细胞粘附因子在L9981中主要呈低甲基化,而涉及MAPK、WNT、Notch、Hedgehog通路的基因在L9981中主要呈现高甲基化(表3)。
3 讨论
异常甲基化是肿瘤的发生发展的重要原因,主要表现在抑癌基因的高甲基化及全基因组、癌基因的低甲基化[13,14]。我们的研究发现在L9981细胞株中有1 552个高甲基化DNA片断,涉及735个基因,其中包括656个已知基因及79个未知基因。低甲基化DNA片段1 787个,涉及809个基因,其中698个已知基因片段及111个未知基因。通过DAVID对这些已知基因进行分析,发现它们主要涉及细胞生物进程及其调节、基因表达、信号传导、细胞通讯、细胞运动、细胞粘附及血管生成等,与肿瘤转移关系密切。其中抑癌基因CDKN2A(p16)、RUNX3、HOXA5、PPP2CA、APC2在L9981中为高甲基化,提示他们可能在L9981中表达缺失或下降。而癌基因Bcl-2、BMI1则在L9981中呈低甲基化,提示他们可能在L9981中过表达。因此我们推测,抑癌基因的高甲基化及癌基因的低甲基化可能是L9981具有更强侵袭及克隆能力的原因。并推测,在L9981中呈高甲基化的基因功能未明或未知基因可能为潜在的肿瘤抑制基因或肿瘤转移抑制基因,但尚需进一步证实。
表 3 高转移大细胞肺癌细胞株L9981中甲基化差异基因参与的信号传导通路Tab 3 The signal transduction of the hypermethylated and hypomethylated genes in L9981 lung cancer cell line
信号传导通路的激活与肿瘤的发生发展密切相关[15]。通过GO分类我们发现两株细胞间大部分的差异甲基化基因参与了信号传导通路,其中与信号通路有关的高甲基化的基因为153个,低甲基化的基因为172个。将这些基因上传至KEGG进行分析发现这些基因涉及细胞粘附因子、MAPK信号通路、WNT信号通路、TGF-β信号通路、p53信号通路。在L9981中,大部分通路的负向调节基因呈现高甲基化,而正向调节基因呈低甲基化。其中WNT通路中负向调节基因SFRP2、SFRP4、SOX17及RUNX3、APC2、PPP2CA等在高转移潜能的细胞株L9981中表现为高甲基化,而正向调节基因LRP5、TBL1X则为低甲基化。通过GO分类及MILANO文献检索,我们发现在L9981中MAPK信号通路、TGF-β信号通路、p53信号通路均存在负向调节基因的高甲基化及正向调节基因的低甲基化,而Hedgehog及Notch信号通路主要表现为负向调节基因的高甲基化。同时值得一提的是,参与细胞粘附分子通路的基因则以低甲基化为主,其中CDH2、ICOSLG、MAG、MPZL1、NLGN1、NRCAM、NRXN2、SDC2在L9981细胞株中表现为低甲基化,而CDH4、CNTNAP2表现为高甲基化,这些基因参与上皮间质转化(epithelial-mesenchymal transitions, EMT)过程[16,17]。而后者为肿瘤浸润转移的重要环节。甲基化在EMT中扮演的作用尚需进一步研究。
肿瘤的侵袭和转移是多因素、多步骤共同作用的结果,DNA甲基化是其中一个因素。运用高通量的基因芯片,我们发现在不同转移潜能的人大细胞肺癌株中甲基化差异基因涉及细胞生物进程及其调节、基因表达、信号传导、细胞通讯、细胞运动、细胞粘附及血管生成等。同时我们注意到在L9981中信号通路负向调节基因的高甲基化及正向调节基因的低甲基化可能促使信号传导通路的开放而促进转移。由于芯片信息量大且受方法学限制,我们尚需对结果进行进一步的挖掘及验证。