APP下载

应用全基因组甲基化芯片筛选结直肠腺瘤基因启动子区甲基化标志物

2022-02-17何纯刚黄沁园钟世彪陈利生肖和卫

中国临床新医学 2022年1期
关键词:甲基化腺瘤标志物

何纯刚, 黄沁园, 钟世彪, 陈利生, 肖和卫, 李 雷

结直肠腺瘤性息肉(colorectal adenomatous polyps,CAP)是结直肠癌的癌前病变,其癌变过程涉及多基因、多阶段的变化。研究结直肠腺瘤的发生、发展及癌变机制具有重要意义。研究表明DNA甲基化在肿瘤的发生、发展和转移中起重要的作用,然而基因甲基化在结直肠腺瘤中的作用机制尚未完全明确。本课题组前期研究采用全基因组甲基化芯片分析了结直肠腺瘤低甲基化谱,并筛选出低甲基化标志物,但尚未对基因启动子区差异甲基化基因状况进一步阐述。鉴此,本研究旨在对结直肠腺瘤基因启动子区甲基化标志物进行筛选,为进一步研究结直肠腺瘤的发生、发展机制及早期诊断提供依据。

1 对象与方法

1

.

1

研究对象 选择2013年1月至2014年12月在广西壮族自治区人民医院及广西医科大学第一附属医院住院的进展期结直肠腺瘤患者9例(腺瘤组),男4例,女5例,中位年龄53岁;病变部位为结肠7例,直肠2例;病理类型:绒毛状腺瘤2例,管状绒毛状腺瘤3例,管状腺瘤4例,术后病理证实均无癌变。另选择经肠镜排除炎症性肠疾病、癌前病变及癌的患者20例作为对照组,男9例,女11例,中位年龄60岁。所有研究对象知情同意参与,研究获得医院伦理委员会批准(科研国自-2013-017号)。

1

.

2

DNA提取及亚硫酸氢盐修饰转化 腺瘤组于内镜下切除结直肠腺瘤标本(直径≥2 cm),对照组取结直肠黏膜标本(结肠黏膜13例,直肠黏膜7例)。组织DNA的提取严格按照QIAamp DNA mini kit(Qiagen,Hidden,Germany)试剂盒说明书进行。提取到的DNA质量检测、定量、DNA亚硫酸氢盐修饰转化按照Zymo EZ DNA Methylation kit试剂盒(Zymo Research,CA,USA)说明书进行。

1

.

3

450K甲基化芯片分析 所有经亚硫酸氢盐修饰的DNA样本均采用450K甲基化芯片(Illumina,San Diego,CA,USA)分析,操作严格按照说明书进行。每个样本重复3次,芯片应用Illumina HiScan SQ scanner(Illumina,San Diego,CA,USA)进行扫描。具体操作由上海欧易生物医学科技有限公司协作完成。

1

.

4

数据分析

1.4.1 原始数据处理 应用genomestudio(genomestudio software 2011.1,Illumina)软件进行芯片原始数据的提取、质量控制分析、校正。每个CpG位点的甲基化程度用AVG_Beta值(数值为0~1)来表示,Δβ代表腺瘤组与对照组CpG位点的差异甲基化程度(数值为-1~1)。Δβ>0.17判定为高甲基化,Δβ<-0.17判定为低甲基化。Δβ绝对值越大,其差异甲基化程度越高。根据初步筛选结果,进一步缩小筛选范围,将Δβ值设为≥|0.4|进行二次筛选。对筛选出来的低甲基化标志物在基因组中的分布进行描述性分析。

1.4.2 进展期结直肠腺瘤基因启动子区差异甲基化谱分析 根据Δβ值初步筛选出启动子区差异甲基化标志物(包括TSS1500、TSS200、5′UTR及1st exons)。对筛选出来的标志物分布情况进行描述性分析。

1.4.3 基因启动子区差异甲基化标志物的功能分析应用DAVID在线分析方法(https://david.ncifcrf.gov/home.jsp),对差异的启动子区甲基化位点对应的基因进行GO分析及KEGG_Pathyway分析。GO包括三大功能注释类别:生物过程、细胞成分、分子功能。通过KEGG_Pathyway分析差异甲基化标志物可能参与的信号通路。通过GO分析,统计每个GO条目中所包括的差异基因个数,并用统计检验的方法计算每个GO条目中差异基因富集的显著性。计算的结果会返回一个富集显著性的

P

值,

P

<0.05表示差异基因在该GO条目中出现了富集。通过KEGG_Pathyway分析,统计每个信号通路条目中所包括的差异基因个数,并用统计检验的方法计算每个信号通路条目中差异基因富集的显著性,

P

<0.05提示差异基因在该信号通路中出现富集,可能参与了该信号通路的作用。根据GO分析及KEGG_Pathyway分析的结果结合生物学意义从而挑选用于后续研究的基因。

2 结果

2

.

1

进展期结直肠腺瘤启动子区差异甲基化基因筛选结果 450K甲基化芯片共可检测的甲基化位点为485 577个,根据Δβ值≥|0.17|,整个基因组中共发现65 535个(13.50%)差异甲基化标志物。在基因启动子区(包括TSS1500、TSS200、5′UTR及1st exons)共发现22 160个(33.81%)差异甲基化标志物,见图1。启动子区高甲基化标志物12 795个(57.74%),低甲基化标志物9 365个(42.26%),高甲基化位点在TSS200、5′UTR及1st exons中均明显高于低甲基化位点,见图2。进一步将Δβ值设为≥|0.4|,在基因启动子区共发现1 870个差异甲基化标志物,分别为1 524个启动子高甲基化标志物和346个启动子低甲基化标志物,其中包含929个启动子差异甲基化基因。根据Δβ值进行排名,其中腺瘤组启动子区差异(高/低)甲基化程度排名前20位的基因见表1。

图1 结直肠腺瘤中差异甲基化标志物在基因结构中的分布图

图2 结直肠腺瘤中差异(高/低)甲基化标志物在启动子中的比较图

表1 启动子区差异甲基化程度排名前20位基因

启动子高甲基化相关基因启动子低甲基化相关基因LRRC4,NPY,DCLK1,CLIP4,PRKAR1B,ZNF542,FLI1,LOC389333,ITGA4,GATA5,KHDRBS2,FAM115A,CNRIP1,PTPRT,GAS1,CD34,MIR34B,BTG4,MIR34C,KCNIP4OR2M3,CHRM2,C7orf16,MACROD2,POLD3,HPVC1,LRRIQ4,TNR,OR56A1,TCN1,SVIL,ACMSD,SEC23B,SMAD3,C7orf66,SPAG4L,RBMXL2,KRT20,ANXA2,PIGB

2

.

2

GO分析及KEGG_Pathyway分析结果 对929个启动子差异甲基化基因进行GO分析及KEGG_Pathyway分析。GO分析结果显示,在生物过程功能注释类别中,差异甲基化基因主要富集前5位的条目有:化学性突触传递、神经系统发育、细胞外基质组织、细胞命运确定和细胞黏附。在分子功能注释类别中,差异甲基化基因主要富集前5位的条目有:细胞外基质结构成分、RNA聚合酶Ⅱ调控区序列特异性DNA结合、序列特异性DNA结合、转录因子活性、HMG盒域绑定。在细胞成分功能注释类别中,主要富集前5位的条目有:质膜、蛋白质类细胞外基质、质膜的组成成分、突触后膜、细胞连接。见表2。KEGG_Pathyway分析结果显示,启动子差异甲基化基因主要参与了神经活性的配体-受体相互作用、尼古丁成瘾、钙信号通路、胆碱能突触和ECM-受体相互作用等信号转导通路。见表3。

表2 进展期结直肠腺瘤中启动子差异甲基化标志物GO分析结果

注释类别 注释条目基因数目PFDR生物过程化学性突触传递34<0.001<0.001神经系统发育33<0.001<0.001细胞外基质组织26<0.001<0.001细胞命运确定12<0.001<0.001细胞黏附42<0.0010.016分子功能 细胞外基质结构成分18<0.001<0.001RNA聚合酶Ⅱ调控区序列特异性DNA结合31<0.001<0.001序列特异性DNA结合53<0.001<0.001转录因子活性77<0.001<0.001HMG盒域绑定8<0.001<0.001细胞成分 质膜266<0.001<0.001蛋白质类细胞外基质41<0.001<0.001质膜的组成成分107<0.001<0.001突触后膜31<0.001<0.001细胞连接47<0.001<0.001

表3 进展期结直肠腺瘤中启动子差异甲基化基因KEGG_Pathyway分析结果

代谢通路条目基因数目PFDR神经活性的配体-受体相互作用37<0.001<0.001尼古丁成瘾12<0.001<0.001钙信号通路22<0.0010.028胆碱能突触15<0.0010.310ECM-受体相互作用13<0.0010.013

3 讨论

3

.

1

结直肠癌是全球第3大最常见的癌症类型,也是癌症相关死亡的第3大原因。近年来,结直肠癌的发病率呈上升趋势,其发病率已排在第3位,因此,做好结直肠癌的早期防治工作有重要意义。研究表明,“正常-腺瘤-癌-癌转移”是散发性结直肠癌发生、发展的主要路径,至少有80%的结直肠癌由结直肠腺瘤演变而来。由于腺瘤发展为癌一般需要7~10年的时间,因此,患者有机会发现和切除晚期腺瘤或早期结直肠癌,而识别与腺瘤风险相关的新基因可能有助于更好地理解癌变途径,从而改进结直肠癌的筛查和预防工作。

3

.

2

DNA甲基化在肿瘤的发生、发展、转移中起重要的作用。启动子甲基化是肿瘤抑制基因表观遗传学改变最常见的类型之一,在某些情况下,它是肿瘤抑制基因失活的机制。启动子高甲基化可以影响多种细胞通路,在肿瘤的发生、发展中起重要作用。DNA异常甲基化(包括高甲基化及低甲基化状态)在结直肠腺瘤及癌中广泛存在,许多异常甲基化基因被发现,提示基因表观遗传的改变作为频发的早期事件可能影响了结直肠腺瘤向癌转变,同时也可能成为早期诊断的标志物。CpG岛甲基化(CpG island hypermethylation,CIMP)目前被认为是锯齿状通路的主要发生机制,约15%的散发性结直肠癌由此途径进展而来。

3

.

3

近年来发展的甲基化芯片研究技术在甲基化检测过程中已经体现出了高通量检测的优越性,基于各种原理设计的芯片为实现从整个基因组到多个已知特异性基因或甲基化位点的定性、定量检测奠定了基础。应用芯片技术这个高通量手段检测基因组的甲基化,大大提升了研究效率,为揭示肿瘤的发生发展机制、诊断、预防和治疗提供了有效工具。目前,基因甲基化芯片已广泛应用于各种肿瘤的研究。采用全新的基因组甲基化检测方法,有利于全面分析结直肠腺瘤甲基化谱,更进一步揭示其在结直肠腺瘤及癌变过程的作用机制,同时新发现的甲基化标志物具有用于腺瘤及结直肠癌早期诊断的潜力。在本课题组的前期研究中,我们应用450K甲基化芯片及生物信息学技术对结直肠腺瘤低甲基化状态进行了分析,共筛选出18个低甲基化基因标志物,这些低甲基化标志物主要位于基因间隔区,但在结直肠腺瘤启动子区异常甲基化状态尚未阐明,故本研究就此进行了补充。

3

.

4

抑癌基因启动子异常甲基化是最重要的甲基化事件之一,往往导致抑癌基因的沉默,在癌的发生、发展中起重要作用。本研究通过芯片数据结合生物信息学的分析方法,重点研究了基因启动子区甲基化状态,在基因启动子区共发现1 870个差异甲基化标志物,其中1 524个为高甲基化标志物,346个为低甲基化标志物,其中包含929个启动子差异甲基化基因。在前20位启动子高甲基化基因中有15个基因有相关文献报道,其中10个基因在肠癌中检测发现,另5个基因在腺瘤中检测发现。在前20位启动子低甲基化基因中有7个基因有相关文献报道,其中有5个基因在肠癌中检测发现,有4个基因在腺瘤中检测发现。提示在结直肠腺瘤整个基因组中,启动子区高甲基化状态较低甲基化状态更多见,同时也提示腺瘤中基因启动子高甲基化可能是导致该基因失活的关键,并参与了“腺瘤-癌”的早期转变过程。本研究对929个基因进行了GO、KEGG_Pathyway分析,结果发现,差异甲基化基因涵盖了许多不同的功能群落。GO分析结果显示,启动子差异甲基化基因主要在化学性突触传递、神经系统发育、细胞外基质组织、细胞外基质结构成分、RNA聚合酶Ⅱ调节区序列特异性DNA结合、序列特异性DNA结合、质膜、蛋白质类细胞外基质、质膜的组成成分等注释条目中出现富集。KEGG_Pathyway分析结果显示,启动子差异甲基化基因主要参与了神经活性的配体-受体相互作用、尼古丁成瘾、钙信号通路、胆碱能突触、ECM-受体相互作用等信号转导通路。表明在进展期腺瘤的发展过程,是多种类型基因参与,多种信号转导通路共同调控的,其具体机制有待进一步深入研究。

综上所述,通过甲基化芯片分析及生物信息学分析方法发现,大量基因启动子甲基化状态在结直肠腺瘤中发生了改变,其可能参与了结直肠腺瘤的发生、发展过程,为进一步探讨结直肠腺瘤发病机制及早期诊断提供新的思路和线索。

猜你喜欢

甲基化腺瘤标志物
炎性及心肌纤维化相关标志物在心力衰竭中的研究进展
一种肿瘤甲基化谱纯化的统计方法朱宜静
超声检查在甲状腺腺瘤诊断中的应用价值探析
多项肿瘤标志物联合检测在健康体检中的应用价值
甲状腺腺瘤的类型有哪些?
肿瘤标志物的认识误区
DNA甲基化跨代遗传取得新进展(2020.6.11 中国科学院)
老年前列腺癌与DNA甲基化研究进展
松属素与甲基化—β—环糊精的分子识别研究
乳腺纤维腺瘤的那些事