转录组测序分析糖尿病对小鼠AOM/DSS诱导结直肠癌发生的影响
2020-05-25田旷怡林志玲许稷豪于涛陈其奎黎洁瑶
田旷怡?林志玲?许稷豪?于涛?陈其奎?黎洁瑶
【摘要】目的 探討糖尿病(DM)对小鼠化学诱导结直肠癌发生的影响。方法 采用氧化偶氮甲烷/葡聚糖硫酸钠诱导db/db小鼠和野生型(WT)小鼠产生结直肠癌,通过Illumina高通量测序技术筛选DM组与非DM组小鼠结肠肿瘤癌旁组织之间的差异表达基因,并对差异表达基因进行基因本体(GO)、京都基因与基因组百科全书(KEGG)功能注释与富集分析。结果 与WT小鼠相比,DM小鼠结直肠的平均肿瘤体积增加(P < 0.05)。DM小鼠与WT小鼠共有1656个差异表达基因(q < 0.05),其中有70个mRNA在整个实验过程中均差异表达,主要组织相容性复合体(MHC) Ⅱ类基因包括H2-Ea-ps、H2-Q1、H2-DMb2、H2-Q4均在DM小鼠中表达上调(q < 0.05)。GO富集分析发现免疫反应的调控和激活途径、抗原加工与提呈途径、抗原结合是显著富集的类型(q < 0.05)。KEGG富集分析发现与免疫反应相关的抗原加工与呈递是显著富集的类型(q < 0.05)。结论 DM状态下,小鼠免疫反应激活,MHC Ⅱ类基因表达存在显著差异,可能参与促进结直肠癌的发生发展。
【关键词】糖尿病;结直肠癌;小鼠模型;高通量测序
Transcriptomic high-throughput sequencing of AOM/DSS-induced colorectal carcinogenesis in mouse models with diabetes mellitus Tian Kuangyi, Lin Zhiling, Xu Jihao, Yu Tao, Chen Qikui, Li Jieyao. Department of Gastroenterology, Sun Yat-sen Memorial Hospital, Sun Yat-sen University, Guangzhou 510120, China
Corresponding author, Li Jieyao, E-mail: lijieyaoxh@ qq. com
【Abstract】Objective To investigate the effect of diabetes mellitus (DM) on the chemically-induced colorectal carcinogenesis in mouse modsels. Methods Both db/db (DM) and wild-type (WT) mice were treated with AOM/DSS to induce colorectal carcinogenesis. The differentially expressed genes between the DM-CRC group and the WT-CRC group were identified using Illumina Hiseq sequencing systems. The functional enrichment analysis was mapped in gene ontology (GO) and Kyoto encyclopedia of genes and genomes (KEGG) pathway databases. Results Compared with the WT mice, DM mice presented with significantly enhanced average tumor volume (P < 0.05). A total of 1656 mRNAs were differentially expressed (all q < 0.05) between DM and WT mice, and 70 mRNAs were differentially expressed throughout the whole experiment. Major histocompatibility complex (MHC) classⅡ genes including H2-Ea-ps, H2-Q1, H2-DMb2 and H2-Q4 were all significantly up-regulated in DM mice (all q < 0.05). GO enrichment analysis demonstrated that regulation and activation of immune response, antigen processing and presentation, and antigen binding were significantly enriched (all q < 0.05). The KEGG pathway enrichment analysis revealed that the DEGs were significantly associated with antigen processing and presentation (q < 0.05). Conclusion Immune response can be activated in DM mice. The MHC classⅡ genes are significantly differentially expressed, which probably promotes the incidence and progression of colorectal cancer under DM state.
【Key words】Diabetes mellitus;Colorectal cancer;Mouse model;High-throughput sequencing
中国约有1.164亿人口患有糖尿病(DM),居世界首位[1]。近年来,大量研究认为DM与结直肠癌(CRC)之间有着密切的联系,DM患者尤其是2型DM(T2DM)患者较非DM人群的CRC发病风险大幅升高[2-3]。癌旁组织常被用作肿瘤研究中的正常对照,也有研究表明,毗邻肿瘤的癌旁组织在转录组和表观遗传学等方面亦有畸变,可被用于研究肿瘤发生发展及机制变化[4-5]。本课题组前期实验对致癌剂氧化偶氮甲烷(AOM)合并促炎剂葡聚糖硫酸钠(DSS)在小鼠模型上诱导CRC形成进行探索,并发现2循环的DSS饮水可得到成本/效益较佳的实验结果;此外,我们发现与人类相似,T2DM小鼠的CRC成瘤效率高于非DM小鼠[6]。然而,DM与CRC之间的协同机制尚不完全清楚,深入探索DM并发CRC的机制有助于早期防治,改善患者预后,减轻社会负担。本研究拟通过Illumina高通量测序技术检测DM组及正常组小鼠的结肠癌旁组织中转录组的表达,筛选差异表达基因并进行差异表达基因的基因本体(GO)、京都基因与基因组百科全书(KEGG)功能注释与富集分析,以期为DM状态下AOM/DSS诱导的小鼠CRC发生发展的机制或潜在药物治疗靶点提供科学研究基础。
材料与方法
一、主要试剂和动物
AOM(Sigma,美国),DSS(MP Biomedicals,美国)。C57BLKS/J-Leprem2Cd479/Nju(db/db)小鼠及其野生型对照C57BLKS/JNju(wild type,WT)小鼠,雄性,7周龄,各36只。小鼠均由南京集萃药康生物科技公司(南京,中国)提供,常规饲养于中山大学东校园实验动物中心,实验室环境温度为(23±3)℃,相对湿度为(55±15)%,昼夜明暗交替。所有有关动物的实验过程均在中山大学实验动物伦理委员会的监督指导下完成,符合实验动物伦理学要求。
二、DM小鼠CRC模型的建立及处理
1.建模及分组
db/db小鼠随机分为DM-CRC组及DM-Con组,WT小鼠随机分为WT-CRC组及WT-Con组,每组各18只小鼠。所有小鼠经适应性饲养1周后开始实验。CRC组均于第1周(W1)皮下注射10
mg/kg AOM,W2予2% DSS溶液自由饮用7 d,随后予正常饮用水2周。每1周DSS与2周正常饮用水为1个循环周期,共循环2次。Con组均于W1皮下注射0.1 ml/10 g生理盐水。各组分别于W7、W9、W11随机处死6只小鼠。
2.标本采集及肿瘤计数
小鼠经颈椎脱臼法处死,沿腹中线打开腹腔,剪取自回盲部至直肠的肠段,使用预冷的磷酸盐缓冲液(PBS)清洗肠道,沿长轴打开肠腔,仔细观察并触摸肠腔表面有无肿瘤形成。若发现肿瘤形成,观察记录肿瘤的数量、大小、位置,测量并记录每个肿瘤的最长径和垂直短径。留取毗邻肿瘤的癌旁组织保存于液氮中,以便后续实验使用。
按下述公式计算肿瘤体积、肿瘤发生率、平均成瘤数量和荷瘤小鼠平均成瘤数量:肿瘤体积 =(最长径×垂直短径2) / 2;成瘤小鼠占比= 荷瘤小鼠数量/实验小鼠数量;平均成瘤数量 = 肿瘤数量/实验小鼠数量;荷瘤小鼠平均成瘤数量 = 肿瘤数量/荷瘤小鼠数量。
三、Illumina高通量测序
DM-CRC组及WT-CRC组分别于W7、W9、W11各随机抽取3只小鼠。取小鼠结肠癌旁组织提取得到RNA,进行RNA质检、完整性等分析合格后,进行文库构建。去除rRNA、进行mRNA纯化后将RNA片段化;一链、二链cDNA合成;3末端腺苷酸化、连接测序接头;PCR扩增;Agilent 2100生物分析仪(Agilent Technogies,美国)定量cDNA文库;DNA成簇扩增;于HiSeq2500测序仪(Illumina, 美国)进行高通量测序。
四、测序数据分析
测序得到的原始图像文件经碱基识别、误差过滤、除接头序列、低质量片段等过滤方法,得到可用于数据分析的clean reads。应用Hisat2(version:2.0.4)的spliced mapping算法对clean reads进行转录组测序数据的基因组比对,估计基因表达的水平[7]。但由于reads数除与基因表达水平成正比外,还与基因本身的长度、测序的数据量有关。为了使不同基因、不同样本间的基因表达水平具有可比性,应用Stringtie(version:1.3.0)对Hisat2比对后每个基因的片段数进行计数,再使用M值的加权截尾均值(TMM)法进行数据的归一化,最后利用perl脚本计算出每个基因的每千个碱基的转录每百万映射读取的片段(FPKM)值,进行基因表达量的标准化[8-11]。
使用FPKM计算转录本表达量,并计算不同基因在不同组间的差异表达倍数。应用edgeR进行样本间的差异基因分析,对P值进行多重假设检验校正,通过控制错误发现率以决定P值的阈值,得到校正后的P值,亦即q值[12-14]。根据q < 0.05筛选出不同组之间的差异表达基因。得到差异表达基因后,采用R语言、cluster、Cytoscape、David等软件进行聚类分析,得到聚类分析热图、火山图。
GO是基因本体联合会建立的数据库(http://geneontology.org),使用了规范化的术语描述基因和基因产物的特性。对细胞组分、分子功能和生物过程3个层次上对应的差异基因数目进行统计,并把所挑选的差异表达基因向GO数据库的各个条目映射,计算每个条目的基因数目。应用超几何分布进行假设检验,得到富集结果的P值,P值越低则富集结果越显著,进而筛选出富集程度高的基因,从而对差异表达基因进行GO功能分析。同理,使用整合分子互动网络的KEGG Pathway數据库(https://www.genome.jp/kegg/pathway.html)对各个信号通路上的差异表达基因数目和富集情况进行KEGG Pathway分析。
五、统计学处理
采用SPSS 20.0分析。正态分布的定量资料用表示,非正态分布的定量资料用中位数(四分位数间距)表示;成瘤小鼠占比的比较使用Fisher确切概率法。2组非正态分布的定量资料的比较用Mann-Whitney U检验,多组非正态分布的定量资料的比较用Kruskal-Wallis法。α=0.05,两两比较用Bonferroni法,即P < 0.05 /比较次数为差异有统计学意义。
结果
一、DM状态对小鼠CRC形成的影响
WT-CRC组小鼠的成瘤小鼠占比均随暴露时间的增加而增加(P < 0.05/3,表1);WT-Con组小鼠均未形成肿瘤。在W7和W11之间,DM-CRC
组小鼠的平均成瘤数量和荷瘤小鼠平均成瘤数量比较差异均有统计学意义(P < 0.05/3,表1);WT-CRC组差异则未见统计学意义(P > 0.05/3,表1)。WT-CRC组与DM-CRC组小鼠的平均肿瘤体积在W7和W11、W9和W11比较差异均有统计学意义(P < 0.05/3,表1)。此外,在W11,DM小鼠的平均肿瘤体积远远大于WT小鼠(P < 0.05,表1)。
二、测序数据质控
各组小鼠结肠癌旁组织的RNA电泳条带明亮清晰,泳道无弥散区,未见蛋白和DNA污染(图1A);RNA完整值(RIN)接近10,28S/18S≥1.5(表2);检测峰图基线较平整(图1B)。提示样本质量和纯度较好,质检结果合格,进行Illumina高通量测序。
三、差异表达基因筛选与聚类
根据q≤0.05筛选差异表达基因,进行聚类分析,并绘制热图及火山图。可见组内表达相似的基因聚类后出现在同一簇中,DM-CRC组与WT-CRC组共有1656个差异基因(图2)。DM-CRC组与WT-CRC组相比,在W7有210个mRNA差异表达,其中112个上调,98个下调(图3A);在W9有604个mRNA差异表达,其中136个上调,468个下调(图3B);在W11有1237个mRNA差异表达,其中522个上调,715个下调(图3C)。综合上述所有差异表达基因,共有70个mRNA在整个实验过程中差异表达(图3D),其中43个上调,包括MHCⅡ类基因:H2-Ea-ps(qW7 = 2.50×10-59,
qW9 = 3.31×10-38,qW11 = 3.53×10-59)、H2-Q1(qW7 = 5.68×10-11,qW9 = 2.91×10-14,q W11 = 2.00×10-6)、H2-DMb2(qW7 = 1.01×10-2,qW9= 3.12×10-2,qW11 = 1.65×10-6)、 H2-Q4(qW7 =6.17×10-5,qW9 = 4.78× 10-3,qW11 = 3.26×10-5);另有24个下调;3个有波动,在部分时间点上调,部分时间点下调。
四、GO功能显著性富集分析
对1656个差异表达基因的GO功能进行注释、分类并统计(图4)。结果显示,在生物过程分组,免疫反应的调控和激活途径、肽或多糖通过MHC Ⅱ类分子的抗原加工与提呈途径、包括多肽抗原在内的抗原加工与提呈途径是显著富集的类型(q < 0.05);在分子功能分组,MHC Ⅰ类蛋白复合物和血浆膜蛋白复合物是显著富集的类型(q < 0.05);在细胞组分分组,包括多肽在内的抗原结合、丝氨酸类型的肽酶、内肽酶及水解酶活性、酰胺类物质的结合是显著富集的类型(q < 0.05)。
五、KEGG Pathway显著富集分析
结合1656个差异表达基因的KEGG功能注释结果进行KEGG Pathway显著性富集分析,并选取富集度最高的前30个条目进行分類统计。结果显示与免疫反应相关的抗原加工与呈递、移植排斥反应、移植物抗宿主病、自身免疫性甲状腺疾病等方向显著富集(q < 0.05,图5)。
讨论
在T2DM患者中,约有10%的患者合并CRC,且初次诊断时大多处于中晚期,患者预后不够理想[15-16]。因此,我们需要更多的研究来寻找DM状态下CRC发生发展前期的分子机制变化。AOM可通过诱导基因突变损伤,进而促进啮齿类动物CRC的形成;在其基础上加用DSS,可诱导肠上皮的慢性炎症状态,加快建模效率[17]。db/db小鼠先天具有高血糖和高脂血症,是一种常用的T2DM小鼠模型[18]。参考本课题组的前期实验,我们本次使用AOM联合2循环DSS,诱导DM小鼠及WT小鼠形成CRC[6]。通过对小鼠成瘤情况的评估,发现在W11,DM小鼠的平均肿瘤体积远远大于WT小鼠,提示DM状态可促进小鼠CRC的发生,与人类的DM与CRC之间的协同机制相一致,对该模型进一步的研究或可为DM合并CRC的机制及潜在的药物治疗靶点提供参考依据。
癌旁组织在临床实验中常被用作肿瘤的正常对照,然而近年来已有多项研究发现,尽管毗邻肿瘤的癌旁组织在大体上未见异常,病理观察下可能已发生组织异常增生,并在分子水平较无肿瘤的正常组织发生改变,可用于研究肿瘤发生发展早期的分子变化[4-5, 19-21]。转录组测序是指利用以Illumina高通量测序为代表的二代测序技术,对组织或者细胞中所有mRNA反转录生成的cDNA序列进行测序,全面快速获得细胞或组织在特定时期内的几乎所有转录本序列信息,进而筛选差异表达基因,并对基因进行预测,为在分子水平寻找可能的生物标志物提供了极大的便利[22]。本实验通过获取成瘤小鼠毗邻肿瘤的癌旁组织,利用Illumina高通量测序分析,探讨DM对小鼠CRC发生的潜在病理机制。
我们通过实验得到差异表达mRNA共1656条,并发现70个mRNA在整个实验过程中均差异表达,其中MHC Ⅱ类基因包括H2-Ea-ps、H2-Q1、H2-DMb2、H2-Q4均在DM小鼠中表达显著上调。在GO生物过程分组上,免疫反应的调控和激活途径、肽或多糖通过MHC Ⅱ类分子的抗原加工与提呈途径、包括多肽抗原在内的抗原加工与提呈途径是显著富集的类型;在分子功能分组上,MHC Ⅰ类蛋白复合物是显著富集的类型;在细胞组分分组上,包括多肽在内的抗原结合是显著富集的类型。在KEGG Pathway显著性富集分析中,与免疫反应相关的抗原加工与呈递显著富集。
MHC Ⅱ类分子是免疫反应的关键介质之一,起着向CD4+ T淋巴细胞提呈经过加工的外源性抗原和诱发免疫反应的作用[23]。这些基因均具有高度的多态性,可影响功能性氨基酸的变化,并导致个体对抗原反应的差异[24]。结直肠由于持续暴露于外源性抗原,如食物、化学物质、细菌等,导致该处相对恒定的炎症状态,与其它器官相比,在MHC Ⅱ类基因表达方面具有显著差异[25]。此外,有学者发现,MHC Ⅱ类等位基因的高表达可提示结肠炎患者患CRC的风险增高[26]。
在对DM易感的个体,其先天性免疫系统被激活,炎症因子分泌增加,进而引起胰岛素抵抗、胰岛素分泌功能障碍和代谢综合征的发生[27]。而DM患者在持续高血糖的状态下,可损伤线粒体功能,增加活性氧产生,激活炎症介质与机体的免疫反应[28]。上述研究提示免疫炎症反应在DM和CRC的发病中均起着重要的作用。综合本次实验结果,我们认为,DM状态下CRC的发病风险增高,可能与生物体以MHC Ⅱ类基因为主的免疫反应激活有关;H2-Ea-ps、H2-Q1、H2-DMb2、H2-Q4这4个基因有望成为DM患者CRC诊治的靶点。
综上所述,我们探讨了AOM/DSS诱导小鼠产生CRC,发现DM可促进CRC的形成,显著增加小鼠的平均肿瘤体积;比较DM与WT状态下癌旁组织的差异表达基因,并对结果进行GO和KEGG分析,发现4个高表达的MHC Ⅱ类基因:H2-Ea-ps、H2-Q1、H2-DMb2、H2-Q4,为DM合并CRC的发病机制提供可靠的生物学标志物,并对其早期诊治提供可能的新靶点。
参 考 文 献
[1] International Diabetes Federation,IDF Diabetes Atlas, 9th edn. Brussels, Belgium: 2019.[2019-05-06] http://www.diabetesatlas.org.
[2] Tsilidis KK, Kasimis JC, Lopez DS, Ntzani EE, Ioannidis JP. Type 2 diabetes and cancer: umbrella review of meta-analyses of observational studies. BMJ,2015,350:g7607.
[3] Pearson-Stuttard J, Zhou B, Kontis V, Bentham J, Gunter MJ, Ezzati M. Worldwide burden of cancer attributable to diabetes and high body-mass index: a comparative risk assessment. Lancet Diabetes Endocrinol,2018,6(2):95-104.
[4] Heaphy CM, Griffith JK, Bisoffi M. Mammary field cance-rization: molecular evidence and clinical importance. Breast Cancer Res Treat,2009,118(2):229-239.
[5] Aran D, Camarda R, Odegaard J, Paik H, Oskotsky B, Krings G, Goga A, Sirota M, Butte AJ. Comprehensive analysis of normal adjacent to tumor transcriptomes. Nat Commun,2017,8(1):1077.
[6] 曾一文,黎潔瑶,田旷怡,于涛,许稷豪,陈其奎.通过AOM及AOM联合DSS建立C57BL/6J小鼠结肠癌诱导模型的对比研究.新医学,2018,49(10):720-725.
[7] Kim D, Langmead B, Salzberg SL. HISAT: a fast spliced aligner with low memory requirements. Nat Methods,2015,12(4):357-360.
[8] Pertea M, Pertea GM, Antonescu CM, Chang TC, Mendell JT, Salzberg SL. String Tie enables improved reconstruction of a transcriptome from RNA-seq reads. Nat Biotechnol, 2015,33(3):290-295.
[9] Pertea M, Kim D, Pertea GM, Leek JT, Salzberg SL. Transcript-level expression analysis of RNA-seq experiments with HISAT, String Tie and Ballgown. Nat Protoc,2016,11(9):1650-1667.
[10] Robinson MD, Oshlack A. A scaling normalization method for differential expression analysis of RNA-seq data. Genome Biol,2010,11(3):R25.
[11] Mortazavi A, Williams BA, McCue K, Schaeffer L, Wold B.Mapping and quantifying mammalian transcriptomes by RNA-Seq. Nat Methods,2008,5(7):621-628.
[12] Robinson MD, McCarthy DJ, Smyth GK. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics,2010,26(1):139-140.
[13] Benjamini Y, Hochberg Y. Controlling the false discovery rate: a practical and powerful approach to multiple testing. Royal Statistical Society, 1995,57(1):289-300.
[14] Benjamini Y , Yekutieli D . The control of the false discovery rate in multiple testing under dependency. The Annals of Stats, 2001, 29(4):1165-1188.
[15] 韩倩,杨岩,刘春水,王润超,侯俊杰,白欧. 2型糖尿病伴发恶性肿瘤664例临床分析.中国实验诊断学,2012,16(1):121-123.
[16] 卢瑜, 方勇, 王青青,潘宏铭. 糖尿病与恶性肿瘤关系的回顾性临床研究. 中华內分泌代谢杂志, 2010, 26(3):183-187.
[17] Neufert C, Becker C, Neurath MF. An inducible mouse model of colon carcinogenesis for the analysis of sporadic and inflam-mation-driven tumor progression. Nat Protoc,2007,2(8):1998-2004.
[18] Neelankal John A, Ram R, Jiang FX. RNA-seq analysis of islets to characterise the dedifferentiation in type 2 diabetes model mice db/db. Endocr Pathol,2018,29(3):207-221.
[19] Heaphy CM, Bisoffi M, Fordyce CA, Haaland CM, Hines WC, Joste NE, Griffith JK. Telomere DNA content and allelic imbalance demonstrate field cancerization in histologically normal tissue adjacent to breast tumors. Int J Cancer,2006,119(1):108-116.
[20] Trujillo KA, Heaphy CM, Mai M, Vargas KM, Jones AC, Vo P, Butler KS, Joste NE, Bisoffi M, Griffith JK. Markers of fibrosis and epithelial to mesenchymal transition demonstrate field cancerization in histologically normal tissue adjacent to breast tumors. Int J Cancer,2011,129(6):1310-1321.
[21] Gerweck LE, Seetharaman K. Cellular pH gradient in tumor versus normal tissue: potential exploitation for the treatment of cancer. Cancer Res,1996,56(6):1194-1198.
[22] 祁云霞,刘永斌,荣威恒.转录组研究新技术:RNA-Seq及其应用.遗传,2011,33(11):1191-1202.
[23] Stokkers PC, Reitsma PH, Tytgat GN, van Deventer SJ. HLA-DR and -DQ phenotypes in inflammatory bowel disease: a meta-analysis. Gut,1999,45(3):395-401.
[24] Howell WM, Calder PC, Grimble RF. Gene polymorphisms, inflammatory diseases and cancer. Proc Nutr Soc,2002,61(4):447-456.
[25] Ferguson LR, Shelling AN, Browning BL, Huebner C, Peter-mann I. Genes, diet and inflammatory bowel disease. Mutat Res,2007,622(1-2):70-83.
[26] Garrity-Park MM, Loftus EV Jr, Sandborn WJ, Bryant SC, Smyrk TC. MHC Class Ⅱ alleles in ulcerative colitis-associated colorectal cancer. Gut,2009,58(9):1226-1233.
[27] 朱大龙.炎症与2型糖尿病.中国糖尿病杂志,2006,14(1):73-74.
[28] 黄力,葛永纯.免疫炎症与糖尿病肾病.肾脏病与透析肾移植杂志,2019,28(3):247-251.
(收稿日期:2019-10-18)
(本文编辑:杨江瑜)