基于生物信息学从体质转化角度探讨 湿性体质的关键基因与通路
2021-07-28周宵魏彬彬唐标
周宵 魏彬彬 唐标
〔摘要〕 目的 通過生物信息数据挖掘,从体质转化角度进行差异分析,探讨湿性体质关键的生物学机制。方法 通过高通量基因表达数据库(gene expression omnibus data base, GEO)下载芯片“GSE140769”,将平和体质转变为湿性体质的前后血清高通量蛋白测序的结果进行筛选,获得12个显著差异蛋白;将湿性体质转变为平和体质前后的血清高通量蛋白测序的结果进行差异分析,得到14个显著差异蛋白,将其与平和体质转变为湿性体质的12个显著差异蛋白进行交叉比对,得到4个介导平和体质与湿性体质的关键差异蛋白。利用R语言、KOBAS 3.0、DAVID 6.8等生物信息分析工具对其进行注释分析。结果 平和体质转变为湿性体质的显著差异蛋白GO分析显示,主要参与了细胞质应激颗粒等细胞组成、神经体细胞调节等生物过程、受体配体活性等分子功能;通路分析显示,主要与淋巴细胞和非淋巴细胞介导的免疫相互作用以及MSP/RON信号通路有关;疾病分析主要与溃疡性结肠炎、慢性阻塞性肺疾病等相关。平和体质与湿性体质的4个关键差异蛋白(MSP、DPPII、Siglec-7、TREML1),分别在平和体质中下调,湿性体质中上调,进一步分析发现该4个蛋白主要介导了细胞的免疫应答与炎症反应,以及MSP/RON信号通路。结论 MSP、DPPII、Siglec-7、TREML1介导的免疫应答与炎症反应,以及MSP/RON信号通路可能是介导平和体质与湿性体质差异关键的生物学基础。
〔关键词〕 湿性体质;差异表达蛋白;关键蛋白;平和体质;生物学基础
〔中图分类号〕R211 〔文献标志码〕A 〔文章编号〕doi:10.3969/j.issn.1674-070X.2021.06.011
The Key Genes and Pathways of Dampness Constitution from the Perspective of Constitution Transformation Based on Bioinformatics
ZHOU Xiao, WEI Bingbing, TANG Biao*
(Medical School, Hunan University of Chinese Medicine, Changsha, Hunan 410208, China)
〔Abstract〕 Objective To explore the key biological mechanism of dampness constitution (DC) from the perspective of physique conversion by mining biological information data and analyzing the difference. Methods Chip “GSE140769” was downloaded through gene expression omnibus data base (GEO). The results of high-throughput protein sequencing before and after the transformation from balanced constitution (BC) to DC were screened, and 12 significant difference proteins were obtained; through the difference analysis of serum high-throughput protein sequencing results before and after the transformation from DC to BC, 14 significant difference proteins were obtained, which were cross compared with 12 significant difference proteins before and after the transformation from BC to DC, and 4 key difference proteins were obtained. R language, KOBAS 3.0, DAVID 6.8 and other bioinformatics analysis tools were used for annotation analysis. Results GO analysis of the significant difference proteins in the transformation from BC to DC showed that it was mainly involved in cell composition such as cytoplasmic stress particles, biological processes such as neural somatic cell regulation, and molecular functions such as receptor ligand activity; KEGG pathway analysis showed that it is mainly related to immune regulatory interactions between a lymphoid and a non-lymphoid cell and MSP/RON signaling pathway; disease analysis is mainly related to ulcerative colitis and chronic obstructive pulmonary disease. The four key differential proteins (MSP, DPPII, Siglec-7, TREML1) between BC and DC were down-regulated in BC and up-regulated in DC, and further analysis founded that the four proteins mainly mediate the cellular immune response and inflammation, and MSP/RON signaling pathway. Conclusion MSP, DPPII, Siglec-7, TREML1 mediated immune response and inflammation, and MSP/RON signaling pathway may be the key biological basis for the difference between BC and DC.
〔Keywords〕 differentially expressed proteins; key proteins; constitution; biological basis
体质禀承于先天,得养于后天,其形成因素是复杂的,个体体质并不是一成不变,而是相对稳定性和动态可变性的统一。体质在很大程度上由遗传决定,并且受到后天因素影响导致体内蛋白质的动态变化,监测体质蛋白动态变化,从蛋白水平去研究体质,对体质的诊断以及体质预测更有可行性[1]。
目前,认为体质类型在代谢、功能及结构都具有相应的生物学物质基础[2],而生物信息学是探索体质相关生物学基础的有效手段[3]。关于体质学的生物学基础研究大多从基因切入,而随着研究的深入发现基因组学存在着一定的局限性[4]。蛋白在通过辨识体质来预测易患疾病具有较大意义,但目前其相关研究较少,本文采用数据挖掘方法初次从体质转化的角度通过蛋白组学对湿性体质(痰湿体质或湿热体质)的相关的生物学基础进行了研究。
1 资料与方法
1.1 芯片信息
通过高通量基因表达数据库(gene expression omnibus data base, GEO;https://www.nc bi.nlm.nih.gov /geo/),进行条件检索:输入“dampness constitution”,将筛选条件限定为“homo sapiens”,确定适合本研究的芯片。
芯片选用标准:(1)测序血清来源于体质转变前后的血清,并将体质转变前后的血清蛋白谱进行差异分析,而非传统的平和体質患者与湿性体质患者不同个体组成的平和体质组或者湿性体质组进行组间血清差异蛋白分析;(2)仅为蛋白高通量测序芯片;(3)芯片平台包括蛋白类型和蛋白ID信息。
芯片样本信息:第一组包括4个平和体质个体转化为湿性体质前后血清蛋白表达谱,以及3个湿性体质个体转化为平和体质前后血清蛋白表达谱。第二组包含38个湿性体质个体血清蛋白表达谱和37个平和体质个体血清蛋白表达谱。其中,4个平和体质个体转变为湿性体质包括男2例、女2例,年龄(44.75±16.58)岁,体质量指数(25.36±3.45);3个湿性体质个体转变为平和体质包括男2例、女1例,年龄(56.00±27.84)岁,体质量指数(23.03±1.15)。
1.2 差异表达蛋白的分析与确定
GEO2R是GEO数据库提供的一个基于R语言的在线分析程序[5]。利用GEO2R分析“1.1”所获得的芯片“GSE140769”,将平和体质转变为湿性体质的前后血清蛋白表达谱(n=4)进行GEO2R在线分析,获取前250个差异蛋白信息;另外将湿性体质转变为平和体质的前后血清蛋白表达谱(n=3)进行GEO2R在线分析,获取前250个差异蛋白信息,根据筛选条件:P<0.05且|logFC|(fold charge, FC)>1,即差异倍数大于>2,该绝对值越大,差异表达越明显,正负分别代表上调与下调。
1.3 平和体质转变为湿性体质的显著差异蛋白GO功能分析
通过R语言中“clusterProfiler”包[6]对平和体质转变为湿性体质的显著差异蛋白进行基因本体(gene ontology, GO)分析,对这些差异蛋白介导的细胞组成(cellular component, CC),分子功能(mole?
cular function, MF),生物过程(biological process, BP)进行注释,以P<0.05为差异具有统计学意义。
1.4 平和体质转变为湿性体质的显著差异蛋白KEGG信号通路以及相关疾病富集分析
KOBAS是常用的通路与疾病富集分析的生物信息在线分析工具[7]。采用KOBAS 3.0(http://kobas.cbi.pku.edu.cn/kobas3)在线工具对平和体质转变为湿性体质的显著差异蛋白进行基因通路富集分析以及疾病富集分析。
1.5 体质关键差异蛋白的确定以及GO功能注释
利用韦恩图在线工具(http://bioinformatics.psb.ugent.be/webtools/Venn/)分别将平和体质转变为湿性体质的显著差异蛋白与湿性体质转变为平和体质的显著差异蛋白进行交叉比对,获得介导湿性体质与平和体质关键差异的蛋白。
利用David 6.8在线分析平台(https://david.ncifcrf.gov/)的Function Annotation模块,输入所获得的关键蛋白Uniprot ID,通过基因转换工具获得David 6.8可识别的ID从而进行GO功能注释,对体质关键蛋白介导的细胞组成、生物过程、分子功能进行相应的注释。
2 结果
2.1 芯片信息
根据“1.1”的芯片选入标准,筛选出符合要求的高通量抗体微阵列数据集合,即“GSE140769”。“GSE140769”属于GPL27785平台,本研究选取了第一组样本数据包括4个平和体质个体转变为湿性体质,3个湿性体质个体转变为平和体质,分别保留其体质转变前后的血清,通过半定量蛋白质组学阵列(GSH-CAAX00, RayBiotech, Inc., Peachtree Corners, GA,美国)测量1 000种独特人类蛋白质的抗体。芯片样本中湿性体质是痰湿体质与湿热体质的集合,体质的分类符合《中医体质分类与确定》标准[8]。
2.2 平和体质转变为湿性体质的显著差异蛋白以及GO功能分析
将4个平和体质(前)与湿性体质(后)血清蛋白进行GEO2R在线分析,logFC为湿性体质(后)/平和体质(前),根据方法中的筛选条件,得到表1。如表1所示:平和体质转变为湿性体质后,获得12个显著差异蛋白。其中,巨噬细胞刺激蛋白(macrophage
stimulating protein, MSP)、二肽基肽酶Ⅱ(dipeptidyl peptidase Ⅱ, DPP-Ⅱ)、唾液酸结合性免疫球蛋白样凝集素7(sialic acid-binding ig-like lectin 7, Siglec-7)、髓样细胞触发受体1(triggering receptors expressed on myeloid cells-l, TREML-1)等蛋白上調,Nestin、TAFA2、IGSF3等下调。
为了进一步探讨平和体质(前)与湿性体质(后)的显著差异蛋白介导的生物功能,对其进行GO分析。结果显示:细胞组成主要参与细胞质应激颗粒、多核糖体组成;分子功能以受体配体活性、丝氨酸肽酶活性为主;另外在生物过程中主要参与神经体细胞调节、干细胞增殖等。见图1。
2.3 平和体质转变为湿性体质的显著差异蛋白信号通路与疾病分析
平和体质(前)与湿性体质(后)的显著差异蛋白KEGG信号通路以及疾病分析如图2-3所示,其中信号通路中联系最为密切的分别是淋巴细胞与非淋巴细胞之间的免疫信号通路以及MSP/RON信号通路,疾病富集分析显示其与溃疡性结肠炎以及慢性阻塞性肺疾病等疾病密切相关。
2.4 湿性体质转变为平和体质的显著差异蛋白
同理将3个湿性体质(前)转变为平和体质(后)血清样本通过高通量抗体微阵列的分析结果,筛选要求同方法,得到14个平和体质的显著差异蛋白,可观察到在平和体质中GSTM1、HAO-1、Fgr等蛋白显著上升;而MSP、DPPII、Siglec-7等蛋白表达显著下降。见表2。
2.5 湿性体质与平和体质的关键差异蛋白
将平和体质(前)与湿性体质(后)的12个显著差异蛋白与湿性体质(前)与平和体质(后)的14个显著差异蛋白,通过韦恩图进行交叉比对,得到4个关键蛋白分别是MSP、DPPII、Siglec-7、TREML1,且这4个蛋白在平和体质转变为湿性体质后中显著上调,而在湿性体质转变为平和体质后中显著下调。见表3。
2.6 湿性体质与平和体质关键差异蛋白的GO功能注释分析
进一步GO功能注释显示MSP、DPPII、Siglec-7、TREML1参与的生物过程主要有炎症反应与细胞免疫应答反应,细胞组成主要是质膜、细胞外体等,介导的分子功能主要参与酪氨酸激酶受体活性激活、糖结合以及相关的受体活性,通路分析显示主要涉及到MSP/RON信号通路。见表4。
3 讨论
体质的转化体现了“体质的可调”,调控体质对于中医“治未病”有着重要意义[9],而目前鲜有关于体质转化的报道。不同于以往的组间差异分析,本文选取了相关体质转化前后的血清高通量抗体微阵列数据,获得了4个平和体质转变为湿性体质(痰湿体质或湿热体质)后的12个显著差异表达蛋白以及3个湿性体质转变为平和体质后的14个显著差异表达蛋白,另外通过交叉对比获得介导湿性体质与平和体质差异的关键蛋白,从蛋白水平对湿性体质分子生物学特征进行初步探索。
平和体质转变为湿性体质的显著差异蛋白GO分析与信号通路分析显示差异蛋白主要与淋巴、非淋巴细胞介导的免疫相互作用密切相关,这与目前关于湿性体质的生物学研究结果一致[10-11]。其次是MSP/RON信号通路,MSP/RON信号传导通路在炎症以及代谢中都发挥重要的作用[12]。MSP/RON通路的异常会促进肠道炎症的发生,增加了克罗恩病的发病风险[13]。而湿性体质是克罗恩病的易患体质类型[14-15],进一步提示MSP/RON信号通路可能是湿性体质关键的信号通路。另外,在代谢方面,MSP/RON信号通路介导的生理功能可以抑制肝脏的脂质代谢以及糖异生,其在肝脂质和葡萄糖代谢中具有潜在的有益作用,提示MSP可以作为维持代谢稳态的关键调节剂,为代谢综合征提供新的治疗靶点[16]。这为湿性体质在治疗代谢性疾病,实现精准个体化医疗提供了一个新的治疗方向,也为今后的调体干预药物的研发提供了新的靶点。
平和体质转变为湿性体质的显著差异蛋白疾病分析显示与多种疾病密切相关,其中以溃疡性结肠炎最为密切。朱微微等[17]关于不同中医体质类型与溃疡性结肠炎的Logistic回归分析结果表明痰湿质、湿热质与溃疡性结肠炎的患病率密切相关,痰湿质、湿热质是导致溃疡性结肠炎的主要危险因素。这与本文湿性体质显著差异蛋白疾病分析结果一致,进一步验证了湿性体质显著差异蛋白疾病富集分析结果的可靠性,为痰湿质、湿热质是溃疡性结肠炎的高发体质提供了一个新的生物学证据。除此之外,与该12个差异蛋白疾病富集相关的慢性阻塞性肺疾病[18]、支气管哮喘[19-20]、周围神经疾病[21]等疾病均在目前已有的关于湿性体质(痰湿质与湿热质)研究中得到了验证。另外,在对湿性体质转变为平和体质的14个显著差异蛋白进行疾病富集分析时发现其与湿性体质的相关疾病(如溃疡性结肠炎、慢性阻塞性肺疾病等)没有相关性,因此,从生物信息的角度证明,通过调体干预改善体质可以减少其相关疾病的发生与复发,达到中医未病养生,防病于先的“治未病”的目的[22]。
值得一提的是,MSP、DPP-Ⅱ、Siglec-7、TREML-1分别在平和体质转变为湿性体质的显著差异蛋白中上调,而在湿性体质转变为平和体质的显著差异蛋白中下调,据此我们推测该4个蛋白所介导的生理功能可能是导致平和体质与湿性体质差异的重要组成部分。另外,GO功能注释显示该4个蛋白介导的生理功能主要与炎症反应以及免疫应答反应相关,通路分析显示主要与MSP/RON信号通路相关,这与平和体质转变为湿性体质显著差异蛋白研究结果一致,进一步提示MSP、DPPII、Siglec-7、TREML1介导的免疫应答与炎症反应,以及MSP/RON信号通路可能是湿性体质关键的生物学机制。
目前,中医的体质分型标准百家争鸣,虽有中医体质量表与《中医体质分类与判定》标准,但量化的指标不明确,可能会造成主观上的偏差[23-24]。而MSP、DPP-Ⅱ、Siglec-7、TREML-1可能是介导湿性体质与平和体质差异的关键蛋白,这为目前体质分型普遍存在的量化指标不明确提供了一个很好的解决思路,但其是否能成为湿性体质与平和体质分类的量化指标,有待进一步验证。
蛋白研究体质能够对体质要素进行更好地反映,蛋白的动态表达能较好地反映体质的可变性和可调性[25],本文首次從体质转化的角度进行差异分析,通过平和体质转变为湿性体质显著差异蛋白进一步证明湿性体质存在罹患溃疡性结肠炎、克罗恩病、慢性阻塞性肺疾病高风险,而调体干预转化体质可以达到中医“治未病”的目的,预防疾病的发生发展。MSP、DPP-Ⅱ、Siglec-7、TREML-1体质关键差异蛋白介导的炎症反应、免疫应答反应、MSP/RON信号通路可能是湿性体质与平和体质差异的关键的生物学基础。
参考文献
[1] 孙淑娴,马嘉轶,倪 诚,等.基于“体质土壤学说”的调体防控痰湿体质相关代谢性疾病的研究思路[J].中华中医药杂志,2018,33(11): 5020-5022.
[2] 匡调元.中医病理研究[M].上海: 上海科学技术出版社,1980:85.
[3] 杜冉峰.基于生物信息学的痰湿体质相关疾病异病同治的分子机制研究[D].北京:北京中医药大学,2018.
[4] 周俊亮,潘佩光,刘友章,等.蛋白质组学在气虚体质研究中的应用[J].世界中医药,2009,4(1):46-48.
[5] BARRETT T, WILHITE S E, LEDOUX P, et al. NCBI GEO: Archive for functional genomics data sets-update[J]. Nucleic Acids Research, 2013, 41(D1): 991-995.
[6] YU G C, WANG L G, HAN Y Y, et al. clusterProfiler: an R package for comparing biological themes among gene clusters[J]. Omics, 2012, 16(5): 284-287.
[7] XIE C, MAO X Z, HUANG J J, et al. KOBAS 2.0: A web server for annotation and identification of enriched pathways and diseases[J]. Nucleic Acids Research, 2011, 39(suppl 2): 316-322.
[8] TAN F, CHEN X Y, ZHANG H H, et al. Differences in serum proteins in traditional Chinese medicine constitutional population: Analysis and verification[J]. Journal of Leukocyte Biology, 2020, 108(2): 547-557.
[9] 吴夏秋,储利胜,黄爱军,等.预防医学专业中医药特色课程群的建设与实践[J].现代预防医学,2019,46(3):573-576.
[10] 王东坡.痰湿体质及其基因表达特征研究[D].北京:北京中医药大学,2006.
[11] 郑璐玉.痰湿体质人群炎症相关机制研究[D].北京: 北京中医药大学,2013.
[12] LI J Y, CHANDA D, SHIRI-SVERDLOV R, et al. MSP: An emerging player in metabolic syndrome[J]. Cytokine & Growth Factor Reviews, 2015, 26(1): 75-82.
[13] GOYETTE P, LEFEBVRE C, NG A, et al. Gene-centric association mapping of chromosome 3p implicates MST1 in IBD pathogenesis[J]. Mucosal Immunology, 2008, 1(2): 131-138.
[14] 吉新强.克罗恩病中医证型分布规律及与体质分类关系的研究[D].南京:南京中医药大学,2012.
[15] 陈 珊.克罗恩病的中医体质分型[D].南京:南京中医药大学,2012.
[16] CHANDA D, LI T G, SONG K H, et al. Hepatocyte growth factor family negatively regulates hepatic gluconeogenesis via induction of orphan nuclear receptor small heterodimer partner in primary hepatocytes[J]. The Journal of Biological Chemistry, 2009, 284(42): 28510-28521.
[17] 朱微微,黄全海,池美华,等.不同中医体质类型与溃疡性结肠炎的Logistic回归分析[J].新中医,2019,51(5):50-52.
[18] 张兴彩,蔡余力,张伟,等.中医痰湿体质与慢性阻塞性肺疾病相关性研究[J].中医研究,2013,26(10):13-15.
[19] 邓金钗,郑小伟,陈圣华,等.支气管哮喘缓解期中医体质的分布特点[J].中华中医药杂志,2018,33(3):945-947.
[20] 狄冠麟,刘桂颖,胡 珀,等.支气管哮喘缓解期中医体质和证候的分布及分析[J].中华中医药杂志,2015,30(6):1972-1974.
[21] 林月程.住院2型糖尿病患者周围神经病变与中医体质的关系[D].福州:福建中医药大学,2012.
[22] 谢惠波,杨 艳,苏红卫,等.中国养生文化中的预防医学思想研究[J].现代预防医学,2014,41(22):4100-4102.
[23] 夏 婧,刘晓培,王志红.中医体质学说研究进展[J].河南中医,2017,37(3):551-555.
[24] 林景峰,高 强,刘甘露,等.基于多组全基因组表达谱的阳虚人群关键候选基因集和通路筛选及生物信息学分析[J].湖南中医药大学学报,2021,41(3):425-430.
[25] 孙淑娴.基于质谱技术的阴虚阳虚体质蛋白表达特征分析[D].北京:北京中医药大学,2019.