人前列腺癌组织DLL3基因生物信息学分析
2020-10-29盛爱民马世堂
张 宁, 盛爱民, 马世堂
(1.安徽理工大学 化学工程学院,安徽 淮南 232000; 2.安徽科技学院 生命与健康科学学院,安徽 凤阳 233100)
前列腺癌是一种男性生殖系统中最常见的恶性肿瘤之一,少数前列腺癌的生长及播散比较迅速,但大多数生长还是比较缓慢[1]。前列腺癌在所有的恶性肿瘤当中,恶性程度相对较低,大量临床资料表明前列腺癌的发生可能与性激素有关[2]。我国相比于欧美各国前列腺癌发病率及死亡率较低,但近年来也呈现上升趋势[3]。因此,对相关基因的的分析以及差异性表达与前列腺癌的发生及其治疗有着一定的联系。Delta-like protein 3(DLL3)是一种跨膜蛋白,是Notch受体配体的Delta/Serrate/Lag2(DSL)组的成员,在胚层的分离中,影响着体细胞边界的形成。在哺乳动物中已知有5个DSL配体,其中DLL3具有独特的结构[4]。有研究证实DLL3基因可用于各种神经内分泌癌的研究,作为一种抑制性Notch配体,可以促进肾癌等肿瘤的发生发展,尤其可在小细胞肺癌(SCLC)和其他神经内分泌肿瘤中高表达,而在正常组织中低表达[5],同时DLL3 mRNA和蛋白质的过表达在小细胞膀胱癌(SCBC)中也很常见,并且与较短的OS相关,靶向DLL3的ADC在SCBC的PDX模型中显示出优于化疗的体内功效[6-7]。但目前关于DLL3基因序列、编码蛋白质结构和特征以及在前列腺癌中的表达情况还研究的较少。
本文利用NCBI等8个生物信息学平台,对人DLL3基因进行生物信息学分析,探究DLL3基因序列、编码蛋白质结构和特征以及在前列腺癌中的表达水平,为研究前列腺癌的治疗提供一定的生物信息学基础[8]。
1 材料与方法
1.1 材料
利用NCBI数据库(Https://ncbi.org)查找人DLL3基因mRNA序列以及其编码的蛋白质序列。采用String数据库(Http://string-db.org)进行人DLL3基因网络通路分析,绘制PPI网络图[9]。利用 BioGPS 数据库(Http://biogps.org)分析DLL3基因在正常前列腺组织、T细胞和B细胞中的表达分布。利用GEPIA 数据库(Http://gepia.cancer-pku.org)分析DLL3基因在前列腺癌组织中的表达情况。利用CCLE(https://portals.broadinstitute.org/ccle)数据库分析DLL3基因在前列腺癌组织的T细胞和B细胞中的表达。利用TIMER(Https://cistrome.shinyapps.io/timer)数据库分析DLL3基因在B细胞、CD4+T细胞、中性粒细胞等6种免疫细胞中的表达和对前列腺癌患者生存预后的影响。
1.2 方法
在NCBI数据库中,以“DLL3”为关键词进行检索,下载人DLL3基因mRNA序列及其编码的蛋白质序列。利用DNASTAR软件的EditSeq部分,分析人DLL3基因编码区碱基组成。利用ExPASy数据库的ProtParam部分,分析人DLL3 蛋白理化特性[10-11]。利用SOPMA软件分析人DLL3蛋白二级结构[12]。利用SWISS-MODEL软件构建蛋白质三级结构[13]。利用软件Protscale预测蛋白质的疏水性。利用STRING数据库输入DLL3蛋白,选择“homo sapiens”,置信度选择0.400,构建PPI网络[14-15]。利用BioGPS数据库以Gene为DLL3进行检索,分析其在正常组织的前列腺、T细胞和B细胞中的表达分布。利用 GEPIA数据库中选择Gene为“DLL3”,Log2FC≥ 1,P<0.01,Cancer Type为“Prostatic cancer”进行检索,分析其在前列腺癌组织中的表达情况。利用CCLE数据库对DLL3进行检索,分析其在前列腺癌组织的T细胞和B细胞中的表达情况。利用TIMER 数据库选择Cancer为“Prostatic cancer”,Gene为“DLL3”,Survival Time Between为0~12/36/60 Months,并选择Correlation进行检索,探究DLL3 mRNA在前列腺组织中与多种免疫细胞的关系。
2 结果与分析
2.1 人DLL3基因序列分析
在NCBI数据库中,下载人DLL3基因mRNA序列(ID:NM_016941.4)及其编码的蛋白质序列(ID:NP_058637.1)。结果显示:人DLL3 mRNA序列,编码区长1857 bp(位于29~1885处),共编码618个氨基酸。人DLL3基因编码区的A、G、C、T含量分别为12.49%、33.06%、17.99%、36.46%,A+T含量(30.48%)低于G+C含量(69.52%)。
2.2 人DLL3蛋白理化性质分析
经过ProtParam软件分析,人DLL3分子式为 C2791H4376N846O825S51,相对分子质量为64617.68,理论等电点为 7.86。不稳定系数为55.06,高于阈值40,因此该蛋白在溶液中不稳定。消光系数位于280 nm(M-1·cm-1),脂肪系数为69.26,平均亲水系数为-0.147。表达的估计半衰期为:在哺乳动物网状红细胞体外表达的估计半衰期为30 h,在酵母体内表达半衰期为 20 h,在大肠杆菌体内表达半衰期为10 h。人DLL3蛋白的氨基酸组成中,Gly(G)所占比例最高(占12.6%),Lys(K)和Met(M)最低(占0.5%),带负电荷的残基总数(Asp+和Glu)为54,带正电荷的残基总数(Arg和Lys)为58。
2.3 人DLL3蛋白结构分析
利用SOPMA程序分析,人DLL3蛋白的二级结构包含59个α螺旋(占9.55%)、92个延伸链(占14.89%)、28个β转角(占4.53%)和439个无规则卷曲(占71.04%)。经SWISS-MODEL软件分析得到人DLL3蛋白三级结构与二级结构分析结果吻合。
2.4 人DLL3蛋白疏水性分析
利用Protscale工具进行DLL3亲水性分析,结果发现该蛋白在第17位点处疏水性最强,为3.167,亲水性最强的位点为第520处(为-2.567)。比较蛋白质亲水性和疏水性区域,结果发现该蛋白为一种亲水性蛋白质。
2.5 人DLL3基因网络通路分析
利用String数据库检索DLL3的相关蛋白,检索条件设定为10个蛋白交互,发现DLL3蛋白与NOTCH1、JAG1、DLL1等10个蛋白形成网络,并做出PPI网络图(图1)。结果分析,该网络图有11个节点,49条边,平均节点度为8.91,PPI浓缩P值为1.0E-16。KEGG通路主要与Notch信号通路、Th1和Th2细胞分化、内分泌抗性、乳腺癌等相关。
2.6 人DLL3 mRNA表达分布
经BioGPS数据库分析结果得知,DLL3在正常的前列腺组织、T细胞和B细胞中都是低表达。经GEPIA数据库分析结果得知,与正常前列腺组织相比,前列腺癌组织中的DLL3 mRNA表达水平有所升高(图2)。
图1 人DLL3蛋白PPI网络图
图2 DLL3在前列腺癌组织和正常组织中的不同表达情况
经CCLE数据库分析结果得知,DLL3 mRNA在前列腺癌组织的T细胞中处于低表达,在B细胞中表达略有升高(图3)。
图3 DLL3 mRNA在前列腺癌组织中的T细胞和B细胞中的表达
2.7 人源DLL3 mRNA在前列腺组织中与多种免疫细胞的关系
经Timer数据库分析结果得知,DLL3 mRNA在前列腺癌免疫微环境中与B细胞、肿瘤纯度、CD8+T细胞、巨噬细胞、CD4+T细胞、中性粒细胞和树突状细胞在前列腺癌组织的免疫微环境中的表达明显相关,且具有统计学意义(P<0.05)。其中DLL3 mRNA表达水平与肿瘤纯度呈正相关(偏相关系数partial.cor=0.187),表达量增加,其余免疫细胞呈负相关,表达量下降(图4)。
图4 DLL3与前列腺癌免疫细胞间的相关性
根据结果显示,DLL3 mRNA在B细胞、肿瘤纯度、CD8+T细胞、巨噬细胞、CD4+T细胞、中性粒细胞和树突状细胞的5年生存差异无统计学意义(P>0.05)(图5)。
图5 DLL3 mRNA的免疫细胞对前列腺癌患者5年生存率的影响
3 结论与讨论
神经内分泌癌病理上分为4类:典型类癌、不典型类癌、小细胞肺癌和大细胞神经内分泌癌[15]。DLL3最初发现于小细胞肺癌、子宫内膜癌、肝细胞癌等。研究人员的研究发现,利用DLL3作为靶标开发药物,对于一些癌症的治疗有促进作用。
通过生物信息学研究,可得人DLL3基因编码区长1857 bp,编码618个氨基酸。人源DLL3蛋白分子式为C2791H4376N846O825S51,相对分子质量为64617.68,理化性质不稳定,二级结构以无规则卷曲为主,亲水性蛋白质。通过String数据库发现DLL3蛋白与神经源性基因缺口同源蛋白1(NOTCH1)、锯齿蛋白1(JAG1)、三角洲样蛋白1(DLL1)等10个蛋白形成网络。KEGG通路主要有Notch信号通路、Th1和Th2细胞分化、内分泌抗性、乳腺癌等。主要富集于100种以上生物过程,11种分子功能,7种细胞成分,以及9种KEGG通路。
DLL3 mRNA在前列腺癌组织表达情况显示:在正常的前列腺、T细胞和B细胞中DLL3 mRNA表达水平低;在前列腺癌组织中DLL3 mRNA的表达水平有所升高;在前列腺癌组织的T细胞中DLL3 mRNA处于低表达,但在B细胞中表达略有升高;在前列腺癌免疫微环境中,DLL3 mRNA的表达水平与免疫细胞B细胞、CD8+T细胞、巨噬细胞、CD4+T细胞、中性粒细胞和树突状细胞呈负相关(偏相关系数partial.cor<0),表达量下降,但与肿瘤纯度呈正相关,表达量增加。
综上所述,通过对人DLL3基因信息的深入挖掘以及其在前列腺癌表达情况进行分析,对前列腺癌症疾病的诊治提供有力的生物学依据,也为进一步探索DLL3基因奠定了前期的基础。