APP下载

猪ALCAM基因密码子偏好性分析、蛋白结构功能预测以及组织表达谱检测

2020-11-18陈瑜哲杨建生吴正常包文斌吴圣龙

中国畜牧杂志 2020年11期
关键词:密码子信息学糖基化

许 写,陈瑜哲,杨建生,吴正常,包文斌,吴圣龙*

(1.扬州大学动物科学与技术学院,江苏扬州 225009;2.昆山市畜牧兽医站,江苏昆山 215300)

活化白细胞黏附分子(Activated Leukocyte Cell Adhesion Molecule,ALCAM)基因又称为CD166,属于免疫球蛋白超家族的成员,是淋巴细胞抗原CD6 的配基,在调节机体适应性免疫机制中发挥重要作用[1-2]。目前,关于ALCAM基因的研究主要集中在人类医学上[3],人ALCAM基因表达定位于上皮细胞间连接处,作为黏附结构之一参与维持组织结构的稳定性并在机体适应性免疫调控过程中发挥重要作用。相关研究表明[4],ALCAM基因可与淋巴细胞抗原6(Cluster of Differentiation 6,CD6)发生异嗜性相互作用及与自身发生同嗜性相互作用来介导细胞间的黏附。此外,ALCAM基因在免疫突触稳定性、T 细胞增殖与活化、单细胞跨内皮迁移等方面发挥重要作用。已有研究表明,ALCAM基因与CD6 的结合有助于稳定T 细胞与抗原呈递细胞(APC)之间的连接,进而诱导机体发生适应性免疫反应[1]。Nassan 等[5]阻断ALCAM基因与CD6的结合,发现机体T 细胞对抗原的免疫应答减弱。孙丽等[6]研究初步鉴定ALCAM基因表达水平在仔猪大肠杆菌感染过程发挥了免疫调节作用。然而,目前关于猪ALCAM基因的序列特征、表达模式、密码子使用偏好性以及蛋白结构功能等方面的研究尚无报道,而生物信息学对分析与揭示某一特定基因序列特征、蛋白质结构以及功能提供有力的分析方法[7-8]。本研究一方面通过生物信息学方法获得猪ALCAM基因的编码区全长序列,分析其密码子使用模式,使用生物信息学软件预测出其序列特征、蛋白质结构以及功能位点,并结合生物信息学和比较基因组学对ALCAM蛋白质进行功能分析;另一方面采用荧光定量PCR 技术对其在梅山猪不同组织中的mRNA 表达进行定量检测,以期为今后深入探究ALCAM基因在猪抵抗病原感染过程中发挥的免疫调控机制提供一定的参考。

1 材料与方法

1.1 实验材料 选取来自昆山市梅山猪国家级保种场的5头35 日龄的梅山断奶仔猪,屠宰后,取心、肝脏、脾、肺、肾、胃、肌肉、胸腺、淋巴、十二指肠、空肠和回肠12个组织,现场液氮保存,然后转移至-70℃冰箱保存。

1.2 引物设计与合成 根据GenBank 公布的猪ALCAM基因(登录号:NC_010455.5)的序列设计实时荧光定量引物,以甘油醛-3-磷酸脱氢酶(Glyceraldehyde-3-phosphate Dehydrogenase,GAPDH)基因作为内参基因,引物均由上海生工生物技术服务有限公司合成,引物序列见表1。

1.3 总RNA 提取、cDNA 合成和荧光定量反应 利用Trizol 法,严格按照试剂盒操作步骤提取组织总RNA,经NanoDrop-1000 微量核酸测定仪检测总RNA 的纯度和浓度,-70℃保存备用。以RNA 为模板按照反转录试剂盒操作说明进行cDNA 合成,实时荧光定量反应体系及程序按照定量试剂盒(南京诺唯赞生物科技有限公司)说明进行,每个样本进行3 次实时PCR 检测,取平均值。

1.4 猪ALCAM基因密码子偏好性分析 运用Condow 1.4.2 软件以及EMBOSS 软件包中的chip 和cusp 在线程序计算密码子相关参数:①碱基组成及基本参数;②同义密码子相对使用度(Relative synonymous Codon Usage,RSCU),用于衡量密码子使用偏好性程度;③密码子使用频率(Frequency),运用Codon Usage Database数据库(http://www.kazusa.or.jp/codon)筛选大肠杆菌、酵母以及鼠基因组的密码子使用频率。

1.5 生物信息学分析 利用生物信息学相关软件分析猪ALCAM 蛋白的基本理化性质、基本结构、功能位点和区域,相关参数分析网址:①蛋白基本理化性质(http://web.expasy.org/protparam/);②蛋白质亲水性/疏水性(http://web.expasy.org/protscale/);③信号肽预测(http://www.cbs.dtu.dk/services/SignalP/);④跨膜结构域预测(http://www.cbs.dtu.dk/services/TMHMM/);⑤蛋白潜在磷酸化位点预测(http://www.cbs.dtu.dk/services/NetPhos/);⑥蛋白潜在N-糖基化位点及O-糖基化位点预测(http://www.cbs.dtu.dk/services/NetNGlyc/,http://www.cbs.dtu.dk/services/NetOGlyc/);⑦蛋白互作分析(https://stringdb.org/);⑧蛋白保守结构功能域(http://smart.emblheidelberg.de/smart/batch.pl)。

1.6 数据分析 定量结果根据2-ΔΔCt法进行处理,用内参基因GAPDH对不同组织中ALCAM基因的表达水平进行均一化,运用Graphpad Prism 6.0 绘制ALCAM基因在梅山猪不同组织中的表达谱。

2 结果与分析

2.1ALCAM基因组、mRNA 和蛋白结构分析 通过NCBI 数据库搜索ALCAM基因组DNA,发现该基因位于猪13 号染色体NC_010455.5 的153 794 991~153 998 241 位置,其全长203 251 bp,包含IGv(121~339)、C2-set_2(409~693)、IG_like(763~987)、IG_2(1036~1236)、Ig superfamily(1243~1464)5个功能结构域。

2.2 猪ALCAM基因密码子偏好性分析

2.2.1 猪ALCAM基因碱基组成及相关参数分析 猪ALCAM基因密码子有效密码子数(ENC)为52.65,表明猪ALCAM基因密码子使用偏好性较强;其密码子第三位4 种碱基中A+T 碱基含量高于G+C 含量;且CDS 区全序列的GC 含量和不同位置的GC 含量(GC1s、GC2s、GC3s)值分别为0.427、0.461、0.382、0.436,含量均小于50%,表明猪ALCAM基因密码子使用偏好以A/U 结尾的密码子。

2.2.2 猪ALCAM基因RSCU 值分析 猪ALCAM基因61 个密码子的RSCU 值计算,用于衡量该基因同义密码子使用偏移的情况,RSCU 值>1 表明该密码子具有偏好性,RSCU 值>1.6 则表明密码子的偏好性较强[9]。RSCU 值分析表明猪ALCAM基因存在28 个高频密码子,其中CGG、AGA、GGA、GCU、ACA 这5 个密码子的偏好性最强,且多数以A 或U 结尾,进一步表明猪ALCAM基因偏好使用以A/U 结尾的密码子。

2.2.3 与模式生物基因组密码子使用频率比较分析 如表2 所示,猪ALCAM基因与大肠杆菌基因组密码子使用存在较大差异的有20 个,而与小鼠、酵母菌基因组存在较大差异的密码子有17 个,这表明相较于大肠杆菌模式生物基因组,小鼠和酵母菌是更适合猪ALCAM基因的外源表达系统。

表2 猪ALCAM 基因与模式生物基因组密码子使用频率比较

注:下划线表示2 个物种密码子比较具有明显偏差(≤0.5,≥2)的分值。

2.3 猪ALCAM基因蛋白质结构与功能位点分析 本研究运用生物信息学相关软件分析发现,ALCAM基因CDS 区全长1 713 bp,编码570 个氨基酸,半衰期约30 h,其脂溶性指数为85.98,不稳定指数为48.09(大于40),表明ALCAM 蛋白为不稳定蛋白;猪ALCAM 蛋白的总平均亲水系数(Grand average of hydropathicity,GRAVY)为-0.315,表明该蛋白为亲水性蛋白。此外,猪ALCAM 蛋白存在一个跨膜区域(515~537 aa),在第1~27 位氨基酸之间存在信号肽,且在27~28 位氨基酸之间存在信号肽剪切位点;无潜在的O-糖基化位点,存在5 个N-糖基化位点,分别位于第95、167、265、337、480 位氨基酸;存在96 个磷酸化位点,包括14 种特异性蛋白激酶结合位点:PKC(27)、PKA(5)、PKG(4)、cdc2(6)、cdk5(1)、p38MAPK(1)、GSK3(2)、INSR(4)、CKII(4)、DNAPK(4)、CaM-II(1)、EGFR(1)、RSK(1)、unsp(34)。

2.4 进化分析 将猪ALCAM 单边序列与小家鼠(Mus musculus,NM_001331110.1)、大白鼠(Rattus norvegicus,NM_031753.1)、人(Homo sapiens,NM_001243280.1)、黑猩猩(Pan troglodytes,XM_516634.7)、犬(Canis lupus familiaris,NM_001313804.1)、绵羊(Ovis aries,XM_012189447.2)和牛(Bos Taurus,NM_174238.1)等7 个物种的蛋白质序列导入MEGA7.0,计算相似度,分别为88.91%、86.99%、92.94%、90.70%、92.07%、92.29%、92.69%。基于邻接法(Neighbor-joining method)构建系统发育树(图2)。

2.5 梅山猪ALCAM基因组织表达谱分析 由图3 显示,ALCAM基因在梅山猪不同组织中均有表达,其中,在肺脏、胃和淋巴组织中为较高表达水平,在肝脏、脾脏、肾脏和肠道组织(十二指肠、空肠和回肠)中为中等表达水平,而在心脏、肌肉和胸腺组织中为低表达水平。

3 讨 论

本研究首次通过生物信息学方法成功获得了猪ALCAM基因的编码区全长序列,并预测出其序列特征、蛋白质结构以及功能位点,为今后深入研究猪ALCAM基因功能提供一定的基础理论材料。对于蛋白质翻译后修饰位点而言,蛋白质磷酸化是翻译过程中重要的共价修饰方式之一,其修饰过程与基因表达、信号转导、细胞分裂、细胞的生长周期、生长发育以及部分癌症发病机制密切相关[10]。蛋白质糖基化修饰主要发生在哺乳动物蛋白中,在多种疾病的早期诊断和发展进程中发挥重要作用[11]。本研究发现猪ALCAM 蛋白存在5 个N-糖基化位点和96 个磷酸化位点,其中包含14 个PKC特异性蛋白激酶位点,如果这些位点发生修饰后,可能会影响ALCAM基因的表达水平,这提示今后开展ALCAM 的蛋白组学研究时要重点关注以上位点的糖基化和磷酸化状态。此外,本研究预测出猪ALCAM 蛋白存在保守功能结构域(IGv、C2-set_2、IG_like、IG_2、Ig superfamily),这些结构域可能与ALCAM基因免疫调控作用有关,今后需要利用基因敲除技术来进一步验证,同时利用PCR-SSCP/RFLP 技术重点筛选与验证位于这些功能结构域内的重要变异位点,为开展猪抗病育种有效遗传标记的筛选提供一定的指导和依据。

核酸是蛋白质合成的模板,编码天然蛋白质20 种基本氨基酸的密码子共61 种,每种氨基酸可由1~6 个密码子编码,这些密码子称为同义密码子。某一特定基因在翻译中编码相同氨基酸的同义密码子(Synonymous Codon)不均一使用情况被称为密码子使用偏好性(Codon Usage Bias,CUB)[12],而密码子偏好性分析有助于理解不同物种的进化发展,还可有效帮助理解同义密码子使用偏好性相关机制。此外,密码子偏好性分析有助于了解某个基因转录和翻译水平上的调控机制,并且对于寻找该基因最佳外源表达系统或宿主从而提高基因的表达水平具有重要的理论意义。因此,本研究分析了猪ALCAM基因的密码子使用模式,发现偏好以A/U 结尾,CGG、AGA、GGA、GCU、ACA 为优势密码子,并且小鼠是较佳外源表达动物。本研究从密码子层面分析了猪ALCAM基因的密码子使用模式,为今后通过密码子改造或者外源表达调节猪ALCAM基因的表达量,进而调节其在机体适应性免疫中的作用提供了参考依据。此外,本研究探究了ALCAM基因在梅山猪中的组织表达谱情况,发现其在不同组织中均有表达,特别是肺脏中呈现较高表达,虽然肺不是免疫器官,但其作为呼吸系统中的重要器官,与外界接触较为频繁,提示该基因可能在抵御外界恶劣环境等应激时发挥重要作用;其次在淋巴和肠道组织中呈现较高表达水平,表明ALCAM基因可能在机体免疫应答过程中发挥重要作用。然而其表达水平是否与猪抵抗细菌或者病毒感染有关,需要在细胞水平上对该基因进行RNA 干扰、过表达以及sgRNA-Cas9 敲除,构建稳定沉默或过表达ALCAM 的猪小肠上皮细胞系(IPEC-J2),在此基础上一方面进行转录组、非编码RNA 测序以及蛋白质组学分析,另一方面可结合革兰氏染色、间接免疫荧光以及定量表达检测来评估猪ALCAM基因表达水平对细菌或者病毒感染能力的影响,进一步探讨猪ALCAM基因在机体抵抗外源病原感染过程中发挥的免疫调控作用及分子机制。

4 结 论

本研究初步揭示了猪ALCAM基因序列特征、蛋白结构与功能以及组织表达特性,发现猪ALCAM基因CDS 区全长序列1 713 bp,共编码570 个氨基酸,其中存在1 个信号肽区域(1~27aa)、1 个跨膜结构域(515~537aa)、5 个潜在的N-糖基化位点和96 个特异性蛋白激酶结合位点,二级结构主要以无规则卷曲和延伸链为主。猪ALCAM基因的密码子使用偏好以A/U 结尾,28 个密码子的使用偏好性较强(RSCU值>1),其中5 个优势密码子,分别是CGG、AGA、GGA、GCU、ACA,并且模式生物小鼠是ALCAM基因最佳外源表达动物。本研究结果为今后深入研究猪ALCAM基因的生物学功能提供一定的理论基础。

猜你喜欢

密码子信息学糖基化
PD-1/PD-L1 的糖基化修饰对肿瘤免疫治疗影响的研究进展
镰翅羊耳蒜叶绿体基因组密码子偏好性分析
鸡NRF1基因启动子区生物信息学分析
生物信息学辅助研究乳腺癌转移相关lncRNA进展
以“题”带“面” 突破密码子与反密码子的特性
密码子与反密码子的本质与拓展
PBL教学模式在结构生物信息学教学中的应用
新型密码子、反密码子、氨基酸对应盘
蛋白质O-GlcNAc糖基化修饰在妇科肿瘤中的研究进展
药用植物黄花蒿ATP合成酶电子克隆及生物信息学分析