(1. 南昌大学江西医学院,南昌 330006;2. 第一临床医学院,南昌 330006)
抗菌肽(antimicrobial peptide,AMP),又称宿主防御肽(host defense peptide,HDP),是一类具有抗菌活性多肽的总称,是生物体先天免疫系统的重要组成部分[1,2]。与传统抗生素相比,抗菌肽具有广谱杀菌作用,对大多革兰氏阳性菌和阴性菌均起作用,而且对某些真菌、寄生虫有杀灭作用,并能选择性地杀伤肿瘤细胞,抑制乙型肝炎病毒(HBV)、艾滋病毒(HIV)等的复制[3,4]。因此,对抗菌肽的研究主要集中在其药用价值开发和免疫调控,如预防及治疗癌症、抗病毒、抗感染等。
1 抗菌肽预测和分子设计常用生物信息学工具
表1 抗菌肽预测和分子设计常用在线分析工具
2 基于抗菌肽库的抗菌肽预测
由于序列和结构的多样性,抗菌肽的预测是一项困难但意义重大的工作,抗菌肽库(APD)[22]的建立使之成为可能,鼓励了科学家在这个研究方向上努力。截止到2016年4月,APD共收录了6个生物界的2 687条抗菌肽分子,每种生物来源的抗菌肽数目及占比,见图1。
图1 抗菌肽库中全部抗菌肽生物来源分类图
Nagarajan等[25]建立了一种基于疏水性、电荷、极性、半胱氨酸含量及氨基酸组成等多肽特征的索引方法,将其命名为傅立叶转换法(The Fourier transformation method)。傅立叶转换法表明在抗菌肽序列的权重谱中有一个明显的峰值,这个发现为扫描、识别基因组编码的蛋白质中是否存在潜在的抗菌肽序列奠定基础。另外,除了基于对多肽氨基酸序列的理化特征进行分析以外,还可以从多肽的三维参数和空间结构特征等方面进行抗菌肽的预测。从APD收录的动植物来源的含有二硫键结构的抗菌肽(如防御素)中,Yount[28]发现了一个保守的“GXC”序列基序,研究发现该基序在植物、动物、细菌和真菌来源的防御素中都很常见,并且十分保守。“GXC”基序在抗菌肽的空间结构中形成一个“γ-核心”结构域,利用这个基序模型和标志性的空间结构域,作者鉴定了之前无法鉴定的抗菌肽分子[28]。以结构为基础的抗菌肽预测不仅停留在蛋白质水平,也可以应用到基因层面。根据β-防御素中6个保守的半胱氨酸结构基序,结合利用HMMER(http://hmmer.janelia. org/) 和 BLAST(http://blast.ncbi.nlm.nih.gov/Blast. cgi)分析工具,Schutte等[29]在5个等位染色质区域内发现了28个人源和43个鼠源的新型β-防御素基因,这些新抗菌肽基因在之前对人和小鼠染色体基因组注释的过程中没有被发现。
3 利用抗菌肽库对抗菌肽进行分子设计
抗菌肽库不仅可用于抗菌肽的预测,也可用来设计新型抗菌肽或对现有抗菌肽进行分子改造。以抗HIV活性抗菌肽的开发和分子设计为例,简单介绍如何利用抗菌肽库筛选法对抗菌肽进行分子设计。某些天然抗菌肽如melittin[30]、cecropin[30]、defensins[31]、cyclotides[32]及 LabyA1[33]表现出对人类免疫缺陷病毒HIV的抑制活性。迄今为止,APD收录了109条具有抗HIV活性的抗菌肽,约占APD总抗菌肽数量的4%。假设APD中含有数量可观的抗HIV活性的抗菌肽,其具有多种多样的氨基酸序列,这些序列中包含了可用来开发新型抗HIV药物的有价值的模板序列。为验证这种假设,研究人员按照多肽长度、电荷数、半胱氨酸含量、细胞毒性和序列独特性等标准筛选了30条天然抗菌肽用于研究[34]。实验过程中,用CEM-SS细胞评价多肽对细胞的毒性效应;治疗指数(TI)定义为TC50对EC50的比值,其中TC50表示50%细胞活力抑制率时的多肽浓度,EC50表示50%病毒复制抑制率时的多肽浓度。研究发现,其中11条多肽的EC50值低于10 μmol/L,这11条多肽中有4条多肽(temporin-PTa、temporin-LTc、ponericin L2和spinigerin)的TI值大于10[34]。另外,在LL-37,BMAP-27等长度较长的多肽序列内部也发现了抑制HIV的基序(FK-13、GI-20和BMAP-18等)[35]。有意思的是,LL-37内部最小抑菌序列[36]和最短抗HIV序列[35]之间有很好的重叠区域。研究人员通过利用这些多肽序列模板研发设计抗HIV的多肽类药物。在另一项研究中,Terrent等[37]建立了一种理论算法来鉴定抗菌肽内部的活性区域,该理论对每种氨基酸的杀菌倾向值(PV)进行了计算,其中精氨酸、赖氨酸、半胱氨酸、色氨酸、酪氨酸和异亮氨酸PV值均低于0.2,都属于抗菌肽序列中的偏爱氨基酸[37]。潜在的抗菌肽活性区域内部氨基酸的平均PV值应该较低,该方法预测的准确性和灵敏度分别达到85%和90%,可以用作设计新抗菌肽的工具。
4 从头合成对抗菌肽进行分子设计
只需用到两种氨基酸,β-折叠的抗菌肽设计用到5种氨基酸[40]。设计一个α-螺旋肽模型只需用到赖氨酸和亮氨酸,它们分别代表了多肽中带正电荷的组分和疏水成分,这种类型的多肽被称为LK多肽。在一系列的LK多肽中,研究人员发现14或15个氨基酸长度的LK多肽具有最强的生物活性[41],序列太短则生物活性显著降低,太长则会引起溶血。Kang等[42]通过引进一个色氨酸残基的方法获得了一条只有11个氨基酸长度的高活性LK多肽。Wang等发现在动物来源的抗菌肽中,甘氨酸、亮氨酸和赖氨酸是使用频率最高的三种氨基酸[43],这也印证了在早期抗菌肽的设计过程中选择亮氨酸和赖氨酸的生物学意义。此外,Monroc等研究发现从头合成4-10个残基长度的线性多肽不具备抗菌活性,然而多肽环化后增强了疏水性,重新赋予了这些多肽抗菌活性[44]。上述研究结果也与APD库中收录的最短螺旋肽的长度为10-12个氨基酸残基这一事实相符。从头合成的两亲性螺旋肽的设计包括两种基本模式(图2),图2-A展示了常见的经典设计模式,图2-B为分段设计模式。Duval 等根据分段模式设计了两亲性螺旋肽K14(KKKKPLFGLFFGLF)[45],研究表明K14对革兰氏阳性菌和阴性菌均表现出杀菌活性,表明从头合成设计抗菌肽的多样性和灵活性。
图 2 两亲性螺旋肽的两种结构设计图
5 展望
Research Progress on the Application of Bioinformatics in Prediction and Molecular Design of Antimicrobial Peptide
XIAO Yi-chen1XIONG Hao1XIE Chuan2LÜ Nong-hua2
(1. The First Affiliated Hospital of Nanchang University,Nanchang 330006;2. The First Clinical Medical College,Nanchang 330006)
Antimicrobial peptides(AMPs)are being increasingly recognized as novel bioactive peptide with critical research value owing to their activities of anti-bacterium,antivirus and antitumor as well as properties of rapidness,broad-spectrum,and high efficiency. Whereas a crucial issue in AMP drug development is how to seek appropriate approaches for maximally improving the bioactivity and decreasing the toxicity and production cost. Applying bioinformatics tools to predict novel AMP and to carry out the molecular design of natural AMP is the key to solve this problem. The new progress on bioinformatics involved in AMP prediction and optimal design is reviewed. in order to expand the sources of new AMPs and elevate the bioactivities of known AMPs.
antimicrobial peptides(AMP);bioinformatics;active peptide prediction;molecular design