基于生物信息学稻米半胱氨酸蛋白酶抑制剂来源生物活性肽的虚拟筛选及分子对接研究
2021-03-16石嘉怿梁富强
石嘉怿 梁富强 张 太 张 冉
(南京财经大学食品科学与工程学院,南京 210023)
植物蛋白酶抑制剂(protease inhibitor, PI)是一类广泛存在于植物贮藏器官中具有蛋白酶抑制活性的小分子多肽或蛋白质,通过与蛋白酶的活性部位和变构部位结合,从而抑制其催化活性或阻止其转化为有活性的酶[1]。PI能够抑制侵染植物的病原菌、微生物及昆虫中的蛋白酶,是其自然胁迫防御体系的组成部分[2]。稻米半胱氨酸蛋白酶抑制剂(Oryzacystatin, OC)是一类重要的植物PI,目前已鉴定出的编码水稻OC的基因有12种[3]。
植物蛋白是人们膳食中蛋白质的重要来源之一。蛋白质经酶解后能够释放出具有抗氧化、抗炎、抗血栓等生物功能的多种小分子肽,对人体健康具有重要的促进作用被称为生物活性肽。作为自然界中广泛存在的蛋白质,植物PI含量可高达总蛋白的10%,是除贮藏蛋白外一类重要的蛋白质。近年来很多研究发现PI及其酶解产物具有抗癌[4]、降糖[5]、抗氧化[6]和增强免疫[7]等多种生物活性,提示植物PI也是生物活性肽的重要来源。早在1995年日本学者就发现稻米OC蛋白(OC 1和OC 2)在体内体外均具抑制人类疱疹病毒的作用,认为OC是稻米中一类重要的功能活性物质[8]。
传统的对于蛋白来源生物活性肽的研究主要基于蛋白质酶解产物的分离纯化鉴定和活性评价,不仅耗时费力,还很可能导致活性高但含量少的生物活性肽的丢失。近年来生物信息学的发展打破了传统研究的局限,正逐渐被广泛用于生物活性肽的研究[9]。运用计算机辅助酶解技术结合生物信息学分析方法能够模拟给定条件下蛋白质酶解过程,预测产生的大量肽段,从而快速和高效的从中发现和预测结构新颖的具有较高生物活性的功能肽段;并且能够避免传统分离纯化过程中潜在的高生物活性肽段的损失和丢失。Udenigwe[10]的研究提示稻米OC 1和OC 2蛋白经胃蛋白酶或嗜热菌蛋白酶虚拟水解后是生物活性肽的潜在来源。然而,对于稻米OC蛋白经模拟胃肠道消化后的生物活性肽缺乏相关研究。因此,本研究采用一系列生物信息学方法,从稻米OC虚拟模拟胃肠道消化产物中筛选生物活性肽,为稻米OC作为膳食生物活性肽的来源提供参考。
1 实验方法
1.1 稻米OC的蛋白质序列分析和计算机辅助虚拟消化酶解
从UniProtKB蛋白质数据库中下载稻米OC蛋白的氨基酸序列(包括OC 1~12,共12条)、牛乳β-酪蛋白、大豆球蛋白和稻米谷蛋白的蛋白质序列,见表1。利用Biopep数据库中“Profiles of potential biological activity”模块对稻米OC蛋白序列进行分析,以β-酪蛋白、大豆球蛋白和稻米谷蛋白序列为对照序列,根据公式(1)统计分析蛋白质序列中生物活性肽的发生频率A,评估稻米OC 1~12蛋白作为生物活性肽来源的潜力。在Biopep数据库“enzyme action”模块,联合使用胃蛋白酶(pH 1.3)(EC 3.4.23.1)、胰蛋白酶(EC 3.4.21.4)和糜蛋白酶(EC 3.4.21.2)3种消化酶进行计算机辅助模拟胃肠道消化酶解。依据公式2计算生物活性肽的释放频率AE。
A=a/N
(1)
式中:a为蛋白质序列中具有给定活性的片段数;N为蛋白质中氨基酸数量。
AE=d/N
(2)
式中:d为选定的酶的作用下从蛋白质序列中释放出具有给定活性的肽的数量;N为蛋白质中氨基酸数量。
表1 用于生物信息学分析的稻米OC 1-12蛋白、β-酪蛋白和稻米谷蛋白序列
1.2 活性肽具有生物活性的可能性预测
PeptideRanker(http://bioware.ucd.ie/~compass/biowareweb/Serverpages/Peptideranker.php)程序评价筛选的肽段具有生物活性的潜力。在网站中输入肽段的氨基酸序列可以得到一个介于0~1的评分,得分越高表示成为生物活性肽的可能性越大。将虚拟酶解产生的活性肽片段进行生物活性预测,选择得分高于0.5的生物活性肽[11]。
对于筛选得到的具有较高可能性的生物活性肽序列,通过与数据库BIOPEP和AHTPDB(http://crdd.osdd.net/raghava/ahtpdb/)中已经被收录的ACE和DPP-IV抑制肽进行对比确定其新颖性,选择很少被报道的活性肽进行一步研究。
1.3 水溶性和ADMET性质
使用在线工具Innovagen(http://www.innovagen.com/proteomics-tools)预测筛选到的潜在生物活性肽的水溶性。利用admetSAR(http://lmmd.ecust.edu.cn/admetsar1/predict/)和ToxinPred(http://crdd.osdd.net/raghava//toxinpred/)预测活性肽的吸收(adsorptin)、分布(distribution)、代谢(metabolism)、排泄(excretion)和毒性(toxicity)(ADMET)性质。结果主要以人体胃肠道吸收(Human Intestinal Absorption, HIA)、血脑屏障穿透(Blood-Brain Barrier Penetration, BBB)和毒性为指标。
1.4 分子对接
利用sybyl-X2.0软件构建筛选的生物活性肽的3D结构,并进行能量最小化。从蛋白质数据库Protein Data Bank(PDB)(http://www.rcsb.org/)下载目的蛋白ACE(PDB ID:1O8A)和DPP-IV(1NU6)的3D结构。在sybyl中对小分子配体和蛋白受体进行准备,利用分子对接模块在Surflex-Dock模式下分别进行生物活性肽与ACE和DPP-IV的半柔性对接,每个分子生成的构像数目设置为10。根据分子对接得到的数据,获得生物活性肽与目的蛋白相互作用的打分函数,以Total_Score为标准对潜在生物活性肽进行筛选,并分析活性肽分子与目的蛋白的结合位点[12]。
2 结果与分析
2.1 稻米OC蛋白是生物活性肽的潜在来源
目前为止,BIOPEP数据库中共收录了51种功能活性肽,对稻米OC蛋白序列的分析表明,蛋白质序列中的活性肽序列共能够表现出17种,与牛乳β-酪蛋白、大豆球蛋白和稻米谷蛋白中具有的生物活性肽种类接近(如图1所示)。其中,血管紧张素转换酶(angiotensin Ⅰ-converting enzyme, ACE, EC 3.4.15.1)抑制活性(1)、抗氧化活性(5)、二肽基肽酶-3(dipeptidyl peptidase-Ⅲ)(9)和二肽基肽酶-4(dipeptidyl peptidase-IV, DPP-IV, EC 3.14.21.5)抑制活性(10)、肾素抑制活性(14)及促进葡萄糖摄取活性(15)等是稻米OC蛋白中所有的活性肽序列均具有的生物活性。生物活性肽发生频率(A)是指蛋白质序列中具有生物活性的肽段序列的片段数与蛋白质序列中氨基酸总数目的比值,是评估蛋白质作为生物活性肽来源的重要指标。比较12条稻米OC蛋白生物活性肽发生的总频率A可知,OC 10(∑A=1.573 6)具有最高值,其次是OC 1(∑A=1.570 2)和OC 4(∑A=1.544 8),OC 6的最低(∑A=1.105 3)(表1)。约占牛乳总蛋白的80%的酪蛋白及植物贮藏蛋白大豆球蛋白和稻米谷蛋白均是日常膳食中动物和植物蛋白的主要来源,也是生物活性肽的重要来源,它们的蛋白质序列常被用来作为对照序列[13]。结果显示虽然12条稻米OC蛋白序列的A值均小于牛奶β-酪蛋白(∑A=2.028 7),但是,除OC 6和OC 7外均高于大豆球蛋白(∑A=1.262 2);且除OC6、OC7和OC11外,稻米OC蛋白序列的生物活性肽发生频率均高于大米贮藏蛋白谷蛋白(∑A=1.357 5)(表2)。这些结果表明稻米OC蛋白中能够产生的生物活性肽不仅种类接近,且发生频率高于大豆和稻米贮藏蛋白,提示稻米蛋白酶抑制剂OC蛋白是生物活性肽的优良来源。
在不同种类生物活性肽发生频率中,具有ACE和DPP-4抑制活性的生物活性肽的发生频率均较高,A1和A2值分别介于0.364 6~0.582 1和0.505 3~0.750 0范围内(表2)。其中ACE抑制活性生物活性肽发生频率最高的为OC 4,而DPP-IV抑制活性肽发生频率最高的为OC 8。ACE是机体内调节血压的关键酶,是开发高血压防治药物的靶标,因此,具有ACE抑制作用的活性肽在高血压的控制中具有重要作用[14]。DPP-IV能够降解促进胰岛素分泌的胰高血糖素样肽,因此,生物活性肽抑制DPP-IV可以促进胰岛素分泌,从而降低和控制餐后血糖水平,对糖尿病的防治具有重要意义[15]。与化学合成药物相比,近年来食物来源的生物活性肽由于具有更好的生物相容性、毒副作用小及易透过血脑屏障等特点受到了广泛关注,食源肽的分离纯化和生物活性研究已成为了近年来研究的热点。目前,从牛乳[9,16]、大豆[17]、稻米[18]及其副产物米糠[19]中已经筛选鉴定出了多种具有ACE和DPP-IV抑制作用的生物活性肽,并且其降血压和降血糖作用在体外和体内实验中已经得到了证实。研究分析表明多种稻米OC蛋白的ACE抑制肽(OC 4、10、5、8、1、2和12)和DPP-IV抑制肽(OC 8、9、10、11和5)的发生频率A1和A2高于大豆球蛋白和稻米谷蛋白。因此,可以推测稻米OC蛋白可能也是稻米中ACE和DPP-IV抑制肽的优质来源,其酶解产生的生物活性肽对于高血压和糖尿病的预防和治疗具有重要作用。
注:1~17依次表示ACE抑制肽(1)、泛素介导性蛋白酶解激活肽(2)、α-葡萄糖苷酶抑制肽(3)、抗遗忘肽(4)、抗氧化肽(5)、抗血栓肽(6)、细菌渗透性配体肽(7)、钙调素依赖性磷酸二酯酶抑制肽(8)、二肽基肽酶-III抑制肽(9)、二肽基肽酶-IV抑制肽(10)、羟甲基戊二酰辅酶A还原酶抑制肽(11)、降血脂活性肽(12)、调节肽(13)、肾素抑制肽(14)、葡萄糖摄取促进肽(15)、免疫刺激肽(16)和抑制肽(17)。图1 蛋白质序列中各种类生物活性肽的发生频率
表2 稻米OC蛋白序列中总的生物活性肽和ACE及DPP-IV生物活性肽发生频率
2.2 稻米OC蛋白的计算机辅助模拟胃肠道消化水解
作为人体重要的宏量营养物质,蛋白质主要是以小肽的形式被吸收利用,且生物活性肽在其母体蛋白质序列中并不能发挥生物活性,经酶解释放出来后才能产生相应的效应[20]。因此,酶解是制备生物活性肽的主要方法之一。而与其他酶相比,利用人体消化酶直接进行体外模拟消化制备的生物活性肽在体内具有更好的耐受性,近年来被更为广泛的采用[21]。因此,研究选择胃蛋白酶、胰蛋白酶和糜蛋白酶作为共同消化酶对稻米OC蛋白进行计算机辅助模拟胃肠道消化,以产生并筛选能够耐受胃肠道消化的肽段[22]。释放频率(AE)是指酶解后蛋白质序列中水解出的生物活性肽数目与蛋白质中特定活性的生物活性肽数目的比值,与上述蛋白质的生物活性肽发生频率A一致,酶解产生的活性肽主要是ACE和DPP-IV抑制肽。通过虚拟胃肠道消化酶解并与数据库对比发现,酶解产生的已知生物活性的肽大多数是二肽,其中OC 10的ACE和DPP-IV抑制肽释放频率均较高,提示其是稻米OC蛋白中生物活性肽的较好来源。而对比每条OC蛋白的DPP-IV和ACE抑制肽释放频率可以推测稻米OC可能是DPP-IV抑制肽的更好来源。一般认为由2~6个氨基酸组成的肽段可能具有更合理的分子量、吸收代谢性质及体内发挥生物活性的可能性[23]。因此,选择未知生物活性的2~6肽进行下一步的虚拟筛选。
表3 稻米OC蛋白经虚拟模拟胃肠道消化酶解后ACE和DPP-IV抑制肽的释放频率和肽序列
2.3 生物活性肽的虚拟筛选
除了已知生物活性的肽段,酶解时也会产生很多具有未知生物活性的肽段。PeptideRanker得出活性评分表征的是给定的肽序列具有生物活性的可能性,得分越接近于1表示其成为生物活性肽的可能性越高,是筛选新颖生物活性肽的一种有效方法[24]。分子对接是研究多肽作为配体与靶蛋白受体相互作用的有力手段,目前已被广泛用于生物活性肽的发现和筛选,结果中总的打分Total_Score函数是以负对数为单位模拟结合能力,得分越高表示配体与受体的结合更稳定[25]。因此,研究根据PeptideRanker的活性评分>0.5,结合打分函数Total_Score,共筛选得到19种由2~6个氨基酸组成的肽段(表4)。
表4 潜在生物活性肽活性分数和性质
只有通过胃肠道吸收并透过生理屏障后活性肽才能在机体内发挥功能活性从而促进人体健康,因此,水溶性和ADMET性质是影响其生物活性肽活性发挥的重要因素[26]。Yu等[22]基于水溶性和ADMET性质并结合分子对接的方法从虹鳟中最终筛选出了3种新的ACE抑制肽(EGF、HGR和VDF)。admetSAR程序被用来预测活性肽的ADMET性质,其中HIA和BBB分别代表活性肽小分子通过胃肠道吸收和透过血脑屏障的难易程度[27]。樊玥[28]通过admetSAR预测活性肽的ADEMT性质虚拟筛选得到高活性的ACE抑制三肽序列。因此,研究根据活性评分和分子对接得分,并结合水溶性、HIA和BBB结果,最终选择水溶性良好、吸收好、无毒且具有潜在高活性的TDW和AGR作为ACE和DPP-IV抑制肽进行深入研究。并与BioPEP和AHTPDB数据中已收录的活性肽序列进行比对,确定活性肽序列的新颖性。
2.4 潜在生物活性肽TDW和AGR与ACE的结合位点及作用机制分析
与蛋白酶活性部位的关键氨基酸结合并产生相互作用是生物活性肽发挥蛋白酶抑制活性的前提[29],因此研究采用分子对接深入探究具有较高Total_Score得分的2种潜在生物活性肽TDW和AGR与ACE和DPP-IV的作用模式和结合机理。ACE是一种含锌离子的二肽羧基酶,其活性中心由3个疏水腔组成,腔中有锌离子,目前的研究表明三肽对ACE的抑制作用主要是由氢键相互作用及配体与活性部位Zn离子的相互作用主导的[30,31]。TDW和AGR与ACE的分子对接结果如图2a和图2b所示,结果表明二者均能嵌入ACE的活性口袋中,与ACE活性中心的Ala356、Glu384、Glu411、His383、His387、Tyr523和Glu162等关键氨基酸作用发生多个氢键作用,并均能与Zn(701)活性中心发生配位作用。此外,AGR还能与ACE的His353形成3个arene-cation相互作用,使其在ACE的活性部位空腔中更为稳定的结合(图2b)。
图2 TDW和AGR与ACE的结合位点及相互作用
2.5 潜在生物活性肽TDW和AGR与DPP-IV的结合位点及作用机制分析
DPP-IV是一个由2个同源亚单位组成的以二聚体形式存在的高特异性丝氨酸蛋白酶,大量研究证实与其活性中心的关键氨基酸位点形成相互作用的小分子化合物能够抑制其催化活性,是潜在的DPP-IV抑制剂,对于糖尿病的预防和治疗具有重要意义[32]。TDW与DPP-IV的相互作用如图3a所示,TDW与DPP-IV活性部位的Glu205、His126、Ser209和Tyr547关键氨基酸形成4个氢键作用。此外,TDW还能与Tyr662形成π-π堆积作用而受到芳香性π环之间的相互吸引,从而使其在DPP-IV的活性部位更稳定的结合。而AGR主要与Glu205、Glu206、Tyr662、Ser209和Val207等关键氨基酸残基发生多个氢键相互作用,还能与Tyr666形成cation-arene键(图3b)。因此,二者均具有潜在的DPP-IV抑制活性。
图3 TDW和AGR与DPP-IV的结合位点及相互作用
3 结论
本研究建立了一种从稻米OC蛋白中高效的虚拟筛选生物活性肽的方法。研究表明与储藏蛋白大豆球蛋白和稻米谷蛋白相似,稻米OC蛋白也是生物活性肽的潜在来源,其中以ACE和DPP-IV抑制作用的生物活性肽为主,是稻米中除贮藏蛋白外一类重要的生物活性肽来源。分子对接研究表明虚拟筛选得到了2种三肽TDW和AGR具有较高的Total_Score打分值,且均能与靶蛋白活性部位的关键氨基酸残基形成氢键、π-π堆积、配位键等多种分子间相互作用,是潜在的具有ACE和DPP-IV抑制活性的生物活性肽,对糖尿和高血压的预防和治疗具有重要意义。