高通量筛选高特异性的检测类风湿关节炎的生物探针分子
2015-06-23李洪伟吴仲岿杨家安赵晓飞
李洪伟,吴仲岿,杨家安,赵晓飞
(1.武汉理工大学材料科学与工程学院,湖北武汉430070;2.麦科罗医药科技有限公司,湖北武汉430075)
高通量筛选高特异性的检测类风湿关节炎的生物探针分子
李洪伟1,吴仲岿1,杨家安2,赵晓飞2
(1.武汉理工大学材料科学与工程学院,湖北武汉430070;2.麦科罗医药科技有限公司,湖北武汉430075)
从靶蛋白-配体特异性结合角度,采用蛋白折叠码(PFSC)技术在PDB数据库中高通量地筛选出与TNFA_HUMAN靶点区结合灵敏度高的分子作为检测类风湿关节炎的生物探针分子.结果显示,小分子307具有相对较高的灵敏度和较低的检出限,可以作为生物探针来检测类风湿关节炎.结果显示,蛋白指纹检索技术是一种快速、有效的蛋白质结构检索工具,通过对数据库中海量数据的筛选,可为重大疾病的检测试剂开发提供先导信息.①
蛋白折叠形状码;高通量筛选;类风湿关节炎;生物探针分子
0 引言
类风湿关节炎RA是一种常见的以关节炎症和滑膜细胞增殖为特征的全身性自身免疫性疾病,具有极高的致畸性[1-2],临床症状类似于风湿性关节炎,但两者病因病理相差巨大.传统检测RA的方法是检测类风湿因子RF水平,但存在大量漏诊和误诊状况[3-5].有大量资料表明,在RA滑膜病变的发展过程中有多种炎性因子,其中巨噬细胞分泌的细胞因子IL-1、TNF-α在发病过程中起主导作用,病患血液和炎性滑液中IL-1、TNF-α明显高于健康人群,且随疾病的活动度增高而升高,二者相互协同[6-9].因此,我们可通过检测其中之一来诊断RA,本研究中以TNF-α为例.
目前,基于靶点蛋白的药物因具有高特异性和高敏感度成为当今药物开发的研究热点,TNFA_HUMAN是类风湿关节炎的一个重要治疗靶蛋标[10],本研究中从蛋白质-配体高特异性结合的角度,拟从与靶蛋白相互作用的小分子配位体的角度来检测目标靶蛋白.目前,蛋白质数据库(PDB)已经积累了大量蛋白质结构数据,库中除了含有蛋白质结构外,还包括将近两万小分子配位体.如何从海量已知数据库中筛选针对特定蛋白靶标的配位体是非常困难的,在蛋白折叠形状码(PFSC)基础上发展的蛋白指纹检索技术可以对数以万计的蛋白结构进行快速有效检索[11-13].因此本研究中采用PFSC技术从配位体分子角度高通量地筛选出与TNFA_HUMAN靶点区结合敏感度高的分子,为类风湿关节炎检测试剂的开发提供先导信息.
1 实验部分
1.1 数据来源TNF-α是由白血球产生具有抗肿瘤作用而导致炎症的细胞因子,TNF-α拮抗剂是控制类风湿关节炎病情发展的有效药物[10],因此,本研究中从治疗RA的靶点-配体分子的角度筛选配体分子.首先,从PDB中提取有关TNF-α的pdb晶体结构,共14个,分别是1A8M,1TNF,2AZ5,2E7A,2TUN,2ZJC,2ZPX,3ALQ,3IT8,3L9J,3WD5,4G3Y,4TSV,5TSW.我们以DrugBank数据库发布的信息,找出其中能与小分子配位体作用的TNF-α蛋白结构,它们分别是3ALQ,3L9J,2AZ5,2ZJC和3IT8,其中3ALQ与3L9J是金属配体,特异结合性较差,故范围缩小至2AZ5、2ZJC与3IT8 3种.
理想的探针分子应该具有较高的选择性,但小分子通常会作用于多个靶点蛋白,所以需要在全部的PDB数据库中检索出与小分子配体和TNFA_HUMAN作用相似的蛋白并进行打分排序,从中筛选出对TNFA_HUMAN兼具高特异性高敏感度的小分子用作类风湿关节炎检测试剂的开发.
表1 可与小分子配位体相互作用的蛋白结构
1.2 方法
1.2.1 蛋白三维结构转换成一维PFSC码蛋白形状折叠码(PFSC)技术是采用27个向量(包括26个英文字母和一个符号$)表示的描述蛋白质碳骨架从氨基端到碳基端的三维结构的方法,它可以将一个具有确定三维结构的蛋白质全部或部分的转化为一维指纹结构的编码,并且可以精细区分出相似三维结构及功能[12-13].通过PFSC程序将全部PDB数据的蛋白质三维结构(截止到2015年1月15日,共106 082个)下载并转化成一维指纹数据库,以便高通量检索提取有用信息.
1.2.2 分子作用模拟Accelrys Discovery Studio(DS)是基于结构的蛋白质模拟、优化和药物设计工具.分别模拟出2AZ5、2ZJC与3IT8 3种蛋白质与其小分子配体相互作用模型,观察pdb文件中配体与蛋白质作用位置(即活性位点)以帮助定义目标靶点区.
图1 2AZ5与配体相互作用构象的侧面视图(A)和俯视图(B)
图2 2ZJC与配体相互作用构象的侧面视图(A)和俯视图(B)
图3 3IT8与配体相互作用构象的侧面视图(A)和俯视图(B)
1.2.3 TNFA靶点区定义设置PFSC程序检索条件值,结合Discovery Studio模拟中与配体较强作用的活性位点定义检测靶点片段,通过PFSC程序先将蛋白靶点区结合位点片段的空间构型转换为一维指纹码,对结合位点在PDB一维指纹码数据库内进行高通量的相似性搜索,拟发现具有类似结合位点的复合物晶体结构.
1.2.4 数据库扫描及处理从TNFA_HUMAN靶点区出发,利用上述药物蛋白靶点检索技术分别扫描全部的蛋白指纹数据库,通过比较蛋白指纹数据库中蛋白-配体特异性结合位点与TNFA蛋白-配体结合位点的相似性进行打分,打分系统由PFSC码、关键残基的物理化学性质(PHCP-k)和全部残基的物理化学性质(PHCP-a)等组成,分数进行加权[13],分值越高表示特异性结合程度越相似,将与同一蛋白作用的各片段分值导入Excel表格,根据加权分值降序排列,提取出特异性结合度高的排名前200的蛋白结构添加Uniport信息,最终筛选出与TNFA_HUMAN靶蛋白作用相似性最大的小分子配体,可以用作开发类风湿关节炎检测试剂.
2 结果与讨论
2.1 靶点区选取
2.1.1 2AZ5靶点区选取2AZ5共有4条多肽链与2个小分子配位体(307),结合Discovery Studio模拟结合位点图示可以知道同侧两条链与同一个配体相互作用,整个模拟图呈轴对称,同侧链(A链和C链)得到的靶点区也相似,本研究对与A链和C链作用的靶点区进行分析,PFSC确定结合位点编码区如表2所示.
表2 2AZ5靶点区的氨基酸序列和PFSC编码
表3 2JZC靶点区的氨基酸序列和PFSC编码
表4 3IT8靶点区的氨基酸序列和PFSC编码
2.1.2 2ZJC靶点区选取对于2ZJC结构,Discovery Studio模拟结合位点显示其三条链均与配位体GOL作用,PFSC确定的结合位点靶点区见表3.
2.1.3 3IT8靶点区选取3IT8共有12条链,其中D、E、F、J、K、L共6条链可以与小分子NAG作用,结合Discovery Studio模拟结合位点,每条链与NAG作用的位点也相似,因此选择E链上的靶点区作为检索靶点,PFSC确定的结合位点靶点区见表4.
2.2 相似性检索的数据处理
2.2.1 2AZ5的数据分析在全部检索结果中选出前200名受体蛋白,添加Uniprot信息.正文中选取了应用PFSC码在10万蛋白结构数据库中高通量筛选出的与2AZ5和小分子结合性相似度排名前20的蛋白质,药物蛋白靶点检索结果显示小分子307可以作用于TNFA_HUMAN、OMPX_ECOLI、PAGP_ECOLI等多种受体蛋白.在我们选取的排名前200蛋白中,除了集中作用于TNFA_HUMAN之外,还集中作用于包括OMP、BGAL、Q8WSF8和Q8RLA6等类别受体(表5).同时,根据药物蛋白靶点检索相似性打分的结果显示307小分子优先且集中作用于TNFA_HUAMN族蛋白,说明小分子307对TNFA_HUMAN靶蛋白兼具特异结合性和较高的敏感度,因此可以将小分子307作为类风湿关节炎检测试剂的潜在探针分子.
2.2.2 2JZC的数据分析正文中选取了应用PFSC码在10万蛋白结构数据库中高通量筛选出的与2JZC和小分子GOL结合度相似性排名前20的蛋白质,药物蛋白靶点检索结果显示小分子GOL可以集中且优先作用于CARP_YEAST蛋白靶标.在我们选取的排名前200蛋白中,除了集中作用于CARP_YEAST之外,还集中作用于包括GSA_SYNE、AMPM_ECOLI、Q89ZB9_BACTN、B2 MG_HUMAN等类别受体(表6).同时,根据药物蛋白靶点检索相似性打分的结果显示小分子GOL对目标蛋白TNFA_HUMAN只有特异结合性并无较高的敏感度,因此,不能将小分子GOL作为检测类风湿关节炎的潜在探针分子.
表5 使用PFSC码高通量筛选出与2AZ5和小分子307相似结合的排名前20的蛋白质(10万数据库)
表6 高通量筛选出与2JZC和小分子GOL相似结合的排名前20的蛋白质(10万数据库)
续表6
2.2.3 3IT8的数据分析正文中选取了应用PFSC码在10万蛋白结构数据库中高通量筛选出的与3IT8和小分子NAG结合性相似度排名前20的蛋白质,药物蛋白靶点检索结果显示小分子NAG可以优先作用于TNFA_HUMAN蛋白靶标,但在我们选取的排名前200蛋白中来看,NAG并不集中作用于TNFA_HUMAN蛋白靶标,还集中作用于包括KDM6B_MOUSE、OMPA_ECOLI、PAGP_ECOLI、APEA_CLOAB等类别受体,说明NAG对于TNFA_HUMAN蛋白靶标敏感度不高(表7).同时,根据药物蛋白靶点检索相似性打分的结果显示小分子NAG对目标蛋白TNFA_HUMAN并无具有高度的敏感性,只具有特异结合性,因此不能将小分子NAG不能作为类风湿关节炎检测试剂的潜在探针分子.
表7 使用PFSC码高通量筛选出与3IT8和小分子NAG相似结合的排名前20的蛋白质(10万数据库)
3 结论
1)基于靶点诊断可以在RA的早期就具有较高的检出限,同时,可以结合RA的其他征象进行综合评估,为类风湿关节炎的早期诊断、疾病活动性和预后提供了重要的参考,另外,本方法在治疗的过程中也可作为观察疗效的一个重要指征.
2)本研究从蛋白质-配体高特异性结合角度,高通量地虚拟筛选出与TNFA_HUMAN靶点区结合敏感度高的小分子307,为类风湿关节炎检测试剂提供了先导信息.
3)采用PFSC技术进行的高通量筛选整个PDB数据库(约十万蛋白质)仅需几个小时,大大提高了筛选效率,具有很大的应用前景.
[1]周广宇,王茜,毕黎琦.类风湿关节炎的发病机理[J].中国社区医师,2002,18(17):14-15.
[2]Vaughan J H.Pathogenic concepts and origins of rheumatoid factor in rheumatoid arthritis[J].Arthritis Rheum,1993,36:1.
[3]冯秀媛,王永福,宫怡,等.类风湿因子与类风湿关节炎疾病活动性评分及关节损害的关系[J].包头医学院学报,2011,27(1):43-44.
[4]陈丹萍.类风湿因子检测方法在类风湿关节炎诊治中的应用分析[J].内蒙古中医药,2013,14:92-93.
[5]Xiao Chuyin,Pan Yunfeng,Gu Jieruo,Correlation between rheumatoid factor and activity orseverity of rheumatoid arthritis[J]. Journal of Clinical Rehabilitative Tissue Engineering Research,2008,12(46):9193-9195.
[6]Bongartz T,Sutton AJ,Sweeting MJ,et al.Anti-TNF antibody therapy in rheumatoid arthritis and the risk of seriousinfections and malignancies:systematic review and meta-analysis of rareharmful effects in randomized controlled trials[J].JAMA,2006,295(19):2275-2285.
[7]刘德芳,郭明阳,呼永河,等.类风湿关节炎湿热痹阻型患者血清和关节液IL-1、IL-6、TNF-α的表达研究[J].免疫学杂志,2014,30(5):447-450.
[8]陈良东,林洁,周剑波,等.类风湿关节炎患者IL-17、IL-18、IL-6和TNF-α检测的意义[J].当代医学,2010,16(7):13-14.
[9]王宏伟.类风湿关节炎患者血清中肿瘤坏死因子-α的水平测定及临床意义[J].甘肃中医学院学报,2011,28(6):51-52.
[10]陈丽娜.TNF拮抗剂治疗对RA患者外周血Th亚群的影响其机制的究[D].西安:第四军医大学,2011.
[11]Yang J.Comprehensive description of protein structures using protein folding shape code[J].Proteins,2008,71(3):1497-1518.
[12]Yang J.Complete description of protein folding shapes for structural comparison//in series,protein biochemistry,synthesis,structure and cellular functions:protein folding[M].Edited by Walters EC.New York:Nova Science Publishers,2011:421-442.
[13]Yang J,Lee W H.Protein structure alphabetic alignment,protein structure[M].Edited by Eshel Faraggi.New York:InTech Publishers,2012:133-156.
(责任编辑 胡小洋)
High-throughput screening of biological probe molecules with high specificity to detection of rheumatoid
LI Hongwei1,WU Zhongkui1,YANG Jiaan2,ZHAO Xiaofei2
(1.School of Materials and Engineering Science,Wuhan University of Technology,Wuhan 430070,China;2.Micro PharmaTech,Co.Ltd.,Wuhan 430075,China)
From the perspective protein-ligandspecific binding,the protein folding code(PFSC)will be used for high-throughput screening the molecule which is high sensitivity binding to TNFA_HUMAN target area from PDB database as biological probes molecular detection of rheumatoid disease.The results show that 307 small molecules have a relatively high sensitivity and low detection limits,so it can be used as biological probes to detect rheumatoid arthritis,also confirmed protein fingerprint retrieval technology is a rapid,efficient tool for the screening protein structure,also by screening for massive data in the database,providing information for pilot testing reagent development of major diseases.
protein folding shape code;high-throughput screening;rheumatoid arthritis detection;biological probe molecules
O69;Q599
A
10.3969/j.issn.1000-2375.2015.05.021
1000-2375(2015)05-0506-07
2015-02-03
研究生自主创新基金(2014-zy-014)资助
李洪伟(1988-),女,硕士生;吴仲岿,通信作者,教授,E-mail:zkwu@whut.edu.cn