基于高维特征非线性筛选的HLA-A＊0201限制性CTL 表位预测

2013-09-21袁哲明代志军王志明

物理化学学报 2013年9期

韩娜袁哲明陈渊代志军王志明

(湖南农业大学，湖南省作物种质创新与资源利用重点实验室，湖南省植物病虫害生物学及防控重点实验室，长沙410128)

1 引言

细胞毒性T淋巴细胞(CTL)作为免疫细胞T细胞家族的重要成员，在恶性肿瘤治疗中起了关键作用.1其中，与主要组织相容性复合物(MHC-I)结合的抗原短肽即CTL表位(epitopes)，对CTL特异性杀伤效应起决定作用，被广泛应用于多肽疫苗设计.因实验方法鉴定CTL表位效率较低，CTL表位测定成为此类多肽疫苗设计开发的瓶颈，发展基于计算机算法的高精度CTL表位快速鉴定意义重大.

多肽空间结构与功能本质上由其一级结构(氨基酸序列)决定，高级结构很难测定而一级结构简便易得.已有研究结果表明，处于结合状态抗原肽立体结构受HLA-A*0201影响较小，决定抗原肽与HLA-A*0201结合强弱关键在于抗原肽残基与附近HLA-A*0201残基作用大小;受体HLA-A*0201可认为不变，故抗原肽序列各位点残基差异导致它们间亲和活性不同.2因此，多肽定量序效模型(QSAM)研究在研发肽类新药特别是抗原肽疫苗方面具广泛应用前景.多肽QSAM建模的两个重要内容是回归模型选择和其一级结构表征.在回归模型选择方面，常用的多元线性回归、偏最小二乘回归、神经网络等存在诸多弊端;3−6而基于结构风险最小的支持向量回归(SVR)较好地解决了小样本、非线性、过拟合、维数灾难和局部极小等问题，模型的外部预测能力优异.4因此本研究选用SVR为基本建模工具.在多肽一级结构表征方面，主要有基于氨基酸性质主成分分析的氨基酸描述子和直接基于氨基酸性质的氨基酸描述子两类.前者如Z标度，7，8每一主成分(描述子)是相应氨基酸多种物化性质的线性加权，虽综合性、代表性较好，但实现的是初始描述子的线性压缩与去冗余，难以反映初始描述子与多肽活性间的复杂非线性关系，且模型解释困难.后者如残基侧链全向表面积-电荷指数(ISA-ECI)，9虽描述子物化意义明确、解释性较好，但每个氨基酸残基仅由ISA和ECI两个参数表征显然不够全面.氨基酸指数数据库(http://www.genome.jp/aaindex/)中的531个特征是氨基酸物理化学性质的较全面总结，理论上可直接作为描述子用于肽、蛋白质结构表征，但由此衍生的问题是特征维数巨增，且无关、冗余特征影响模型精度.从m个特征中选取最优特征子集理论上有2m种可能，在m较大时无法穷举;多数现有启发式特征选择方法存在易陷入局部最优的缺陷;10以逐步线性回归筛选获得的特征应用于SVR等非线性建模，在理论上和实践上均缺乏证据支持.6

鉴此，本文以氨基酸的531个物理化学性质直接表征多肽序列，集成基于SVR发展的二元矩阵重排过滤器、多轮末尾淘汰非线性精细筛选方法以及SVR非线性解释性体系，运用于CTL表位鉴定，建立了精度高、解释性强的QSAM模型，并基于该模型对1.28×109条(其中2个位置被固定)虚拟9肽进行预测，获得了244880条预测活性高于8.77(现有最高实测值)的9肽，其中最高活性值达到9.707.结果报道如下.

2 数据与方法

2.1 数据来源

152条HLA-A*0201限制性CTL表位9肽序列与亲和活性pIC50引自文献，11其中多肽序列GLYSSTVPV出现两次但活性值不同，本文予以去除.为便于比较，参照文献11划分训练集(101个样本)和测试集(49个样本).pIC50为IC50的负对数，IC50(单位为nmol·L−1)为采用不同浓度的待测肽与0.5 nmol·L−1的放射性标记的HBVc18227(FLPSDYEPSV)T细胞表位肽(对照肽)与HLA-A*0201的复合物在温室下共孵育2 h，测定待测肽序列将对照肽/HLA-A*0201的复合物中50%的对照肽置换下来的浓度.

2.2 多肽序列表征

每条多肽序列上的每个氨基酸残基由氨基酸指数数据库中的531个描述子表征(命名为AA531)，依次串联排列.每条9肽含4779个初始描述子.

2.3 二元矩阵重排过滤器

假定初始训练集由n维列向量Y和n行m列矩阵X组成，本文中Y为亲和活性值pIC50，X为初始描述子.首先有条件随机产生k行m列取值为0或1的矩阵M(限制条件为每列0与1的个数均衡)，k可根据m值的大小和每轮筛选所耗费时间适当取值，本文k初始值为500，并每轮以步长50递减，下限为200.其次，矩阵M的每行以0(剔除)和1(保留)对应取出X的列，产生k个子集(i=1，2，...，k)，所有子集分别与Y组成k个数据集，各个数据集基于SVR经交叉测试(如未特别说明，本文交叉测试次数均为5次，核函数固定为径向基核，核函数参数经自动寻优给出)获得k个均方误差MSE，并与M组合成新的数据集D.最后，判断各特征是否保留时，先将M对应列各元素值取反得M′，与k个MSE组合后作为测试集，D作为训练集，预测得到k个MSE'，按照M和M′第一列以0和1值对k个MSE和k个MSE'进行分类，对得到的k个MSE0和k个MSE1取均值和除.12，13对保留的m1个特征对应原始数据集取出相应则保留该特征，反之剔列作为新的特征集X1，与Y组合成粗筛后的数据集D1，用于后续多轮末尾淘汰.

2.4 多轮末尾淘汰非线性精细筛选

基于SVR计算数据集D1的交叉测试MSE0.在第一轮筛选时，特征集X1(xij∈X1，i=1，...，n;j=1，...，m1)逐次删除第p列得到m1个特征子集X2(xij∈X2，i=1，...，n;j=1，...，p−1，p+1，...，m1)，交叉测试得到向量MSEj(j=1，...，m1)，若min(MSEj)≤MSE0，则剔除相应特征，反之筛选结束.6，12新特征子集X2(xij∈X2，i=1，...，n;j=1，2，...，m1−1)，与Y组合得到D2进入下一轮，直到没有变量剔除为止.

2.5 SVR非线性解释性体系

2.5.1 SVR模型非线性回归显著性检验

常用评估SVR模型优劣的MSE等指标，在不同数据集间不具可比性，且无法给出定性判断.这里引入F统计量:14

回归平方和:

剩余离差平方和:

其中，n为样本个数，m′为保留因子个数，yi、yi分别为第i个样本真值和估计值，yˉ为所有样本真值的均值，F自由度为 (m′，n−m′−1).当F ＞ Fα(m′，n−m′−1)，则表明SVR模型在α水平上非线性回归显著.

2.5.2 单因子重要性分析

因子越重要，则因变量Y随其大小变化越明显.将xj固定为零水平(平均值)，其它因子值不变作为测试集代入所建最优SVR模型，据预测值计算得到代表了x对j回归平方和的贡献.14由于非线性SVR模型中，离均差平方和SSy≠Q+U，因此本文利用矫正后的U′=U/(U+Q)×SSy和Q′=Q/(U+Q)×SSy，Q和U规格化到SSy=Q′+U′并计算xj固定下的Fj值:

其中，y′i分别为固定 xj的第 i个样本估计值，Fj的自由度ν1和ν2分别为1和n−m′−1.

2.5.3 单因子效应分析

为了解随着单个因子xj的变动，因变量Y的变化趋势，采用基于SVR的非线性单因子效应分析.14先将除xj外其他因子固定为其均值，并令xj在固定取值区间(通常为xj的极差)内按一定步长取多个水平，代入所建最优SVR模型获得预测值y，各因子规格化后作x−y效应图.

二元矩阵重排过滤器粗筛、多轮末尾淘汰精细筛和SVR非线性解释性体系以自编Matlab程序通过调用Libsvm 3.1软件包15实现并经验证通过.核函数固定为径向基核，核函数各参数基于gridregression.py搜索自动获取.

2.6 模型评价

训练集拟合精度及交叉验证精度采用决定系数R2和表示:16，17其中，ytr_i和ytr_i分别为训练集样本真值和拟合值，yˉtr为训练集样本真值的均值，y'tr_i为训练集交叉验证预测值，n1为训练集样本个数.

其中，yte_i和yte_i分别为测试集样本真值和预测值，yˉte为测试集样本真值的均值，n2为测试集样本个数.

3 结果与讨论

3.1 模型检验

训练集初始描述子个数为4779，基于SVR的交叉验证，MSE为0.359;经二元重排过滤器(BMSF)粗筛后，描述子个数降为27，交叉验证MSE降为0.215;进一步以多轮末尾淘汰法非线性精细筛选，得18个保留描述子，交叉验证MSE降至0.201.基于18个保留描述子，以训练集构建最优SVR模型，150条HLA-A*0201表位肽序列及其生物活性值、训练集拟合值、测试集预测值见表1;其拟合、留一法交叉验证决定系数R2、分别为0.957、0.708;独立预测决定系数及均方根误差、RMSEext分别为0.818、0.366，明显优于现有文献报道结(表2).图1和图2进一步直观展示了训练集拟合和测试集预测的优异结果.

3.2 模型解释

对表1全部150个样本基于18个保留描述子建立SVR模型，F(=151.032)＞F0.01(18，131)(=2.075)，表明非线性回归极显著.18个保留描述子单因子重要性分析结果见表3，均达极显著(F0.01(1，131)=6.832).18个保留描述子的单因子效应分析结果见图3.

表1 CTL表位的氨基酸序列与亲和性(pIC50)的实验值与预测值Table 1 CTLepitopes sequences with observed and predicted values(pIC50)of binding affinity

continued Table 1

3.3 高活性肽分子设计

由前所述，基于表1全部150个样本、18个保留描述子建立的SVR模型可以信赖，现依该模型进一步进行高活性表位肽预测与分子设计.9肽全组合预测集生成如下:因1位和5位为非重要残基，且实测150个9肽中活性最高表位肽为ILWQVPFSV(pIC50=8.77)，可固定1位残基为I，5位残基为V;其余7个位置残基(7因素)每个位置由20种天然氨基酸依次取代(20水平)，共产生207=1.28×109条虚拟9肽.预测结果表明，预测值大于8.77的9肽有244880条，最高预测值为9.707.预测值最高的前10条9肽见表4，可供进一步实验验证.

对预测值大于9.3的3276条虚拟9肽，逐位统计氨基酸出现频次，结果见图4(其中1位残基固定为I，5位残基固定为V)，各位置上字母越突出，则表示该氨基酸在该位置出现频次越高.

3.4 各位置氨基酸残基与亲和活性的关系

结合表3、图3和图4，逐位残基(除第1位和第5位非重要残基外)对表位肽活性影响分析如下.

Position 2(P2):多肽亲和性与该位残基多肽环信息测度、24STERIMOL最大侧链宽度值、25−6窗口位置卷曲螺旋权重值26等氨基酸空间性质有较大关联(表3)，且与多肽环信息测度呈显著正相关，与STERIMOL最大侧链宽度值呈负相关(图3).该位残基对抗原肽与MHC分子结合起重要作用，通常被认为是“锚点”.11频次统计分析显示，P2位为Val、Ala、Glu、Leu、Ile、Met等6种残基有助于提高表位肽活性(图4)，与结合基序法认为该位Ile、Met和Val是初级锚点的结论相近.27本文结果支持P2位为关键残基位点的现有认知，但解释不同，以往研究认为多肽亲和性与P2位残基的疏水性和电性有关，本文认为主要与P2位残基的空间性质有关.

表2 CTL表位的QSAR/QSAM模型比较Table 2 Comparison between QSAR/QSAM models of CTLepitopes

图1 训练集样本活性的实验值与回归值Fig.1 Observed values vs predicted values of binding affinity of training samples

图2 测试集样本活性的实验值与回归值Fig.2 Observed values vs predicted values of binding affinity of testing samples

Position 3(P3):多肽亲和性与该位残基的β-蛋白标准疏水值、28改进Kyte-Doolittle疏水值29等氨基酸疏水性质有较大关联(表3)，且与前者呈正相关关系(图3);频次统计显示该位可出现14种残基，其中Trp、Tyr、Phe三种残基合计频率超过80%(图4)，与Doytchinova等11该位残基侧链为芳香烃的疏水性氨基酸Trp、Tyr、Phe有利于提高亲和活性的观点一致.

Position 4(P4):多肽亲和性与该位残基的图形形状指数(反映氨基酸空间性质的综合指标)、25主成分IV(反映氨基酸多种性质的综合指标)、30侧链交互作用参数(反映氨基酸侧链间范德华力作用大小的指标)31和平均弹性指数(稳定性指标)32等四个性质有较大关联(表3)，且与前两者呈负相关，与后两者呈正相关(图3).该位残基被认为是标志链，主要功能是被T细胞表面抗原受体(T cell receptor，TCR)识别.33频次统计显示该位可出现7种残基，其中Pro、Gly、Glu三种残基合计频率超过87%(图4)，与宋哲等33认为4位的Gly对亲和活性贡献最大以及Kirksey等34认为4位Glu能有效提高亲和活性并易于被T细胞识别的观点吻合.

表3 QSAM模型中CTL表位的保留描述子Table 3 Reserved descriptors of CTLepitopes in QSAM model

图3 CTL表位18个保留描述子单因子效应x−y折线图Fig.3 x−y line chart of the single-factor effects for 18 selected descriptors of CTLepitopes

Position 6(P6):多肽亲和性与该位残基的反转链标准频率、35侧链1+1标记位原子数36关联较大(表3)，且与前者呈开口向上抛物线变化，与后者正相关(图3).频次统计显示该位可出现除Ala外的19种残基且较为分散(图4).综合判断，该位残基对活性影响较弱.

Position 7(P7):多肽亲和性与该位残基的螺旋N"'端残基标准化频率、37侧链原子组成38关联较大(表3)，且与前者正相关明显，与后者负相关明显(图3).频次统计显示，该位残基为 Pro、Met、Phe、Tyr、Ala可提高亲和活性(图4)，与宋哲等33认为7位的Thr、Pro、Phe对亲和活性贡献较大，Doytchinova等11认为7位易接受Ala、Val、Pro的观点接近.

表4 预测活性值(pIC50)最高的10条多肽序列Table 4 Ten sequences with the highest predicted values(pIC50)of binding affinity

图4 高活性虚拟9肽位置残基频次统计Fig.4 Frequency statistic of amino acids at each position among the high-activity virtual 9 peptide

Position 8(P8):多肽亲和性与该位残基的隐蔽残基百分比、39平均侧链存在角度40关联较大(表3)，且与前者呈负相关，与后者呈正相关(图3)，频次统计显示该位残基为Lys、Arg、Gln、Glu可提高亲和活性(图4).P8位残基与P4位残基同被认为是标志链.33

Position 9(P9):多肽亲和性与该位残基的α螺旋标准加权频率、4195%自由能自外向内转移参数、42N-末端转角信息测度24有较大关联(表3)，且与前两者正相关明显，与后者呈负相关(图3).该位残基一般认为也是“锚点”.11频次统计显示该位残基为Val、Met、Gly、Ala、Leu等5种残基可提高亲和活性(图4)，与宋哲等33认为9位的Val、Met对亲和活性贡献最大，Doytchinova等11认为9位易于容纳Ala、Val的观点较一致，支持P9位为关键残基位点的现有认知.

3.5 模型局限性

本文所建QSAM模型仍存在进一步改进之处.一是150条实测多肽很难代表209条9肽所产生的多种结构状态.由于不少相似序列结构基本相同，简单地增加实测多肽条数不仅耗时费力，也并不足以能完全解决这一问题.对类似9因素20水平这样复杂的多因素多水平实验设计与优化问题，本实验室曾发展了基于均匀设计(UD)与SVR的实验设计与分析新方法UD-SVR，并在多个动物营养、微生物发酵配方优化中得到成功应用.43−45因此，首先采用系列UD设计获得样本容量依次倍增的虚拟9肽集n1、n2、…、nj，模建每一条9肽构象，计数每一9肽集中结构状态数s1、s2、…、sj，对n−s作图，可大致估计s趋近饱和(si)时的最小虚拟9肽集ni(si＜ni)，从ni中挑出约si条结构状态非冗余的9肽序列，真实合成并实测其亲和活性，构建初始数据集，可能是解决这一问题的有效途径.二是本文仅基于序列的分子描述符而未涉及更为重要的基于结构的分子描述符.虽然T细胞表位是线性表位，46但B细胞表位主要为构象表位，47绝大多数的多肽活性与空间构象有关，基于序列的模型应用受限，基于结构的方法理论上更直观、更准确.48−51基于结构分子描述符，经高维特征非线性筛选建立更普适的高精度多肽QSAR模型是未来进一步研究的方向.

4 结论

将氨基酸指数数据库中的531个物理化学性质直接表征表位肽序列，经非线性特征筛选后建立SVR模型，获得了保留特征较少、预测精度较高的QSAM模型;通过对全组合虚拟9肽的预测，得到了多条预测亲和活性高于已知表位肽的9肽，可供实验验证;结合非线性解释性体系与高活性虚拟肽频次统计分析，进一步较全面阐明了特定位置残基对多肽亲和性的影响规律，为高活性多肽疫苗分子设计提供了切实指导.

致谢: 美国克莱姆森大学罗峰博士修改、润色英文摘要，谨致谢忱.

(1) Zhu，B.;Lin，Z.H.;Chen，Z.T.;Wu，Y.T.Immunological Journal 2005，21(3)，177. [朱波，林治华，陈正堂，吴玉堂.免疫学杂志，2005，21(3)，177.]

(2) Zhou，P.;Li，Z.L.;Tian，F.F.;Zhang，M.J.Chin.Sci.Bull.2006，51(11)，1259.[周鹏，李志良，田菲菲，张梦军.科学通报，2006，51(11)，1259.]

(3) Charkraborty，K.;Mehrotra，K.;Mohan，C.;Ranka，S.Neural Networks 1992，5(6)，961.doi:10.1016/S0893-6080(05)80092-9

(4) Vapnik，V.The Nature of Statistical Learning Theory，2nd ed.;Springer:New York，1995;pp 5−78.

(5)Wang，H.W.;Wu，Z.B.;Meng，J.Partial Least-Squares Regression-Linear and Nonlinear Methods，1st ed.;National Defence Industry Press:Beijing，2006;pp 34−54.[王惠文，吴载斌，孟洁.偏最小二乘回归的线性与非线性方法.北京:国防工业出版社，2006:34−54.]

(6) Yuan，Z.M.;Tan，X.S.Acta Agronomica Sinica 2010，36(7)，1176.

(7) Hellberg，S.;Sjöström，M.;Skagerberg，B.;Wold，S.J.Med.Chem.1987，30(7)，1126.doi:10.1021/jm00390a003

(8) Hellberg，S.;Eriksson，L.;Jonsson，J.;Lindgren，F.;Sjöström，M.;Skagerberg，B.;Wold，S.;Andrews，P.Int.J.Pept.Protein Res.1991，37(5)，414.

(9) Elizabeth，R.C.;William，J.I.J.Med.Chem.1995，38(14)，2705.doi:10.1021/jm00014a022

(10) Golub，T.R.;Slonim，D.K.;Tamayo，P.;Huard，C.;Gaasenbeek，M.;Mesirov，J.P.;Coller，H.;Loh，M.L.;Downing，J.R.;Caligiuri，M.A.;Bloomfield，C.D.;Lander，E.S.Science 1999，286(5439)，531.doi:10.1126/science.286.5439.531

(11) Doytchinova，I.A.;Darren，R.F.J.Med.Chem.2001，44(22)，3572.doi:10.1021/jm010021j

(12) Zhou，W.;Dai，Z.J.;Chen，Y.;Wang，H.Y.;Yuan，Z.M.Int.J.Mol.Sci.2012，13(1)，1161.

(13)Zhang，H.Y.;Wang，H.Y.;Dai，Z.J.;Chen，M.S.;Yuan，Z.M.BMC Bioinformatics 2012，13(1)，298.doi:10.1186/1471-2105-13-298

(14)Tan，X.S.;Wang，Z.M.;Tan，S.Q.;Yuan，Z.M.;Xiong，X.Y.Journal of System Simulation 2009，21(24)，7795. [谭显胜，王志明，谭泗桥，袁哲明，熊兴耀.系统仿真学报，2009，21(24)，7795.]

(15) Chang，C.C.;Lin，C.J.ACM TIST 2011，2(3)，1.

(16)Yang，S.B.;Xia，Z.N.;Shu，M.;Mei，H.;Lü，F.L.;Zhang，M.;Wu，Y.Q.;Li，Z.L.Chem.J.Chin.Univ.2008，29(11)，2213.[杨善彬，夏之宁，舒茂，梅虎，吕凤林，张梅，吴玉乾，李志良.高等学校化学学报，2008，29(11)，2213.]

(17) Liang，G.Z.;Mao，S.;Li，S.S.J.Chin.Chem.Soc.2008，55(5)，1178.

(18)Tropsha，A.;Paola，G.;Gombar，V.K.QSAR Comb.Sci.2003，22(1)，69.

(19) Mei，H.;Zhou，Y.;Liao，Z.H.;Li，Z.L.Acta Chimica Sinica 2006，64(9)，949.[梅虎，周原，廖志华，李志良.化学学报，2006，64(9)，949.]

(20) Ren，Y.R.Computers and Applied Chemistry 2011，28(6)，734.[任彦荣.计算机应用与化学，2011，28(6)，734.]

(21) Chen，T.The Application of 3D Amino Acids Descriptors to the Quantitative Structure−Activity Relationship Study of Peptides.Ph.D.Dissertation，Shanxi University，Shanxi，2011.[陈婷.三维氨基酸描述子在肽类定量构效关系研究中的应用[D].山西:山西大学，2011.]

(22) Liang，G.Z.Construction of Representation Techniques and Investigation on Structure−Activity Relationship for Biological Sequences.Ph.D.Dissertation，Chongqing University，Chongqing，2007.[梁桂兆.生物序列表征体系构建及结构与功能关系研究[D].重庆:重庆大学，2007.]

(23)Wang，Z.M.;Han，N.;Yuan，Z.M.;Wu，Z.H.Acta Phys.-Chim Sin.2013，29(3)，498.[王志明，韩娜，袁哲明，伍朝华.物理化学学报，2013，29(3)，498.]doi:10.3866/PKU.WHXB201301042

(24) Robson，B.;Suzuki，E.Am.J.Mol.Biol.1976，107(3)，327.

(25) Fauchère，J.L.U.C.;Charton，M.;Lemont，B.K.;Verloop，A.;Pliska，V.Int.J.Pept.Protein Res.1988，32(4)，269.

(26) Qian，N.;Sejnowski，T.J.Mol.Biol.1988，202(4)，865.doi:10.1016/0022-2836(88)90564-5

(27) Falk，K.;Rötzschke，O.;Stevanovié，S.;Jung，G.;Rammensee，H.G.Nature 1991，351(23)，290.

(28) Hilda，C.;Marta，B.;Mauricio，C.;Felipe，G.Protein Eng.1992，5(5)，373.doi:10.1093/protein/5.5.373

(29) Juretića，D.;Zucićb，D.;Lucčićc，B.;Trinajstićc，N.Computers Chem.1998，22(4)，279.doi:10.1016/S0097-8485(97)00070-3

(30) Sneath，P.H.A.J.Theoret.Biol.1966，12(2)，157.doi:10.1016/0022-5193(66)90112-3

(31) Krigbaum，W.R.;Komoriya，A.BBA-Protein Struct.M.1979，576(1)，204.doi:10.1016/0005-2795(79)90498-7

(32) Vihinen，M.;Torkkila，E.;Riikonen，P.Proteins:Structure，Function，and Genetics 1994，19(2)，141.

(33) Song，Z.;Liu，T.;Liu，W.;Zhu，M.H.;Wang，X.G.Acta Phys.-Chim.Sin.2007，23(2)，198.[宋哲，刘涛，刘伟，朱鸣华，王晓钢.物理化学学报，2007，23(2)，198.]doi:10.1016/S1872-1508(07)60016-3

(34) Kirksey，T.J.;Pogue-Caley，R.R.;Frelinger，J.A.;Collins，E.J.J.Biol.Chem.1999，254(52)，33726.

(35) Tanaka，S.;Scheraga，H.A.Macromolecules 1977，10(2)，291.doi:10.1021/ma60056a015

(36) Charton，M.;Barbara，I.C.J.Theor.Biol.1983，102(1)，121.doi:10.1016/0022-5193(83)90265-5

(37) Aurora，R.;Rose，G.D.Protein Sci.1998，7(1)，21.

(38) Grantham，R.Science 1974，185(4154)，862.doi:10.1126/science.185.4154.862

(39) Janin，J.;Chothia，C.Biochemistry 1978，17(15)，2943.doi:10.1021/bi00608a001

(40) Meirovitch，H.;Scheraga，H.A.Macromolecules 1980，13(6)，1406.doi:10.1021/ma60078a014

(41) Levitt，M.Biochemistry 1978，17(20)，4277.doi:10.1021/bi00613a026

(42) Radzicka，A.;Wolfenden，R.Biochemistry 1988，27(5)，1664.doi:10.1021/bi00405a042

(43)Yuan，Z.M.;Zuo，B.;Tan，S.Q.;Tan，X.S.;Xiong，X.Y.Chin.J.Process Eng.2009，9(1)，148.[袁哲明，左斌，谭泗桥，谭显胜，熊兴耀.过程工程学报，2009，9(1)，148.]

(44) Li，J.;Tan，X.S.;Tan，S.Q.;Yuan，Z.M.;Xiong，X.Y.Acta Entomologica Sinica 2010，53(4)，420.[李俊，谭显胜，谭泗桥，袁哲明，熊兴耀.昆虫学报，2010，53(4)，420.]

(45) Zhou，S.H.;Li，J.;Yao，R.X.;Zhang，X.;Yuan，Z.M.Acta Entomologica Sinica 2012，55(1)，124.[周世豪，李俊，姚润贤，张星，袁哲明.昆虫学报，2012，55(1)，124.]

(46)Yasser，E.L.M.;Dobbs，D.;Honavar，V.PLoS One 2008，3(9)，e3268

(47) Zhang，W.;Xiong，Y.;Zhao，M.;Zou，H.;Ye，X.H.;Liu，J.BMC Bioinformatics 2011，12(1)，341.doi:10.1186/1471-2105-12-341

(48) Shen，M.Y.;Zhou，S.Y.;Li，Y.Y.;Pan，P.C.;Zhang，L.L.;Hou，T.J.Mol.Biosys 2013，9(3)，361.doi:10.1039/c2mb25408e

(49) Hou，T.J.;Li，N.;Li，Y.Y.;Wang，W.J.Proteome Res.2012，11(5)，2982.doi:10.1021/pr3000688

(50) Zhang，C.Q.;Hou，T.J.;Li，Y.Y.Curr.Comput.-Aided Drug Des.2013，9(1)，60.

(51)Yan，Y.;Li，Y.;Zhang，S.;Ai，C.J.Mol.Graph.Model.2011，29(5)，747.doi:10.1016/j.jmgm.2010.12.008

猜你喜欢

亲和性表位残基

基于各向异性网络模型研究δ阿片受体的动力学与关键残基*

“残基片段和排列组合法”在书写限制条件的同分异构体中的应用

乙型肝炎病毒B和C基因型S蛋白特异性CTL表位保守性分析

荔枝高接品种的选择

4个苹果观赏品系开花、授粉习性及花粉管萌发的荧光显微观察

不结球白菜与西洋菜远缘杂交亲和性研究

基于MECA算法的BP网络研究

联合T、B细胞表位设计多肽疫苗的研究进展①

基于支持向量机的蛋白质相互作用界面热点残基预测

小反刍兽疫病毒化学合成表位多肽对小鼠的免疫效果研究

物理化学学报

2013年9期