芍药查尔酮异构酶基因(CHI)克隆、密码子偏好性分析以及蛋白结构功能预测

2016-06-03吴彦庆赵大球

华北农学报 2016年2期

关键词：芍药

吴彦庆,赵大球,王　静,陶　俊

(扬州大学园艺与植物保护学院,江苏扬州　225009)

芍药查尔酮异构酶基因(CHI)克隆、密码子偏好性分析以及蛋白结构功能预测

吴彦庆,赵大球,王静,陶俊

(扬州大学园艺与植物保护学院,江苏扬州225009)

摘要：为了丰富芍药CHI基因研究的基础数据,首先利用RACE技术对芍药CHI基因的CDS区进行克隆,并通过EMBOSS软件分析序列的密码子偏好性,其次利用生物信息学软件和在线数据库对芍药CHI进行蛋白结构与功能预测。结果表明,克隆获得芍药CHI 基因cDNA序列长度为898 bp(GenBank序列号:JN119872),芍药CHI基因偏好使用以A/U结尾的密码子,28种偏好密码子(RSCU>1),其中偏好性较强的有UUG、UGU、CAU、AGA、AGG、CGG(RSCU≥2),在密码子的使用频率上,芍药CHI基因与酵母、大肠杆菌等模式生物基因组的差异均大于拟南芥基因组。芍药CHI为非跨膜亲水的稳定蛋白,无信号肽,属于非分泌蛋白;主要分布在细胞质(45.0%)和微体(42.5%)中;无糖基化位点,14个磷酸化位点,其中第20位氨基酸处存在一个典型的磷酸激酶PKC,含有1个异构酶Chalcone保守结构域;二级结构包括α螺旋(39%)、延伸链(20%)、β-转角结构(13%)和无规则卷曲(27%);三级结构呈β-三明治折叠形成的倒置花束。发现了一个异构酶催化活性区域和一个重要的特异性蛋白质激酶PKC位点,为今后深入研究CHI基因功能提供有利的基础资料,此外,拟南芥真核表达更适合作为芍药CHI基因的外源表达系统。

关键词：芍药;CHI基因;密码子偏好性;蛋白结构与功能

花色的优劣不仅影响到观赏植物的观赏价值,而且直接关系到其商业开发价值,具有新奇花色的观赏植物拥有更为广阔的市场前景。芍药(PaeonialactifloraPall.)是中国传统名花,尽管我国芍药品种资源丰富,花色多样如粉、红、紫色系品种,而黄色品种仅有1个,因此,培育新奇花色如黄色的芍药品种已是我国育种工作者当前面临的重要课题,常规的栽培方式已经不能从根本上去解决黄色芍药品种的匮乏问题,这也提示我们迫切需要从芍药花色形成与调控的分子机制入手,最终利用分子设计改良芍药花色,促进芍药产业的可持续发展。研究发现,涉及黄色形成的色素主要为类胡萝卜素(Carotenoids)和类黄酮(Flavonoids)两大类,在类黄酮生物合成途径中,黄色的形成均与查尔酮异构酶CHI(Chalcone isomerase)基因有关[1]。CHI基因是催化黄色的查尔酮转化为无色的柚皮素的关键酶,CHI基因表达量的多少会直接影响到上游黄色查尔酮、下游无色或淡黄色花黄素以及红色花色苷的积累,CHI基因在黄色花的改良中起着十分重要的作用[2]。由于CHI基因在花色形成过程中的重要调控作用,引起了许多植物研究者的密切关注。Mehdy等[3]第一次从蚕豆中分离出CHI基因的cDNA序列,随后在大豆[4](Glycinemax)、金鱼草[5](Antirrhinummajus)、翠菊[6](Callistephuschinensis)等植物中分离出CHI基因。随后观赏植物和草本植物的CHI基因也开始引起研究者的高度关注,如乔中全等[7]成功克隆出金银花叶片CHI基因cDNA全长序列725 bp;马春雷等[8]采用ESTs测序技术和T4RNA连接酶介导的5′ RACE技术克隆了茶树CHI基因全长1 163 bp。目前,国内外关于芍药CHI基因的研究还处于起步阶段,对其序列信息、蛋白结构功能以及表达模式尚未清楚。本研究首先利用RACE技术,克隆芍药CHI基因全长cDNA序列,并将芍药CHI基因编码序列翻译成氨基酸序列,并利用在线预测以及生物信息软件进一步分析CHI蛋白理化性质、二级结构、保守功能域以及重要功能位点,并构建CHI蛋白三维结构模型,为今后深入探究CHI基因功能以及将其作为芍药花色育种的有效遗传标记提供理论参考。此外,基因密码子偏好性分析可以有效地揭示基因分子进化机制和外源表达模式[9-10],在此基础上本研究利用EMBOSS软件包[11]分析芍药CHI基因编码区密码子使用偏好性,并分别与拟南芥、大肠杆菌和酵母等3种不同的模式生物基因组密码子使用频率进行差异比较,寻找芍药CHI基因适合的外源表达系统,旨在为今后将CHI基因转入模式生物中进行功能验证提供一定的指导和依据。

1材料和方法

1.1试验材料

1.1.1样本来源本研究选用芍药红艳争辉内外花瓣为试验材料,进行酮异构酶基因CHI(Chalcone isomerase)的克隆;试验材料于2011年4-7月采自扬州大学园艺与植物保护学院芍药种质资源圃,采取花瓣后立即置于液氮速冻并带回实验室,于-70 ℃超低温冰箱中保存备用。

1.1.2主要试剂RACE试剂盒(3′-Full RACE Core Set Kit、5′-Full RACE Core Set Kit、SMARTerTMRACE cDNA Amplification Kit)、DL2000 Marker、TaqDNA聚合酶、dNTP、PCR Buffer、DNA凝胶回收试剂盒、DH5α大肠杆菌(Escherichiacoli)均购自TaKaRa公司,所有引物合成以及DNA序列测定均由上海生工生物工程技术服务有限公司完成。

1.2试验方法

1.2.1引物设计根据GenBank数据库中已报道的不同植物CHI基因序列的保守区域,运用Primer Premier 5.0软件分别设计目的基因的5′端和3′端RACE扩增引物(表1),引物送上海生工生物工程技术服务有限公司合成。

表1　芍药CHI基因引物信息

1.2.2RACE扩增及测序以芍药花瓣中所提取的总RNA为模板(1.0 μg),根据3′-full RACE Core Set Kit和5′-full RACE Core Set Kit的说明书进行cDNA的3′末端和5′末端扩增;扩增获得的PCR产物利用1%琼脂糖凝胶进行检测,DNA产物经纯化回收,进一步克隆连接到pMD18-T载体上,转化和挑取质粒进行测序验证。

1.2.3亚细胞定位以及蛋白结构功能预测利用DNAMAN软件将CHI基因的核苷酸序列翻译成相应的氨基酸序列,首先通过亚细胞定位工具TargetP[12]以及PSORTⅡPrediction(http://psort.hgc.jp/form.html)分别进行CHI蛋白亚细胞定位分析[13-14]。其次,利用生物信息学软件预测芍药CHI蛋白基本理化性质、二级结构、三维空间结构以及蛋白修饰位点(包括糖基化位点、磷酸化位点)和保守功能域,包括利用ProtParam分析蛋白理化性质,SignalP 4.0软件[15]分析信号肽,ProtScale分析蛋白疏水性区域;TMHMM 2.0分析蛋白跨膜区域,Antheprot 5.0(Universite Claude Bernard,Lyon)软件分析蛋白二级结构(包括α螺旋、β延伸链、无规则卷曲);利用SWISS-MODEL软件[16]进行三维同源建模分析;利用NetNGlyc分析糖基化位点,NetPhos分析磷酸化位点以及NetPhosK 1.0分析特异性蛋白激酶位点,最后利用SMART软件[17]分析蛋白保守功能域。

1.2.4密码子使用偏好性分析本研究利用EMBOSS软件包[11]中CodonW、CHIPS以及CUSP软件分别计算以下密码子偏好性指标:①有效密码子数(Effective number of codon,ENC)、整个CDS序列的整体GC含量、第3位碱基上GC含量(GC3s);②同义密码子相对使用度RSCU(Relative synonymous codon usage),目前被认为是衡量密码子使用偏好性程度的有效指标[18];③密码子使用频率(Frequency)。此外,拟南芥、大肠杆菌以及酵母基因组的密码子偏好性数据来源于密码子使用数据库 Codon Usage Database (http://www.kazusa.or.jp/codon)。

2结果与分析

2.1芍药CHI基因克隆与测序分析

以芍药花瓣总RNA为模板,分别进行CHI基因3′端和5′端RACE扩增,3′端扩增得到一条约为800 bp的条带,5′端扩增得到一条约为300 bp的条带,其大小均与预期片段长度相一致(图1)。经测序与拼接结果显示(图2),芍药CHI基因cDNA序列全长898 bp,5′-UTR非编码区(194 bp)、具有一个完整开放阅读框ORF(654 bp)、3′-UTR非编码区(50 bp)和poly A(12 bp),该基因已提交GenBank数据库,登录号为JN119872。

图1　芍药CHI基因RACE扩增

推导的氨基酸序列标于相应核苷酸序列下方,其余为非编码区;方框表示起始密码子;*表示终止密码子;下划线表示多聚腺苷酸化信号。

2.2芍药CHI基因密码子偏好性分析

2.2.1芍药CHI基因ENC、GC和GC3s计算CodonW在线程序计算芍药CHI基因的ENC值、GC含量和GC3s值分别为59.51,0.476,0.488。一般来说,ENC值≤35表示该基因有显著的密码子偏好性[19],结果显示ENC值偏大,表明芍药CHI各密码子在编码氨基酸时出现的频率比较一致,没有明显的密码子偏好性;CHI编码区GC和GC3s含量均略小于50%,表明芍药CHI基因稍微偏好使用以A/U 结尾的密码子,且在整个编码区序列中AU含量大于GC。

2.2.2相对同义密码子使用度RSCU(Relative synonymous codon usage)分析CHIPS在线程序计算芍药CHI基因中每个密码子的RSCU值,结果显示(表2),在芍药CHI的所有密码子中(除起始密码子AUG、终止密码子UGA、UAG、UAA外),有28种密码子的RSCU值>1.00,为CHI基因的偏好性密码子,其中偏好性较强的有UUG、UGU、CAU、AGA、AGG、CGG(RSCU≥2.00);而编码Ala的密码子GCA、GCU,Asn的密码子AAC、AAU,Trp的密码子UGG,其RSCU值均等于1.00,结果表明Ala、Asn和Trp在芍药CHI基因中没有使用偏好性。

表2　CHIPS程序计算芍药CHI基因的密码子RSCU值

注:带有下划线的数值表示RSCU>1.00,表明该密码子使用频率较高。

Note:The number with underline means RSCU>1.00,which indicates a codon with higher frequency.

2.2.3与模式生物基因组密码子使用频率比较分析密码子使用频率(Frequency)在不同物种及生物体的基因密码子使用存在着很大的差异,通常可以利用不同物种之间密码子使用频率比值来分析密码子使用偏好性的差异程度,若密码子使用频率≤0.5或者密码子使用频率>2.0时,表示2个物种之间存在较大的密码子使用偏差;反之,密码子使用频率位于0.5～2.0表示密码子使用偏好性程度比较接近。本研究通过比较芍药CHI基因与拟南芥、酵母、大肠杆菌等模式生物基因组的密码子使用频率,发现芍药CHI与拟南芥基因组存在19个差异较大的使用密码子,而与酵母、大肠杆菌基因组分别存在23，26个差异较大的使用密码子,由此可以看出拟南芥基因组与芍药CHI基因的密码子使用偏好性最接近,拟南芥真核表达可能更适合作为CHI基因的外源表达系统(表3)。

表3　芍药CHI与模式生物密码子使用偏好性比较

表3(续)

注:下划线表示2个物种密码子比较具有明显偏差(≤0.5,≥2)的分值。CHI/E、CHI/Y和CHI/A分别表示CHI基因与大肠杆菌基因组E、酵母基因组Y和拟南芥基因组A的密码子使用频率比值。

Note:The value marked with “underline” means significantly different codon usage bias between the two species.CHI/E,CHI/Y andCHI/A mean the codon usage frequency ratio ofCHIgene andEscherichiacoligenome E,Saccharomycesgenome Y,Arabidopsisgenome A,respectively.

2.3芍药CHI基因的蛋白结构和功能分析

2.3.1蛋白基本理化性质运用Protparatam在线生物软件预测芍药CHI基因编码蛋白质的理化性质,结果显示,其分子式为C1063H1667N259O327S3,蛋白质的分子量为23.403 6 kDa,等电点pI为4.93,蛋白的不稳定指数39.78,小于40,是个稳定的蛋白。在氨基酸的构成中,相对含量较多的氨基酸是Glu(谷氨酸)、Ser(丝氨酸)、Gly(甘氨酸)、Lys(赖氨酸)和Thr(苏氨酸),分别占9.7%,8.8%,8.8%,8.3%,8.3%。带负电荷的残基(Asp(天冬氨酸)+Glu)为28,带正电荷的残基(Arg(精氨酸)+Lys)为21。CHI蛋白脂溶指数为84.01,表明该蛋白是脂溶性蛋白[20],总亲水性平均系数(Grand average of hydropathy,GRAVY)为-0.105,表明该蛋白为亲水性蛋白。

2.3.2蛋白信号肽分析信号肽是位于分泌蛋白N端15～30个氨基酸之间的一段疏水性区域,主要负责把蛋白质引导到细胞含不同膜结构的亚细胞器内,利用SignalP 4.0软件预测信号肽时,蛋白剪切位点预测通过Y最大值(Y-score maximum,Max.Y)来判断,是否为分泌蛋白通过S平均值(Mean-score,Mean S)来判断,结果发现(图3)Y最大值为0.112,S平均值为0.098(均小于0.5),表明芍药CHI无信号肽,为非分泌蛋白。

图3　芍药CHI蛋白信号肽预测

2.3.3蛋白跨膜结构与亲疏水性分析TMHMM 2.0分析表明芍药CHI蛋白跨膜螺旋数为0,为非跨膜蛋白;Protscale分析蛋白亲/疏水性表明,芍药CHI蛋白最大亲水性区域位于第72号氨基酸(Score:-2.100),最大疏水性区域位于51号氨基酸(Score:1.700),从整体来看亲水性残基数多于疏水性残基(图4),表明芍药CHI编码蛋白为可溶性蛋白。

图4　芍药CHI基因疏水性/亲水性的预测

2.3.4蛋白二级结构与三级结构预测芍药CHI蛋白二级结构包括α螺旋(Alpha helix)占39%,延伸链(Extended strand)占20%,β-转角结构(β-turn)占13%,无规则卷曲(Random coil)占27%;SWISS-MODEL同源建模分析CHI蛋白的三维结构,发现呈β-三明治形状,并且该蛋白模型由6～216个氨基酸残基组成,与PDB蛋白质数据库(Protein Data Bank,http://www.rcsb.org/pdb/home/home.do)中模板4doi.1.A的相似性为68.25%(图5-A),该模型通过低质量评估(Local quality estimate)(图5-B)和模型结构优化评估Normalized QMEAN(图5-C),模型质量评分的复合评分函数QMEAN的Z值为-0.06,表明芍药CHI蛋白三维模型构建比较成功。

2.3.5蛋白保守功能域分析利用SMART数据库分析CHI蛋白的功能结构域,结果发现(图5-D),CHI蛋白包含1个保守结构域:Chalcone domain,位于12～215号氨基酸,预测评估值(E-value)为2.4e-106;Chalcone domain作为酮异构酶催化活性区域,酮异构酶(Chalcone-flavanone isomerase,EC5.5.1.6)主要具有催化查尔酮异构化为4,5,7-三羟基黄烷酮的功能,是类黄酮生物合成的一个关键酶。

图5　芍药CHI蛋白三维空间结构和保守功能域预测

2.3.6亚细胞定位分析TargetP亚细胞定位分析显示(表 4),该蛋白主要定位在细胞其他位置,而很少分布在线粒体和信号肽分泌途径上,为非分泌蛋白;进一步利用PSORTⅡPrediction分析发现主要在细胞质(Cytoplasm)(45.0%)和微体(Microbody)(42.5%)中发挥生物学功能,此外在线粒体基质间和溶酶体中也有少量分布。

表4　CHI蛋白的亚细胞定位分析

2.3.7蛋白修饰位点(糖基化位点和磷酸化位点)分析蛋白功能位点分析表明,芍药CHI蛋白不存在糖基化位点(图6-A),存在14个潜在的磷酸化位点,包括8个Ser(6/8/14/26/110/133/187/201)、4个Thr(20/73/78/158)和2个Tyr(15/127)(图6-B),同时结合磷酸激酶预测结果显示,在CHI蛋白上可能有CKⅠ、CKⅡ、DNAPK、PKC、PKG、PKA、p38MAPK、cdc2、cdk5这9种保守的特异性蛋白质激酶的结合位点(表5),其中在第20位氨基酸处存在一个最高分值的蛋白激酶PKC(分值为0.87)。

横线代表阈值；图B中各条竖线分别代表潜在的酪氨酸、丝氨酸和苏氨酸磷酸化位点；

激酶Kinase全称Fullname位点SitePKC蛋白激酶20、64、89、105、126、156CKⅠ细胞周期蛋白依赖性激酶抑制因子162、168、193CKⅡ酪蛋白激酶Ⅱ8、14、78、80、89、128、133DNAPK依赖DNA的蛋白激酶14、64、162PKA蛋白激酶A123、151、207PKG蛋白激酶G123、151、207cdc2细胞分裂周期激酶214p38MAPKp38分裂原激活的蛋白激酶158cdk5细胞周期素依赖蛋白激酶5158

3讨论

CHI是第一个被认识的类黄酮合成相关酶,是类黄酮类色素生物合成所需的关键酶之一,其表达量的多少会直接影响花色素的合成,因而CHI的转基因研究正成为观赏植物基因工程的研究热点之一。研究表明,CHI基因不表达或者活性缺失会严重阻碍许多植物的黄酮生物合成途径,导致花色素和类黄酮含量显著降低[21-22],而CHI基因过表达则会使类黄酮含量提高[23]。基于CHI在黄酮类化合物生物合成中的重要性,近年来受到许多学者的关注,其应用主要集中在改良观赏植物花色、提高植物药用成分等几方面[24]。Muir等[23]将矮牵牛的CHI基因转入到番茄,获得了转基因番茄,使得黄酮类化合物含量显著升高;Nishihara等[25]利用RNAi对烟草CHI基因的表达水平进行沉默后,发现烟草花瓣中查尔酮含量显著增加,并且花瓣的颜色也发生改变;Bednar等[26]发现矮牵牛CHI基因突变会引起花粉中查尔酮的含量增加,从而导致花瓣的颜色呈现黄色或绿色。然而,目前国内外鲜见有针对芍药查尔酮异构酶CHI基因的研究,本试验首次通过RACE克隆及测序技术获得了芍药CHI基因的CDS编码序列,为今后开展芍药CHI基因RNA干扰、过表达以及基因敲除等技术来深入研究其功能机制提供基础素材。

密码子偏好性的分析,不仅能够帮助有效理解不同物种的进化发展[27],还能够有效的帮助同义密码子使用偏好性相关机制的理解[28-29]。更重要的是,密码子偏好性分析有助于了解某个基因转录和翻译水平上的调控机制,并且对寻找该基因最佳外源表达系统或宿主从而提高基因的表达水平具有重要的理论意义[30]。因此,通过密码子改造或者外源表达可以调节芍药CHI基因的表达量,进而改变类黄酮的含量和导致花色变异。本研究通过EMBOSS软件包分析芍药CHI基因的密码子使用偏好性,发现该基因大多数密码子偏好以A/U结尾且整个编码区序列中AU含量大于GC,同时发现28个密码子具有偏好性,其中使用频率最高的是UUG(3.00)。在研究功能未知的新基因时,目前大肠杆菌原核表达系统,以及拟南芥和酵母介导的真核表达系统已经广泛用于新基因功能研究,本研究通过分析芍药CHI与3种不同模式生物基因组中不同密码子用法差异,从而发现芍药CHI基因与拟南芥基因组密码子使用偏好性差异最小,由此表明拟南芥真核表达系统更适合作为CHI基因的外源表达系统。因此,本研究通过分析了CHI基因的密码子使用偏好性不仅为寻找其最佳外源表达系统,也为今后通过密码子优化提高芍药CHI基因表达水平提供一定的理论参考。

糖基化和磷酸化是真核生物常见的组蛋白质翻译后修饰过程,糖基化主要是修饰天冬酰胺上的N端,其氨基酸的特征序列为Asn-X-Ser/Thr(X代表任何一种氨基酸)[31],蛋白质糖基化主要发生在哺乳动物蛋白中,与许多疾病的早期诊断和发展密切相关。在真核生物中,磷酸化主要发生在丝氨酸(Ser)、苏氨酸(Thr)和酪氨酸(Tyr)等残基,其修饰过程与基因表达、信号传导以及细胞分裂等调控密切相关[32]。本研究发现芍药CHI蛋白无糖基化位点,14个磷酸化位点(8个丝氨酸、4个苏氨酸和2个酪氨酸),其中第20位苏氨酸存在一个典型的特异性蛋白质激酶PKC,如果该位点发生磷酸化后,很有可能会影响到查尔酮异构酶的活性从而改变基因表达水平,这提示我们今后开展蛋白修饰组学研究时应重点关注这一具有特异性蛋白激酶的磷酸化位点。

CHI基因位于细胞质内,主要催化查尔酮分子的环化,将黄色的查尔酮转化为无色的柚皮素,本研究通过亚细胞定位发现芍药CHI基因主要分布在细胞质(Cytoplasm)(45.0%)和微体(Microbody)(42.5%)上,微体内含有黄素氧化酶和过氧化氢酶类,这进一步表明CHI蛋白可能在细胞质内微体中发挥重要的生物学作用。疏水性/亲水性及跨膜结构域的预测结果可以推测芍药的CHI蛋白为一种水溶性蛋白且不存在跨膜结构域,这与一些植物的分析结果相一致,如巨峰葡萄[33]、中国水仙[34]、灯盏花[35]。芍药CHI蛋白二级结构主要以α螺旋(39%)、无规则卷曲(27%)和延伸链(20%)为主,同时三维结构预测发现CHI蛋白的空间结构整体上像是由开面的β-三明治折叠形成的倒置花束,而这种CHI 蛋白质的三维结构呈三明治状,可以作为一种植物特有的基因及结构标记[36]。此外,蛋白保守域分析发现芍药CHI第12～215号氨基酸之间存在一个异构酶Chalcone活性区域,这对今后寻找功能区域内的重要变异位点以及基因定点编辑技术提供参考和依据。本研究利用生物信息学系统地分析芍药CHI蛋白二维和空间结构,并预测了蛋白的核心功能区域,对今后开展芍药CHI基因功能机制的研究提供一定的理论参考。

参考文献：

[1]周琳,王雁,彭镇华.黄色花形成机制及基因工程研究进展[J].林业科学,2009,45(2):111-119.

[2]Zhao Daqiu,Tao Jun,Han Chenxia,et al.Flower color diversity revealed by differential expression of flavonoid biosynthetic genes and flavonoid accumulation in herbaceous peony(PaeonialactifloraPall.)[J].Molecular Biology Reports,2012,39(12):11263-11275.

[3]Mehdy M C,Lamb C J.Chalcone isomerase cDNA cloning and mRNA induction by fungal elicitor,wounding and infection[J].The EMBO Journal,1987,6(6):1527-1533.

[4]陈宣钦,张乐,徐慧妮,等.大豆异黄酮生物合成关键酶及其代谢工程研究进展[J].中国生物工程杂志,2012,32(7):133-138.

[5]Sparvoli F,Martin C,Scienza A,et al.Cloning and molecular analysis of structural genes involved in flavonoid,stilbene biosynthesis in grape.VitisviniferaL.[J].Plant Molecular Biology,1994,24(5):743-755.

[6]Li F,Jin Z,Qu W,et al.Cloning of a cDNA encoding the Saussurea medusa chalcone isomerase and its expression in transgenic tobacco[J].Plant Physiology and Biochemistry,2006,44(7/9):455-461.

[7]乔中全.金银花chs、fls、chi基因全长克隆及序列分析[D].长沙:中南林业科技大学,2012.

[8]马春雷,赵丽萍,张亚丽,等.茶树查尔酮异构酶基因克隆及序列分析[J].茶叶科学,2007,27(2):127-132.

[9]张涛,张跟喜,韩昆鹏,等.京海黄鸡MyoG基因密码子特性分析[J].华北农学报,2014,29(4):71-79.

[10]吴彦庆,葛金涛,陶俊.芍药AP1(APETALA1)基因密码子使用的偏好性分析[J].湖南农业大学学报:自然科学版,2015,41(6):610-615.

[11]Rice P,Longden I,Bleasby A.EMBOSS:The european molecular biology open software suite[J].Trends in Genetics,2000,16(6):276-277.

[12]Emanuelsson O,Nielsen H,Brunak S,et al.Predicting subcellular localization of proteins based on their N-terminal amino acid sequence[J].Journal of Molecular Biology,2000,300(4):1005-1016.

[13]孙伟,李达,苏锐,等.绵羊YAP1基因全长cDNA克隆及生物信息学分析[J].中国农业科学,2013,46(8):1725-1735.

[14]孙雪婧,杜晓华,杨孝朴,等.牦牛CYGB基因CDS区克隆与生物信息学分析[J].中国农业科学,2014,47(13):2690-2698.

[15]Petersen T N,Brunak S,Von heijne G,et al.SignalP 4.0:discriminating signal peptides from transmembrane regions[J].Nature Methods,2011,8(10):785-786.

[16]Biasini M,Bienert S,Waterhouse A,et al.SWISS-MODEL:modelling protein tertiary and quaternary structure using evolutionary information[J].Nucleic Acids Research,2014,42(W1):W252-W258.

[17]Letunic I,Doerks T,Updates B S.New developments and status in 2015[J].Nucleic Acids Research,2015,43(1):257-260.

[18]Sharp P M,Li W H.An evolutionary perspective on synonymous codon usage in unicellular organisms[J].Journal of Molecular Evolution,1986,24(1/2):28-38.

[19]Comeron J M,Aguad M.An evaluation of measures of synonymous codon usage bias[J].Journal of Molecular Evolution,1998,47(3):268-274.

[20]Wilkins M R,Gasteiger E,Bairoch A,et al.Protein identification and analysis tools in the ExPASy server[J].Methods in Molecular Biology,1999,112:531-552.

[21]Kim S,Jones R,Yoo K S,et al.Gold color in onions(Alliumcepa):a natural mutation of the chalcone isomerase gene resulting in a premature stop codon[J].Molecular Genetics and Genomics,2004,272(4):411-419.

[22]Van tunen A J,Koes R E,spelt C E,et al.Cloning of the two chalcone flavanone isomerase genes from petunia hybrida:coordinate,light-regulated and differential expression of flavonoid genes[J].EMBO Journal,1988,7(5):1257-1263.

[23]Muir S R,Collins G J,Robinson S,et al.Overexpression of petunia chalcone isomerase in tomato results in fruit containing increased levels of flavonols[J].Nature Biotechnology,2001,19(5):470-474.

[24]吴冰,祝钦泷,郭余龙,等.查尔酮异构酶基因的分子特征及其在基因工程中的应用[J].植物生理学通讯,2008,44(1):175-181.

[25]Nishihara M,Nakatsuka T,Yamamura S.Flavonoid components and flower color change in transgenic tobacco plants by suppression of chalcone isomerase gene[J].FEBS Letters,2005,579(27):6074-6078.

[26]Bednar R A,Hadcock J R.Purification and characterization of chalcone isomerase from soybeans[J].The Journal of Biological Chemistry,1988,263(20):9582-9588.

[27]Angellotti M C,Bhuiyan S B,Chen G,et al.CodonO:codon usage bias analysis within and across genomes[J].Nucleic Acids Research,2007,35(Web Server issue):W132-W136.

[28]Lü H,Zhao Wei ming,Zheng Yan,et al.Analysis of synonymous codon usage bias in Chlamydia[J].Acta Biochimica et Biophysica Sinica,2005,37(1):1-10.

[29]尚明照,刘方,华金平,等.陆地棉叶绿体基因组密码子使用偏性的分析[J].中国农业科学,2011,44(2):245-253.

[30]郭秀丽,王玉,杨路成,等.茶树CBF1基因密码子使用特性分析[J].遗传,2012,34(12):1614-1623.

[31]Mellquist J L,Kasturi L,Spitalnik S L,et al.The amino acid following an asn-X-Ser/Thr sequon is an important determinant of N-linked core glycosylation efficiency[J].Biochemistry,1998,37(19):6833-6837.

[32]Kim J H,Lee J,Oh B,et al.Prediction of phosphorylation sites using SVMs[J].Bioinformatics,2004,20(17):3179-3184.

[33]周军,姚泉洪,彭日荷,等.巨峰葡萄查尔酮异构酶基因克隆及表达分析[J].西北植物学报,2009,29(9):1723-1729.

[34]蔡雪玲,陈晓静,叶一江,等.中国水仙查尔酮异构酶基因的克隆与表达分析[J].热带作物学报,2011,32(12):2287-2292.

[35]刘春霞,王玥,崔明昆,等.灯盏花chi的克隆及其生物信息学分析[J].武汉植物学研究,2010,28(6):682-690.

[36]Gensheimer M,Mushegian A.Chalcone isomerase family and fold:no longer unique to plants[J].Protein Science:a Publication of the Protein Society,2004,13(2):540-544.

Cloning,Codon Usage Bias and Protein Structure and Function Prediction ofCHIGene inPaeonialactiflora

WU Yanqing,ZHAO Daqiu,WANG Jing,TAO Jun

(School of Horticulture and Plant Protection,Yangzhou University,Yangzhou225009,China)

Abstract：In order to enrich basic data in Paeonia lactiflora CHI gene,the CDS region of Paeonia lactiflora CHI gene was cloned by RACE technology,further codon usage was analyzed by EMBOSS software,then the structure and function of CHI protein was predicted by bioinformatics software and online databases.Results indicated that,the 898 bp full-length cDNA of CHI of Paeonia lactiflora(GenBank No.:JN119872)was obtained.Paeonia lactiflora CHI gene has certain preference of codon usage with the terminal base A or U.There were twenty-eight biased codons(RSCU>1),whose biased strongly codons were UUG,UGU,CAU,AGA,AGG and CGG(RSCU≥2).In codon usage frequency,the differences between CHI gene and Saccharomyces,E.coli genomes were more than Arabidopsis genome.CHI was non-transmembrane and hydrophilic protein with no signal peptide,which located mostly in cytoplasm(45.0%)and microbody(42.5%)by the result of subcellular level prediction and does not belong to the secretory protein.CHI protein had no glycosylation sites and fourteen phosphorylation sites,including a PKC kinase located in 20th amino acid.Additionally,it had one conservative domain named chalcone.The secondary structure of CHI protein contained 39% α-helices,20% extended strand,13% β-turn and 27% random coil.Tertiary structure presented an inversion bouquet by beta sandwich folding.In this study,we found one conservative domain responsible for catalytic activity of isomerase and an specific protein kinases PKC site,which will provide advantageous basic data for further studying CHI gene function.Moreover,the eukaryotic Saccharomyces expression systems may be more suitable for the expression of CHI gene.

Key words:Paeonia lactiflora;CHI gene;Codon usage bias;Protein structure and function

doi:10.7668/hbnxb.2016.02.013

中图分类号：Q78;S682.03

文献标识码：A

文章编号：1000-7091(2016)02-0071-10

通讯作者：陶俊(1966-),男,江苏扬州人,教授,博士，主要从事观赏植物栽培生理、遗传育种与分子生物学研究。

作者简介：吴彦庆(1988-),男,江苏扬州人,在读硕士,主要从事观赏园艺研究。

基金项目：国家自然科学基金项目(31372097);江苏省农业科技自主创新资金项目(CX(12)2019)

收稿日期：2016-01-18