丹参酮生物合成途径关键酶CYP76AH3的晶体结构与分子对接
2022-09-07陈张鑫黄力新肖城良常振战
陈张鑫, 贺 珂, 史 超, 黄力新, 肖城良, 常振战*
(1)北京大学 基础医学院,北京 100191;2)中国科学院 生物物理所,北京 100191)
丹参作为我国最早记载于《神农本草经》的传统中药,具有活血、通淤排脓、顺脉宁神等功效[1]。丹参中活性成分主要为脂溶性的丹参酮Ⅰ、丹参酮ⅡA、丹参酮ⅡB和隐丹参酮等[2]。其活性成分具有广泛的药理作用,主要集中在治疗心绞疼、冠心病以及抗炎和抗肿瘤等方面[3]。近期研究表明,在骨质疏松、骨关节炎和慢性阻塞肺炎等疾病中也具有疗效,丹参酮ⅡA能通过抑制miR-155/FOXO3来改善软骨破坏和滑膜炎症[4],丹参酮ⅡA磺酸钠在小鼠模型中通过上调去乙酰化酶SIRT1(sirtuin-1, SIRT1)改善线粒体功能、降低氧化应激来改善吸烟诱导的慢性阻塞性肺疾病[5]。
丹参的活性成分获取方式主要从丹参中直接提取,随着丹参的应用范围不断扩大,运用合成生物学建立可大量、持续和廉价获取丹参中有效成分的方法是目前的热点[6]。目前,对丹参中活性成分的合成途径解析和异源表达体系建立已取得一定成果。2012年,Zhou等通过在底盘微生物中模块化融合丹参类贝壳杉烯合酶(salvia miltiorrhiza kaurene synthase-like,SmKSL)和丹参柯巴基焦磷酸合酶(salvia miltiorrhiza copalyl diphosphate synthase,SmCPS),在发酵罐中培养酵母得到365 mg/L中间代谢产物次丹参酮二烯[7]。Dai等发现激活法尼基焦磷酸(farnesyl diphosphate,FPP)合成酶与牻牛儿苗牻牛儿苗基焦磷酸(geranylgeranyl diphosphate,GGPP)合成酶对次丹参酮二烯合成的提高作用,基于模块改造进一步将次丹参酮二烯产量提到了488 mg/L[8]。在2013年,Guo等融合CYP76AH1基因酿酒酵母中异源表达铁锈醇,产量达到了10.5 mg/mL[9]。2020年,Mao等通过基于预测结构改造CYP76AH1蛋白质,实现目标产物导向生成和催化效率的提升[10]。
在丹参酮生物合成途径中,通用甲羟戊酸途径(mevalonate pathway,MVA)或2-甲基-D-赤藓糖醇-4-磷酸途径(2-C-methyl-D-erythritol-4-phosphate pathway,MEP)形成基本骨架后,后续CYP450类基因占有很大比重,该家族基因主要发挥对丹参酮中间产物骨架侧链进行修饰或剪裁的作用[11]。CYP76AH3是丹参酮生物合成途径中继CYP76AH1之后一个重要的P450酶[12],该酶处在丹参酮中间代谢产物流向分支处,中间产物次丹参酮二烯经CYP76AH1催化生成铁锈醇后,紧接着由CYP76AH3催化铁锈醇生成柳杉酚,再催化柳杉酚生成11-羟基柳杉酚,也可催化铁锈醇生成11-羟基铁锈醇,再催化11-羟基铁锈醇生成11-羟基柳杉酚[13]。复杂的代谢网络和混合的中间产物表明CYP76AH3是一个关键的P450酶,因此,本研究针对CYP76AH3进行晶体结构研究和底物对接分析,并计算模拟预测关键氨基酸点突变对结构的影响,以期为丹参酮的生物合成奠定基础,同时也可以丰富植物P450酶的晶体结构数据库,为系统性研究植物中P450酶结构提供帮助。
1 材料与方法
1.1 材料
感受态细胞Trans1-Blue购自北京全式金生物公司,质粒pCW Ori(+)(Amp抗性)来自Dr.F.W.Dahlquist的馈赠,晶体试剂盒购自Hampton公司,显微镜购自Olympus公司,晶体培养箱购自Molecular Dimensions,Ni2+-NTA购自Thermo,AKTA purifier 10/100购自GE公司,超声波细胞破碎仪购自BRANSON,高速离心机购自BECKMAN公司,恒温培养箱购自上海智城,PierceTMBCA Protein Assay Kit购自Thermo。
1.2 CYP76AH3序列分析与重组质粒构建
在NCBI中检索CYP76AH3的序列,将CYP76AH3序列N端的DSFSLLAALFFISAATWF ISSRRRRN替换为亲水序列AKKTSSKGK,C端添加6个组氨酸作为亲和纯化标签,并使用ProtParam、XtalPred-RF 和FoldIndex等网站对改造前后序列进行在线预测分析。改造后的序列经原核表达密码子优化后,插入pCW Ori(+)质粒的5′NdeⅠ和3′XbaⅠ上下游酶切位点中,正向引物为Fw:5′-GATCAGCTTACTCCCCATCC-3′,反向引物为Rv:5′-AATAGGCGTATCACGAGGC-3′,质粒由北京睿博生物公司合成。
1.3 CYP76AH3的表达
将重组质粒转化到Trans1-Blue感受态细胞中,均匀涂布于含 100 μg/mL 氨苄青霉素和四环素双抗性LB固体平板上,放置37 ℃恒温孵箱过夜培养,再挑取单克隆菌落于10 mL的LB液体培养基中制作种子液,在摇床中培养,摇床转速设置220 r/min,温度设置37 ℃。待菌液浑浊后取5 mL加入1 L TB液体培养基中,在摇床中扩大培养,摇床温度设置37 ℃,转速设置为220 r/min,另取1 mL菌液送北京睿博生物公司测序以鉴定转入感受态细胞质粒序列正确无误。菌液培养至A600约0.6时,加入终浓度为0.5 mmol/L的异丙基-β-D-硫代吡喃半乳糖苷(isopropyl-beta-D-thiogalactopyranoside,IPTG)和终浓度为1 mmol/L 的5-氨基乙酰丙酸盐酸盐(5-aminolevulinic acid hydrochloride,ALA),摇床温度设置为32 ℃、转速为190 r/min,诱导表达48 h。
1.4 CYP76AH3的纯化
诱导结束后4 ℃,3 600 r/min离心收集菌体,用裂解缓冲液(500 mmol/L KH2PO4,500 mmol/L NaCl,0.25 % 胆酸钠,15% 甘油,pH 7.4)重悬菌体,同时加入终浓度为1 mmol/L的苯甲基磺酰氟(phenylmethylsulfonyl fluoride,PMSF)、β-巯基乙醇(2-Hydroxy-1-ethanethiol,β-ME)和0.5%的TritonX-100,置于冰水浴中超声破碎,设置强度为30%,工作5 s,暂停5 s,时长40 min,超声至无明显悬浮固体,将菌液在4 ℃,12 000 r/min离心40 min,上清以0.3 mL/min的流速上样到经裂解缓冲液平衡后的Ni2+-NTA亲和层析柱,用100 mL洗涤缓冲液1(500 mmol/L KH2PO4,500 mmol/L NaCl,15% 甘油,pH 7.4,5 mmol/L组氨酸)和100 mL洗涤缓冲液2(500 mmol/L KH2PO4,500 mmol/L NaCl,15% 甘油,pH 7.4,10 mmol/L组氨酸)清洗杂蛋白质,用20 mL洗涤缓冲液3(500 mmol/L KH2PO4,500 mmol/L NaCl,15% 甘油,pH 7.4,200 mmol/L组氨酸)洗脱目的蛋白质,用50 kD截留管离心浓缩;取适量浓缩的目的蛋白质,用经过缓冲液(500 mmol/L KH2PO4,500 mmol/L NaCl,15% 甘油,pH 7.4)平衡的HiloadTM16/600 SuperdexTM200 pg制备柱进行纯化,流速为1 mL/min,检测波长为280 nm,收集样品,10% SDS-PAGE分析,将纯度最高的目的蛋白质合并,离心浓缩后用BCA法测定浓度,加液氮速冻,-80 ℃冰箱备用。
1.5 CYP76AH3晶体筛选
将纯化后的CYP76AH3蛋白质用坐滴法进行初筛,0.4 μL池液与0.4 μL蛋白质混匀加入坐滴孔,上下两孔蛋白质浓度分别为40 mg/mL和20 mg/mL,池液为40 μL商用结晶试剂盒的试剂,晶体培养箱设置16 ℃。一周后用显微镜观察坐滴孔,发现有晶体长出后进一步采用悬滴法进行浓度梯度优化和添加剂优化, 并根据需要加入相应配体。
1.6 CYP76AH3单晶衍射数据收集
用尼龙圆环将晶体捞出,置于防冻液(池液添加25%甘油)中,迅速转入液氮冻存,转运至上海同步辐射光源,在19U1线站进行衍射数据收集,波长为0.97853 Å,探测器距晶体距离400 mm,回摆角度1度,曝光时间为0.2 s,收集温度为100 K,每颗晶体收集360张。
1.7 CYP76AH3晶体结构解析
原始衍射数据用HKL3000[14]处理,以CYP76AH1晶体结构(PDB号为5 ylw)作为模板分子置换,分子置换使用CCP4[15]的PHASER模块,最后使用PHENIX[16]的REFINE模块和COOT[17]进行精修,用PYMOL进行结构展示与作图。
1.8 CYP76AH3的分子对接与点突变模拟计算
采用Discovery Studio软件对CYP76AH3相应底物进行分子对接,底物根据文献分析选用铁锈醇(ferruginol)、柳杉酚(sugiol)和11-羟基铁锈醇(11-hydroxyferruginol),在PubChem数据库中下载相应底物分子SDF文件,导入到Discovery Studio软件中,通过Prepare Ligands模块预处理小分子文件生成立体构象。通过Prepare Protein模块对CYP76AH3结构进行优化,删除水分子,添加氢原子。在对接前,使用CavityPlus在线网站[18]分析结构中的空腔。使用LibDock模块进行对接,以CavityPlus分析结果定义分子对接区域,Site Sphere参数设置为-35.852,16.055,-17.14,12.00,能量最小化算法选择Smart Minimize。
根据对接产生的结果,将与底物有氢键相互作用的GLY298与ASP294分别突变成ALA和PHE,将与底物有疏水相互作用的PHE479、LEU293、LEU367分别突变成ALA和THR,将突变结果提交到MAESTRO[19]和Missense3D[20]在线网站评估点突变对结构的影响。
2 结果
2.1 CYP76AH3重组质粒改造前后序列分析
CYP76AH3的Genbank编号为 KR140168.1,ProtParam分析显示氨基酸序列全长494个氨基酸,不稳定指数为42.43,亲水性总平均为-0.191,改造后的CYP76AH3全长483个氨基酸,不稳定指数为38.42,亲水性总平均为-0.286,经过改造后蛋白质亲水性得到增强,并由不稳定转为稳定,更有利于目的蛋白质在原核表达体系中纯化。CYP76AH3序列FoldIndex分析显示,除了105至145的氨基酸序列可折叠系数稍微低于0外,其余都在0以上,表示蛋白质总体具有极佳的可折叠性。改造前后XtalPred-RF的EP-class和RF-class预测结果均为1,表明结晶成功率极高,改造前后不影响结晶可能性。
2.2 CYP76AH3提取物电泳证实获得纯化蛋白质
蛋白质溶液经凝胶过滤层析显示出2个峰,根据HiloadTM16/600 SuperdexTM200 pg蛋白质标准曲线对比可知,分别为多聚和单体形式(Fig.1A),出峰位置组分经10% SDS-PAGE(Fig.1B)显示,在54 kD位置可见目的蛋白质条带,与重组蛋白质理论分子量大小相符,且纯度在90%以上,可以满足结晶试验的需要。
Fig.1 Gel filtration chromatography and SDS-PAGE analysis (A)After purification by the nickel column, the target protein was eluted by 200 mmol/L histidine and purified by gel filtration chromatography, and the flow rate was set to 1 mL/min and the detection band was set to 280 nm.The CYP76AH3 protein has two peaks after gel filtration chromatography purification, Peak 1 and Peak 2 correspond to polymorphs and monomers, respectively.(B)The effluent solutions corresponding to Peak 1 and Peak 2 were collected in separate tubes and tested for purity using 10% SDS-PAGE.Lanes 1-6 correspond to Peak1, Lanes 7-11 correspond to Peak 2, Lanes marked with "M" are molecular weight markers.SDS-PAGE shows purified recombinant CYP76AH3 proteins at 54 kD and its purity meets the requirements of subsequent experiments
2.3 CYP76AH3晶体筛选与优化
初筛得到的晶体大多为针刺状或细杆状,大约3个月后经显微镜观察到状态较好的片状晶体,衍射分辨率在10 Å左右。经过大量的尝试,晶体质量得到提升,为红棕色块状(Fig.2A)。优化后的结晶条件为:悬滴法,池液600 μL 1 600 mmol/L柠檬酸三钠,蛋白质浓度20 mg/mL,2 μL蛋白质和2 μL池液1∶1混匀,添加剂(30%V/V(+/-)-2-甲基-2,4-戊二醇)0.4 μL。在上海同步辐射光源BL19U1线站收集衍射数据(Fig.2B),分辨率在3.5 Å左右,晶体转动到一定角度时衍射点变差,可能与晶体本身堆积方式有关。
Fig.2 Crystals of CYP76AH3 and X-ray diffraction image from a CYP76AH3 crystal (A)After protein purification, two concentrations(40 mg/mL and 20 mg/mL)were set for crystallization tests.Using the sitting-drop method for primary screening and the hanging-drop method for optimization, the final protein crystals were obtained under mixing conditions of 2 μL protein plus 2 μL pool solution and 0.4 μL additive(30% V/V(+/-)-2-methyl-2,4-pentanediol)in 600 μL pool solution hanging-drop well.(B)We select crystals in good conditions for diffraction at the synchrotron beamline BL19U1 at SSRF(Shanghai, China), diffraction data were collected at exposure time of 0.2 s and temperature of 100 K, and the distribution of diffraction points is shown in the figure
2.4 CYP76AH3晶体结构
采用HKL3000、CCP4、PHENIX、COOT等软件解析了CYP76AH3的三维结构,空间群为P6322(Table 1),PDB号为7X2Q。蛋白质结构为二聚体,呈一定角度旋转对称(Fig.3B)。蛋白质单体呈三棱锥形,由大量α螺旋构成,每个蛋白质分子结构中包含13个α螺旋(标记为A-L)、4对反向平行β折叠(β1-β4)和无规卷曲,其中3对β折叠位于N端附近,1对位于C端。血红素辅基被夹在螺旋I和螺旋L之间(Fig.3C),一侧有大量α螺旋(F、I、E、D、G螺旋),另一侧主要是无规卷曲,形成血红素辅基与底物反应的活性空间。其中保守位点Cys437位于靠近血红素辅基的L螺旋尾部,被认为与血红素辅基中Fe原子配位,参与底物的电子传递。
Fig.3 Ramachandran plots and crystal structures of CYP76AH3 (A)Structure after refinement, the statistical parameters are shown in the Ramachandran plot.(B)The data were processed and scaled with HKL3000.The PDB entry 5ylw was used as a search model for phasing of the X-ray data.Iterative model building and refinement were performed using Coot and PHENIX respectively.Protein structure displayed by PyMOL.(C)CYP76AH3 monomer structures, the N-terminal and C-terminal are shown in figure, and the main α-helix are labeled with A-L, the β-sheet are labeled with β1-β4
2.5 CYP76AH3 与底物分子对接与点突变计算分析
CavityPlus空腔预测结果显示,最佳空腔的DrugScore为5 322.00,Druggability为Strong,该空腔包裹住血红素辅基所在位置。以该空腔为对接范围,经分子对接分析表明,不同构象的铁锈醇、柳杉酚和11-羟基铁锈醇与CYP76AH3形成氢键作用最多的氨基酸有Gly298和Asp294(序列从N端计数),形成疏水作用对多的氨基酸有Phe479、Leu367和Leu293(Fig.4D)。图中显示为各底物最佳LibDockScore的对接姿态(Fig.4)。
Fig.4 Molecular docking and key amino acid residue predictions After using CavityPlus to determine the range of docking space, the CYP76AH3 monomer structure was used as the docking acceptor and the small molecules(ferruginol, sugiol, 11-hydroxyferruginol)were used as the docking ligands.The LibDock module in Discovery Studio was used for the docking procedure, and Smart Minimize was chosen for the energy minimization algorithm.(A)Docking results of ferruginol, the interaction of major amino acid residues are shown in the figure.(B)Docking results of sugiol, the interaction of major amino acid residues are shown in the figure.(C)Docking results of 11-hydroxyferruginol, the interaction of major amino acid residues are shown in the figure.(D)Location of key amino acid residues in the structure of CYP76AH3.Red indicates amino acid residues with hydrogen bonds with the substrate.Yellow indicates amino acid residues with hydrophobic interactions with the substrate
点突变模拟计算中,MAESTRO显示D294A、F479A、L293A、L367A、F479T、L293T和L367T的ΔΔG的预测值大于0(Table 2)说明该类突变会对蛋白质结构稳定性造成影响。Missense3D显示,D294F、G298F突变导致空腔体积收缩了157.24 Å3和227.44 Å3,通常大于70 Å3的改变认为会影响结构的功能。
Table 1 Data collection and refinement statistics
Table 2 Mutation analysis
3 讨论
大量研究发现植物天然次生代谢产物具有巨大的应用价值,属于萜类的丹参酮类化合物有在抗炎、抗肿瘤和心血管疾病治疗中发挥了显著功效。然而,丹参酮类化合物产量较低、提取成本高,难以满足大规模的临床需求,因此需要利用合成生物学技术来解决这些困难。对天然产物代谢途径中关键酶立体结构活性中心的阐释是通过合成生物学技术改造其功能的关键,因此解析关键酶的立体结构具有重要意义。
本研究通过CYP76AH3序列改造,构建了有利于在原核体系表达目的蛋白质的重组质粒,成功纯化了大量的可溶性CYP76AH3蛋白质;为了增加纯化CYP76AH3蛋白质的收率,在裂解缓冲液中添加了胆酸钠和TritonX-100;CYP76AH3蛋白的晶体培养及优化都比较困难,采用坐滴法初筛时获得的晶体大多为毛刺或针尖状,经过大量晶体优化实验先后得到薄片状晶体和块状单晶,并成功解析出晶体结构。受限于晶体本身质量较差,CYP76AH3晶体结构分辨率不高,还有待提升。晶体结构分析表明,CYP76AH3为二聚体,呈一定角度旋转对称。我们把血红素辅基附近空间定义为活性中心,以相关底物作为配体,采用分子对接技术分析与配体存在相互作用的氨基酸残基,得到与底物不同构象出现高频率氢键相互作用的氨基酸残基Gly298和Asp294,以及与底物有疏水相互作用的氨基酸残基Phe479、Leu367和Leu293。鉴于Ala具有最小空间占位,Phe带有一个苯环而Thr属于极性的氨基酸,我们采用点突变模拟程序计算出点突变对蛋白质结构的影响,结果显示:将Asp294突变为Ala,将Phe479、Leu367和Leu293突变为Ala和Thr时,都会影响蛋白质结构的稳定性;将Asp294和Gly298突变为Phe,会导致空腔体积收缩。
关键酶的晶体结构解析对阐释酶的催化机制和底物特异性有重要帮助,本研究建立了CYP76AH3的纯化平台,通过蒸汽扩散法优化出该酶的结晶条件,解析了蛋白质晶体结构,并通过分子对接筛选出与底物发生作用的关键氨基酸残基,通过对关键氨基酸进行点突变模拟计算出对结构稳定性的影响,有望为后续的突变设计和功能试验提供借鉴、为丹参酮的合成生物学研究奠定基础。