APP下载

基于阈值算法和三角化模型结合的酱油中蛋白质结构预测研究

2020-08-14黄萌王纬杨辉车程川

中国调味品 2020年8期
关键词:酱油氨基酸阈值

黄萌,王纬,杨辉,车程川

(1.山东水利职业学院,山东 日照 276826;2.曲阜师范大学 生命科学学院,山东 曲阜 273165)

酱油是一种集美味与香气于一体的特色调味品,酱油的芳香风味物质主要来自于小分子量的氨基酸类物质。酱油的生产过程是微生物在多种酶的作用下,进行原材料大分子有机物的分解和重组,同时在环境条件下,发生生物化学反应,形成酱油物质[1,2]。在酱油的形成过程中,原材料中的蛋白质发生水解,形成多种氨基酸,并衍生为多种蛋白类物质,酱油中的蛋白质物质以衍生蛋白的形式存在。对酱油的生产过程进行有效控制,需对该类蛋白衍生物结构进行预测。

所谓三角化模型是指通过识别蛋白质衍生物的化学链,折叠形成复杂蛋白质构型的过程,不同的化学链长,标识为不同的蛋白质衍生物。通过分析不同的蛋白质衍生物化学链,确定该类物质存在链长范围,形成链长阈值区间,进而进行阈值区间识别,预测不同蛋白质衍生物的种类及结构[3]。

1 酱油蛋白类物质分析

每100 mL酱油中蛋白质含量约为10 g,该类蛋白质一部分来自于原材料中未发生水解的蛋白质,另一部分来自于蛋白质降解以后的蛋白类衍生物。

在整个酱油生产过程中,酱油中的总蛋白含量不断发生变化,其中清蛋白、球蛋白、醇溶蛋白以及谷蛋白为酱油中的4种主要蛋白类物质,相互不断地发生物质转化。在生产初期,清蛋白和球蛋白发生降解,降解物之间发生转化,生成难以溶解的谷蛋白。随着生产过程的不断进行,谷蛋白发生降解,在一系列蛋白酶的条件作用下,微生物不断代谢,谷蛋白生成球蛋白和部分清蛋白,进而沉淀到酱油生产罐底部,形成酱油当中的蛋白类物质[4,5]。在酱油生产原料中,球蛋白与醇溶蛋白的物质含量最低,清蛋白和谷蛋白的降解产物形成酱油中的多种氨基酸。谷蛋白的结构成分复杂,在生产过程中,谷蛋白不能发生彻底的降解,未降解的蛋白质溶解于酱油中。

2 酱油蛋白质三角化模型

2.1 蛋白质折叠模型

蛋白质折叠模型是根据蛋白质水解以后所得到的简化链状结构进行分析的氨基酸结构,简化的链状结构可理解为一系列直径大小的球状物质。用白色和黑色两种球体表示蛋白质链状结构中的氨基酸小球,小球之间通过化学键连接,形成蛋白质物质。

蛋白质折叠模型是一种简单的自然构型模型,蛋白质中的多种氨基酸被简化为黑、白两种氨基酸小球,小球之间相互连接,表示蛋白质能量[6]。与蛋白质实际结构相比,这种简化的折叠模型求解计算量巨大,随着蛋白质结构的不断增加,氨基酸连接键之间的求解指数不断增加。酱油蛋白质折叠结构模型示意图见图1。

图1 酱油蛋白质折叠结构模型示意图Fig.1 Schematic diagram of protein folding structure model of soy sauce

折叠模型中,若干个简化球体或若干个化学键之间可近似形成三角形,该类模型成为蛋白质折叠三角化模型。

2.2 蛋白质链能量模型

蛋白质链能量模型也称为AB型模型,是通过利用两种简化后的氨基酸球体来描述蛋白质结构[7],其中A表示疏水性氨基酸,B表示亲水性氨基酸。AB氨基酸球体之间的距离固定,表示每个氨基酸小球的能量相等,若干个AB型模型连接组成氨基酸能量链:

利用能量函数模型计算得出的蛋白质结构模型与蛋白质的折叠模型更接近,与蛋白质折叠模型相比,求解计算量相当。

3 阈值算法

阈值算法是一种能够进行最优化求解的算法,同时在计算过程中筛选最差的解。阈值算法通过既定的阈值不断缩小搜索范围,当函数目标值进入阈值范围时,即被接收;当目标函数值或变形以后的目标函数值超过阈值时,计算结果即被拒绝[8]。

在阈值迭代计算过程中,阈值不断变化,形成一系列阈值序列,随着阈值迭代计算的不断进行,阈值收敛准则越来越严。

在进行酱油蛋白质结构预测时,用到的阈值伪代码为:

● 1.Generate an initial solution S=S0;

● 2.Select the threshold change counter k=0;

● 3.Select a threshold descend schedule tk;

● 4.Select an initial threshold T=T0;

● 5.Select a repetition threshold Mk;

● 6.Repeat;

● 7.Set repe tition counter m=0;

● 8.Repeat;

● 9.Generate a candidate solution St;

● 10.Calculate the difference of cost d=f(St)-f(S);

● 11.If d<=tk;

● 12.then S=St;

● 13.Until m=Mk;

● 14.Until stopping criterion is met.

4 优化三角化模型

为降低三角化模型的计算数据量,对蛋白质三角化模型进行优化,同时采用阈值迭代的算法对模型进行求解。

在三角化模型中,对氨基酸序列中的疏水性氨基酸用H表示,亲水性氨基酸用P表示,将氨基酸小球放置在三角形网格顶点,则可构成蛋白质三角化模型。蛋白质优化后的三角化模型见图2。

图2 酱油蛋白质三角化优化模型Fig.2 Optimization model of soy sauce protein triangulation

从优化后的蛋白质序列模型可以看出,氨基酸折叠成紧密连接状态,两种不同颜色的小球之间代表固定键长的化学键,整个蛋白质结构序列和能量可直观显示出来。

5 试验对比

利用建立的阈值算法,对优化后的蛋白质三角化模型进行求解。求解过程中,每种蛋白质按照两种优化后的三角化模型进行求解,得出酱油中的4种蛋白质结构序列。4种蛋白质预测结构见图3。

图3 酱油蛋白质预测结构Fig.3 Protein prediction structure of soy sauce

采用Osborne法对酱油中的蛋白质进行提取,主要提取对象为清蛋白、球蛋白、醇溶蛋白以及谷蛋白,提取完成后,采用凯氏定氮法进行蛋白质氨基酸序列检测,在进行氨基酸序列检测时,每种蛋白质物质进行3次氨基酸物质检测。酱油中蛋白类物质含量见表1。蛋白质氨基酸序列检测结果见表2。

表1 酱油中主要蛋白类物质含量Table 1 Content of main protein substances in soy sauce g/dL

表2 酱油蛋白质氨基酸序列检测结果Table 2 Detection results of amino acid sequence of soy sauce protein

经对比,利用阈值算法和三角化模型结合所进行的蛋白质结构预测结果,和利用凯氏定氮法检测所得的蛋白质氨基酸序列检测结果相符。

6 结论

利用三角化模型进行蛋白质氨基酸序列结构预测,同时结合阈值算法进行预测结构筛选,所得到的蛋白质结构预测结果和实际检测所得的蛋白质结构相符。因试验检测周期较长且资源耗费较大,因此对酱油蛋白质物质种类筛选及酱油成分预测时,可采用阈值算法与三角化模型相结合的方式进行筛选和预测。

猜你喜欢

酱油氨基酸阈值
土石坝坝体失稳破坏降水阈值的确定方法
鹅掌柴蜂蜜氨基酸组成识别研究
低蛋白日粮平衡氨基酸对生长猪生产性能的影响
“打”来“打”去花样多
猪回肠氨基酸消化率的评定方法
采用红细胞沉降率和C-反应蛋白作为假体周围感染的阈值
买酱油
买酱油
基于迟滞比较器的双阈值稳压供电控制电路
脑卒中后中枢性疼痛相关血浆氨基酸筛选