基于细菌群落构成对高温大曲类别的判别分析
2016-10-14陈良强王和玉汪地强
陈良强,杨 帆,王和玉,汪地强,王 莉
(贵州茅台酒股份有限公司技术中心,贵州仁怀564501)
基于细菌群落构成对高温大曲类别的判别分析
陈良强,杨帆,王和玉,汪地强,王莉
(贵州茅台酒股份有限公司技术中心,贵州仁怀564501)
利用二代测序技术对茅台3种典型代表曲的细菌群落结构进行了解析,共发现580个不同细菌,表明茅台高温大曲细菌群落组成的多样性和复杂性。通过分析样品中细菌群落构成的特点,运用偏最小二乘法对微生物变量进行了筛选,并结合Fisher判别等多元统计分析方法,建立了基于细菌群落构成的高温大曲类别的判别模型。该判别模型对不同类别大曲综合判别准确率为96.8%,外部测试样品判别准确率为92.2%,这证实了大曲微生物群落结构信息与3种典型代表曲具有较强的关联性,所建立的判别模型准确有效。
高温大曲; 高通量测序; 细菌群落构成; 偏最小二乘法; 判别分析
曲是白酒酿造不可或缺的一部分,有着“酒之骨”之称。酱香型白酒酿造过程所使用的曲为高温大曲,其制曲过程经历低、中、高3个温度过程,形成了丰富的微生物群落结构,包括细菌、酵母与霉菌,其中细菌数量最高[1-2]。王晓丹等[3]利用高通量测序技术分析了3种不同厂家的成品高温大曲细菌群落结构,共检测出6个门49个属细菌,其中以高温放线菌属和芽孢杆菌属为主要优势细菌。由于细菌是高温大曲的优势微生物,因而有大量的学者对高温大曲中细菌的种类和功能进行了研究。聂慧芳等[4]从酱香型大曲成品曲中筛选得到2株高产蛋白酶的枯草芽孢杆菌。邱树毅等[5-7]对高温大曲酸性蛋白酶、糖化酶、纤维素酶、果胶酶和脂肪酶进行活力测定,并对筛选出的48株细菌进行了不同细菌的产酶特性分析。赵兴秀[8]、朱德文[9]、张荣等[10-11]都对高温大曲中产香功能细菌进行了筛选与分离,发现芽孢杆菌对大曲中酱香香气贡献度大。因此,大曲中细菌的群落结构组成对大曲的品质和类别起着重要的作用。但在自然界,利用传统的培养分离技术所分离得到的微生物只占总数的1%左右,因此免培养方式可较为全面解析大曲中的微生物群落构成。
随着分子生物学及其方法的发展,二代测序方法是近些年来发展比较成熟的DNA测序技术,可快速实现大规模多样本的微生物群落分析,被广泛应用于土壤、海洋、人体与动物肠道菌群组成的对比及分析[12-15]。
本研究拟根据对大曲微生物高通量测序结果进行数理统计分析,应用偏最小二乘法对大曲微生物信息进行筛选与优化,结合Fisher判别对优化后的微生物数据信息进行处理分析,建立高温大曲类别的判别模型,从而为生产提供一定的指导作用。
1 材料与方法
1.1材料
样品来源于贵州茅台酒股份有限公司,其中用于建模的样品共154个:出仓白曲(20个)、出仓黄曲(21个)、成品曲(113个);用于外部测试的样品51个:出仓白曲(7个)、出仓黄曲(8个)、成品曲(36个)。
1.2实验方法
按照参考文献[2,16]的方法对样品DNA进行提取与纯化,以及PCR扩增,所得样品送深圳华大基因公司454 GS FLX Titanium测序平台,采用16S rDNA的高变区测序技术,对各样品的16S rDNA的可变区V4—V5的PCR产物进行测序。
对测序后的下机数据(reads)进行整理和质量控制,去除测序接头和低质量reads后,再进行组装,从而获得用于后续分析的序列。同时采用mothur软件包按照97%的离散度进行聚类,将序列归为1个操作分类单元(operational taxonomic unit,OTU),OTU序列经与RDP数据库比对获得物种分类的信息[17]。
1.3数据分析
利用SIMCA-P软件进行偏最小二乘法(PLS)分析,完成对微生物变量的筛选与优化。根据优化后的微生物变量,运用R语言对高温大曲类别进行Fisher判别。
2 结果与分析
2.1高温大曲微生物群落结构组成
利用454高通量测序技术,对所有样品进行测序分析,共获得580个微生物种类(微生物编号为x1、x2、x3、x4、x5……x576、x577、x578、x579、x580)与每种微生物的相对含量。
2.2微生物变量的筛选
由于高温大曲中微生物群落组成复杂,若直接将580个微生物变量用于大曲类别的判别,将会造成判别模型的准确性差和运行效率低,因此,必须对微生物变量进行初步筛选,选择对样品质量分类贡献大的微生物变量指标用于后续的分析。偏最小二乘法是一种新型的多元统计数据分析方法,其变量投影重要性指标VIP值是反映自变量在解释因变量作用时的重要性,因此可以根据VIP值的大小筛选与优化判别模型中自变量的数量[18-20]。
将获取微生物变量与样品信息输入SIMCA-P软件,利用偏最小二乘法,对获得的微生物变量进行筛选与优化,根据变量投影重要性指标(VIP)值≥1的原则,进行变量筛选。结果发现共有12种微生物的VIP值≥1(图1)。
图1 VIP≥1的微生物变量
为进一步验证这12种微生物在大曲样品中的代表性,对该12种微生物在所有样品中出现的频率和含量进行了统计分析,结果见表1。
表1 筛选得到的12种微生物在样品中的出现频率和含量
由表1可知,这12种微生物几乎在所有的样品中都能检测到,且平均总含量占大曲细菌含量的80.79%,这进一步证实该12种微生物能较为全面代表大曲中微生物的信息,因此将作为后续分析中判别标准的变量。另一方面,结合图1和表1可以发现,有些微生物含量虽然低,但其VIP值≥1,表明高温大曲中细菌群落结构的复杂性。
2.3判别模型的构建
通过R语言的程序包,采用Fisher判别分析方法,以上述12种微生物数据为自变量对3种高温大曲(白曲、黄曲和成品曲)进行判别分析,构建高温大曲类别的判别函数。
利用交叉验证对建模样品进行回判,以验证判别效果,结果见图2和表2。
图2 不同类别大曲的判别结果
表2 建模样品交叉验证结果
从表2可以看出,用于建模的样品共154个:白曲(20个)、黄曲(21个)、成品曲(113个)。该二次判别对白曲的判别准确率为17/20=85.0%,对出仓黄曲的判别准确率为20/21=95.2%,对成品曲的判别准确率为112/113= 99.1%,综合判别准确率为(17+20+112)/(20+21+113)= 96.8%,表明所建立的判别模型对大曲质量鉴别的判别较为有效。
为了进一步验证该判别模型,选择51个外部的测试样品(白曲7个、黄曲8个、成品曲36个)对模型进行测试,结果见表3。
表3 外部测试样品验证结果
从表3可以看出,该二次判别对外部测试样品中白曲的判别准确率为6/7=85.7%,对黄曲的判别准确率为7/8=87.5%,对成品曲的判别准确率为34/36=94.4%,综合判别准确率为(6+7+34)/51=92.2%,该结果进一步表明所建立的判别模型对3种典型代表曲的判别效果较好。
3 结论
本研究运用二代测序技术,对茅台高温大曲细菌群构成进行了解析,结果发现共有580个不同细菌,表明茅台大曲细菌群落组成的复杂性与多样性。同时通过分析高温大曲细菌群落的构成特点,运用偏最小二乘法对微生物变量进行了筛选,并结合Fisher判别等多元统计分析方法,建立了基于细菌群落构成的高温大曲类别的判别模型。该判别模型对不同类别大曲综合判别准确率为96.8%,外部测试样品判别准确率为92.2%,这表明大曲微生物群落结构信息与3种典型代表曲具有较强的关联性,所建立的判别模型准确有效。
[1]杨代永,范光先,汪地强,等.高温大曲中的微生物研究[J].酿酒科技,2007(5):37-38.
[2]Wang L,Wang YY,Wang D Q,et al.Dynamic changes in the bacterial community in Moutai liquor fermentation process characterized by deep sequencing[J].Journal of the Institute of Brewing,2015,121(4):603-608.
[3]王晓丹,班世栋,周鸿翔,等.贵州省遵义地区3个酱香型大曲细菌群落的比较分析[J].食品科学,2016(37):110-116.
[4]聂慧芳,蒋英丽,沈毅,等.酱香型大曲中高产蛋白酶细菌的分离鉴定[J].酿酒科技,2015(12):41-44.
[5]王婧,王晓丹,罗晓叶,等.酱香大曲中高产蛋白酶功能细菌的筛选及鉴定[J].中国酿造,2015,34(10):43-46.
[6]杨国华,邱树毅,黄永光.酱香大曲中产香细菌发酵产蛋白酶的条件优化[J].中国酿造,2011(12):47-50.
[7]王晓丹,胡宝东,班世栋,等.酱香型大曲酶系与大曲中微生物产酶关系的研究[J].酿酒科技,2015(9):1-7.
[8]赵兴秀,何义国,赵长青,等.产酱香功能菌的筛选及其风味物质研究[J].食品工业科技,2016(6).
[9]朱德文,蒋英丽,高鸿,等.酱香型大曲中一株产香芽孢杆菌的分离鉴定[J].酿酒科技,2014(6):39-41.
[10]Zhang R,Wu Q,Xu Y.Aroma characteristics of Moutaiflavour liquor produced with Bacillus licheniformis by solid-state fermentation[J].Letters inApplied Microbiology,2013,57(1):11-18.
[11]Zhang R,Wu Q,Xu Y,et al.Isolation,identification,and quantification of lichenysin,a novel nonvolatile compound in Chinese distilled spirits[J].Journal of Food Science,2014,79 (10):C1907-C1915.
[12]Kong F,Zhao J,Han S,et al.Characterization of the gut microbiota in the red panda(Ailurus fulgens).[J].Plos One,2014,9(2):e87885.
[13]杨帆,陈良强,罗汝叶,等.基于箱线图对大曲质量的判别分析[J].酿酒科技,2015(5):1-3.
[14]Wu X,Zhang H,Chen J,et al.Comparison of the fecal microbiota of dholes high-throughput Illumina sequencing of the V3-V4 region of the 16S rRNAgene[J].Applied Microbiology&Biotechnology,2016:1-10.
[15]王莉,王亚玉,王和玉,等.酱香型白酒窖底泥微生物组成分析[J].酿酒科技,2015(1):12-15.
[16]Tamaki H,Wright C L,Li X,et al.Analysis of 16S rRNA amplicon sequencing options on the Roche/454 nextgeneration titanium sequencing platform[J].Plos One,2011,6 (9):e25263.
[17]Cole1 J R,Wang Q,Cardenas E,et al.The Ribosomal Database Project:improved alignments and new tools for rRNAanalysis.[J].NucleicAcids Research,2009,37:D141-D145.
[18]Maulidiani,Abas F,KhatibA,et al.Comparison of Partial Least Squares andArtificial Neural Network for the prediction of antioxidant activity in extract of Pegaga (Centella)varieties from 1H Nuclear Magnetic Resonance spectroscopy[J].Food Research International,2013,54(1):852-860.
[19]Cuevas F J,Morenorojas J M,Arroyo F,et al.Effect of management(organic vs conventional)on volatile profiles of six plum cultivars(Prunus salicina Lindl.).Achemometric approach for varietal classification and determination of potential markers[J].Food Chemistry,2016,199:479-484.
[20]胡超,汤响林,李杰,等.基于UPLC/QTOF-MS技术的补骨脂水提物对大鼠血浆代谢组学研究[J].中药药理与临床,2016 (1):22-26.
Discriminant Analysis of High-Temperature Daqu Types Based on the Composition of Bacterial Populations
CHEN Liangqiang,YANG Fan,WANG Heyu,WANG Diqiang and WANG Li
(Technical Center of Maotai Co.Ltd.,Renhuai,Guizhou 564501,China)
In the experiment,the bacterial populations in three typical Maotai Daqu were analyzed through next-generation sequencing technology,and 580 kinds of bacteria were detected,which proved the complexity and the diversity of high-temperature Daqu bacterial communities. Through analysis of the characteristics of bacterial poplulations composition in Daqu samples,the microbiological variables were screened by using partial least squares method.Futhermore,the discriminant model of high-temperature Daqu had been established with the combination of multivariate statistical analysis methods such as Fisher discriminant.The discriminant accuracy rate of such model for different Daqu types was 96.8%,and the discriminant accuracy rate of external test samples reached up to 92.2%,which proved that the microbial community structure had strong correlations with the three kinds of typical Daqu and the established discriminant model was accurate and effective.
high-temperature Daqu;high-throughput sequencing;bacterial populations;partial least squares method;discriminant analysis
TS261.1;Q93-3;TS262.3
A
1001-9286(2016)09-0048-03
10.13746/j.njkj.2016183
2016-05-27
陈良强(1987-),男,助理工程师,主要从事酿造微生物代谢产物及功能特性研究,E-mail:chenliangqiang123@126.com.。
杨帆(1983-),男,酿造工程师,主要从事酿造微生物代谢产物及功能特性研究,发表论文数篇,E-mail:yangfanmt@189.cn。
优先数字出版时间:2016-07-26;地址:http://www.cnki.net/kcms/detail/52.1051.TS.20160726.1254.005.html。