APP下载

江西省烟叶化学指标分析及感官质量分类模型构建

2024-11-02黄建杨新士唐民马占峰郭先锋宁扬孔凡玉王大彬

湖北农业科学 2024年10期

摘要:为探究江西省烟叶的质量特征,利用方差分析、区间估计等统计学方法分析不同感官质量档次(A类、B类、C类)上、中、下3个部位江西省烟叶11项化学指标的差异性及协调性等特征,在此基础上构建支持向量机(SVM)和随机森林(RF)2种模型用于烟叶感官质量分类预测。结果表明,上、中、下3个部位C类烟叶分别有7、6、6项化学指标高于A类、B类,B类烟叶分别有3、3、2项高于A类、C类,而A类烟叶分别有0、2、3项高于B类、C类;从区间长度来看,上、中、下3个部位C类烟叶分别有9、9、7项化学指标高于A类、B类,B类烟叶分别有1、0、3项高于A类、C类,而A类烟叶分别有1、2、1项高于B类、C类,3个部位C类烟叶化学成分的协调性远差于A类、B类,这可能是导致感官质量变差的重要原因。SVM和RF 2种模型的精确率、召回率和F1分数的加权平均值均超过84%,且SVM模型的3项指标稍高于RF模型。C类烟叶化学指标特征与A类、B类存在明显区别,而A类、B类之间差别相对较小;SVM模型对A类、B类烟叶样品的分类性能优于RF模型,RF模型对C类的识别性能优于SVM模型。

关键词:烟叶;化学指标;感官质量;分类模型;江西省

中图分类号:S572 文献标识码:A

文章编号:0439-8114(2024)10-0153-07

DOI:10.14088/j.cnki.issn0439-8114.2024.10.028 开放科学(资源服务)标识码(OSID):

Abstract: In order to explore the quality characteristics of tobacco leaves in Jiangxi Province, statistical methods such as analysis of variance and interval estimation were used to analyze the differences and coordination of 11 chemical indicators in the upper, middle, and lower parts of tobacco leaves with different sensory quality grades (Class A, Class B, Class C) in Jiangxi Province. On this basis, this study constructed support vector machine (SVM) models and random forest (RF) models for predicting the sensory quality classification of tobacco leaves. The results showed that Class C tobacco leaves in the upper, middle, and lower parts had 7, 6, and 6 chemical indicators higher than Class A and Class B, respectively. Class B tobacco leaves in the upper, middle, and lower parts had 3, 3, and 2 chemical indicators higher than Class A and Class C, respectively, while Class A tobacco leaves in the upper, middle, and lower parts had 0, 2, and 3 chemical indicators higher than Class B and Class C, respectively; from the perspective of interval length, class C tobacco leaves in the upper, middle, and lower parts had 9, 9, and 7 chemical indicators higher than Class A and Class B, respectively. Class B tobacco leaves in the upper, middle, and lower parts had 1, 0, and 3 chemical indicators higher than Class A and Class C, respectively, while Class A tobacco leaves in the upper, middle, and lower parts had 1, 2, and 1 chemical indicators higher than Class B and Class C, respectively. The coordination of chemical components in Class C tobacco leaves was much worse than that in Class A and Class B, which might be an important reason for the deterioration of sensory quality. The weighted average of accuracy, recall, and F1 score for both SVM and RF models exceeded 84%, and the SVM model had slightly higher three indicators than the RF model. There were significant differences in the chemical index characteristics of Class C tobacco leaves compared to Class A and Class B, while the differences between Class A and Class B were relatively small;the SVM model had better classification performance for Class A and B tobacco samples than the RF model, while the RF model had better recognition performance for Class C than the SVM model.

Key words: tobacco leaves; chemical indicators; sensory quality; classification model; Jiangxi Province

感官质量是评价烟叶质量的重要因子,也是决定烟叶工业可用性的主要依据[1]。化学成分是影响烟叶感官质量的内在物质基础[2,3],因此有关烟叶感官质量与其内在化学成分的关系研究一直是烟草行业关注的热点和难点问题。目前文献报道较多的烟叶感官质量与化学成分关系研究采用的方法主要包括简单相关性分析[4-6]、灰色关联度分析[7]、典型相关分析[8,9]以及回归分析[10]等,它们通过对烟叶感官质量进行定量打分,然后与其化学成分含量建立相关或回归等统计学关系,进而实现感官质量与化学成分的内在关联研究。但是,基于烟叶感官质量定性划分研究不同档次烟叶化学成分差异性和区间分布等方面的特征以及基于化学成分的感官质量分类模型的报道较少。近年来,机器学习等人工智能技术成为烟草领域的研究热点,在智能化烘烤[11]、香型识别[12]、烟叶分级[13-15]、非烟物质识别[16]、烟叶成熟度判别[17-19]以及病害识别[20]等方面已有相关报道。在烟叶感官质量预测模型构建方面,别瑞等[21]开展了基于XGBoost算法的山东省烟叶感官质量预测模型构建及可解释性等方面的研究,但该研究同样缺少对不同感官质量档次烟叶化学成分的差异性以及区间分布的分析。综上,本研究以感官质量为导向,将江西省烟叶按照感官质量划分为A类、B类、C类3个档次,探究不同档次烟叶还原糖、总糖、总氮、总植物碱、淀粉、钾、氯、两糖差、糖碱比、氮碱比和钾氯比等化学指标的差异性以及区间分布,在此基础上,采用支持向量机(SVM)和随机森林(RF)2种算法构建感官质量分类模型,并考察2种算法对不同感官质量档次江西省烟叶的分类性能。本研究可为不同产区烟叶质量特征评价以及感官质量分类模型构建提供参考借鉴。

1 材料与方法

1.1 试验设计

本试验于2021年、2022年在江西中烟基地赣州市石城县开展,栽培品种为K326,根据各烟站土壤气候等生态条件、生产水平及往年的烟叶质量状况,共确定39个试验点,其中2021年29个,2022年10个。每个试验点的烟田为1个烟农所有,且种植面积为1.2 hm2(满足1个烤房单次装烟量)。每个试验点内的农事操作均按照当地实际生产方案,保证田间烟株长势均匀一致。

1.2 样品采集

为保证样品的代表性,按照上部、中部、下部3个部位采集烟叶样品,分别以第1、3、5次采集的烟叶作为各试验点的下部、中部和上部烟叶的代表性样品,剔除青杂烟叶后不再分级,用牛皮纸等包裹好装入样品袋中以备后续使用。

1.3 化学成分检测

烟叶样品中还原糖、总糖、总氮、总植物碱、淀粉、钾、氯等化学成分的测定方法如下:总糖含量、还原糖含量按照YC/T 159—2019《烟草及烟草制品 水溶性糖的测定 连续流动法》标准测定,总氮含量按照YC/T 33—1996《烟草及烟草制品 总氮的测定 克达尔法》标准测定,总植物碱含量按照YC/T 468—2021《烟草及烟草制品 总植物碱的测定 连续流动(硫氰酸钾)法》标准测定,淀粉含量按照YC/T 216—2013《烟草及烟草制品 淀粉的测定 连续流动法》标准测定,钾含量按照YC/T 217—2007《烟草及烟草制品 钾的测定 连续流动法》标准测定,氯含量按照YC/T 162—2011《烟草及烟草制品 氯的测定 连续流动法》标准测定。两糖差为总糖含量和还原糖含量的差值,糖碱比为还原糖含量与总植物碱含量的比值,氮碱比为总氮含量与总植物碱含量的比值,钾氯比为钾含量与氯含量的比值。

1.4 感官质量评吸

对每个试验点的下部、中部和上部代表性烟叶样品分别进行感官质量赋分,然后按照下部、中部、上部权重系数(5%、70%、25%)计算得到各试验点烟叶样品感官质量的综合得分,并根据综合得分高低将感官质量划分为A类、B类、C类 3个档次,其中A类代表烟叶感官质量较好,B类代表烟叶感官质量中等,C类代表烟叶感官质量较差。本研究中共有11个试验点烟叶感官质量为A类,17个试验点的烟叶感官质量为B类,11个试验点烟叶感官质量为C类。

1.5 分类模型与评价指标

1.5.1 数据集划分 将不同感官质量烟叶样品按照7∶3的比例随机划分为训练集和测试集,彼此之间样品不重叠。其中训练集用于模型构建,测试集用于评价模型的泛化能力。

1.5.2 分类模型 采用支持向量机(SVM)和随机森林(RF)对不同感官质量烟叶样品数据集进行建模。SVM是一种对数据进行二元分类的广义线性分类器,其决策函数由少数的支持向量确定,是一个具有稀疏性和稳健性的分类器,通过引入核函数可实现非线性分类。RF是Breiman等[22]提出的一种基于决策树的集成算法,对数据噪声容忍度好,具有人工干预少、运算速度快等优点。

1.5.3 模型评价指标

1)混淆矩阵。表1为混淆矩阵,包括真正例(True positive,TP)、假正例(False positive,FP)、假反例(False negative,FN)和真反例(True negative,TN)4种情况。根据测试集中每个样品预测情况,分别放到这4个格子的相应位置。

2)准确率(Accuracy)。准确率表示分类正确的样本占总样本的比例,计算公式如下。

3)精确率(Precision)。精确率又叫查准率,表示预测结果为正确的样本数量占该类别预测数量的比例,计算公式如下。

4)召回率(Recall)。召回率又称为查全率,表示预测结果正确的样本数量占该类别真实数量的比例,计算公式如下。

5)F1分数(F1 score)。F1分数是综合了精确率和召回率的一个判断指标,F1分数取值范围为0~1,1是最好,0是最差,F1分数越高,说明模型越稳健,计算公式如下。

6)加权平均值(Weighted average)。

式中,Wa表示加权平均值;Ci表示每个类别数量在样本数量中的占比;Xi表示每个类别的准确率(召回率或F1分数)。

1.6 数据分析

本研究采用Microsoft Excel软件、Origin软件以及R语言等进行数据处理、图形绘制及统计分析等工作。

2 结果与分析

2.1 烟叶化学指标特征分析

2.1.1 不同感官质量烟叶化学指标的差异性分析 表2展示了3个部位不同感官质量烟叶各项化学指标的平均值、标准差以及方差分析结果。

1)下部叶样品。3个类别(A类、B类、C类)还原糖含量表现为C类>B类>A类,C类还原糖含量极显著高于A类、B类(P<0.01);总糖含量表现为C类>A类>B类,C类总糖含量极显著高于A类、B类(P<0.01);总植物碱含量表现为A类>B类>C类,A类极显著高于C类(P<0.01),B类显著高于C类(0.01<P<0.05);总氮含量表现为B类>A类>C类,A类、B类极显著高于C类(P<0.01);钾含量表现为A类>B类>C类,A类、B类极显著高于C类(P<0.01);氯含量表现为B类>C类>A类,B类显著高于A类(0.01<P<0.05);淀粉含量表现为C类>B类>A类,C类极显著高于A类、B类(P<0.01);两糖差表现为C类>A类>B类,C类极显著高于B类(P<0.01),显著高于A类(0.01<P<0.05);糖碱比表现为C类>B类>A类,C类极显著高于A类、B类(P<0.01);氮碱比表现为C类>B类>A类,C类显著高于A类(0.01<P<0.05);钾氯比表现为A类>C类>B类,A类显著高于B类(0.01<P<0.05)。综上,下部叶C类烟叶还原糖含量、总糖含量、淀粉含量、两糖差、糖碱比、氮碱比最大,且还原糖含量、总糖含量、淀粉含量、两糖差和糖碱比显著高于A类、B类,氮碱比显著高于A类;B类烟叶的总氮含量、氯含量最高,且总氮含量极显著高于C类,氯含量显著高于A类;A类烟叶总植物碱含量、钾含量和钾氯比最高,且总植物碱含量、钾含量极显著高于C类,钾氯比显著高于B类。

2)中部叶样品。3个类别(A类、B类、C类)还原糖含量表现为C类>B类>A类,C类极显著高于A类(P<0.01)、显著高于B类(0.01<P<0.05);总糖含量表现为C类>A类>B类,C类极显著高于A类、B类(P<0.01);总植物碱含量表现为B类>A类>C类,B类极显著高于C类(P<0.01);总氮含量表现为B类>A类>C类,B类极显著高于C类(P<0.01);钾含量表现为A类>B类>C类,但3个类别间无显著差异;氯含量表现为 B类>C类>A类,B类极显著高于A类(P<0.01),显著高于C类(0.01<P<0.05);淀粉含量表现为C类>A类>B类,C类显著高于B类(0.01<P<0.05);两糖差表现为C类>A类>B类,C类极显著高于B类(P<0.01),A类显著高于B类(0.01<P<0.05);糖碱比表现为C类>B类>A类,C类极显著高于A类、B类(P<0.01);氮碱比表现为C类>B类>A类,3个类别之间无显著差异;钾氯比表现为A类 >C类>B类,A类极显著高于B类(P<0.01)。综上,中部叶C类烟叶还原糖含量、总糖含量、淀粉含量、两糖差、糖碱比、氮碱比最高,且还原糖含量、总糖含量、糖碱比显著高于A类、B类,淀粉含量、两糖差显著高于B类;B类烟叶总植物碱含量、总氮含量、氯含量最高,且总植物碱含量、总氮含量显著高于C类,氯含量极显著高于A类;A类烟叶钾含量、钾氯比最高,且钾氯比显著高于B类。

3)上部叶样品。3个类别(A类、B类、C类)还原糖含量表现为C类>B类>A类,但3个类别间均无显著差异;总糖含量表现为C类>A类>B类,C类显著高于B类(0.01<P<0.05);总植物碱含量表现为B类>A类>C类,B类显著高于C类(0.01<P<0.05);总氮含量表现为B类>A类>C类,B类显著高于C类(0.01<P<0.05);钾含量表现为C类>B类>A类,但3个类别间无统计学差异;氯含量表现为B类> C类>A类,B类极显著高于A类、C类;淀粉含量表现为C类>A类>B类,C类极显著高于B类;两糖差表现为A类>B类 =C类,3个类别间无显著差异;糖碱比表现为C类>B类>A类,3个类别间无显著差异;氮碱比表现为C类>B类>A类,3个类别间无显著差异;钾氯比表现为C类>A类>B类,C类、A类显著高于B类(0.01<P<0.05)。综上,上部叶C类烟叶还原糖含量、总糖含量、钾含量、淀粉含量、糖碱比、氮碱比和钾氯比最高,且总糖含量、淀粉含量显著高于B类;B类烟叶总植物碱含量、总氮含量、氯含量最高,且总植物碱含量、总氮含量显著高于C类,氯含量显著高于A类、C类;A类烟叶两糖差最高,3个类别间无显著差异。

2.1.2 不同感官质量烟叶化学指标区间分析 根据表3可知,不同感官质量烟叶化学指标的区间长度存在差异。

1)下部叶。3个类别(A类、B类、C类)还原糖含量区间长度表现为B类(4.17%)>C类(3.15%)>A类(2.86%),总糖含量表现为C类(5.56%)>B类(4.50%)> A类(3.97%),总植物碱含量表现为A类(0.48%)>B类(0.39%)>C类(0.28%),总氮含量表现为B类(0.23%)>A类(0.19%)> C类(0.17%),钾含量表现为B类(0.58%)>C类(0.42%)>A类(0.41%),氯含量表现为C类(0.32%)>B类(0.18%)>A类(0.17%),淀粉含量表现为C类(2.13%)>B类(0.68%)=A类(0.68%),两糖差表现为C类(5.87%)>A类(3.69%)>B类(2.66%),糖碱比表现为C类(5.15)>B类(4.41)>A类(4.21),氮碱比表现为C类(0.27)>A类(0.25)>B类(0.20),钾氯比表现为C类(9.97)>A类(5.00)>B类(2.21)。综上,下部叶C类烟叶总糖含量、氯含量、淀粉含量、两糖差、糖碱比、氮碱比和钾氯比的区间长度最大,B类还原糖含量、总氮含量、钾含量的区间长度最大,而A类总植物碱含量区间长度最大。

2)中部叶。3个类别(A类、B类、C类)还原糖含量区间长度表现为C类(3.80%)>B类(3.02%)>A类(2.07%),总糖含量表现为C类(5.82%)>A类(3.71%)>B类(3.02%),总植物碱含量表现为C类(0.68%)>B类(0.53%)>A类(0.38%),总氮含量表现为C类(0.19%)>A类(0.17%)>B类(0.15%),钾含量表现为A类(0.50%)>B类(0.43%)>C类(0.25%),氯含量表现为C类(0.20%)>B类(0.15%)>A类(0.12%),淀粉含量表现为C类(3.25%)>A类(2.97%)>B类(1.66%),两糖差表现为A类(4.36%)>C类(4.23%)>B类(2.28%),糖碱比表现为C类(4.48)>B类(2.40)>A类(1.87),氮碱比表现为C类(0.18)>B类(0.14)>A类(0.07),钾氯比表现为C类(7.29)>A类(6.27)>B类(2.70)。综上,中部叶C类烟叶还原糖含量、总糖含量、总植物碱含量、总氮含量、氯含量、淀粉含量、糖碱比、氮碱比和钾氯比区间长度最大,A类钾含量、两糖差区间长度最大。

3)上部叶。3个类别(A类、B类、C类)还原糖含量区间长度表现为C类(3.97%)>B类(2.66%)>A类(2.43%),总糖含量表现为C类(3.00%)>B类(1.95%)>A类(1.50%),总植物碱含量表现为C类(0.78%)>B类(0.55%)>A类(0.30%),总氮含量表现为C类(0.20%)>A类(0.18%)>B类(0.14%),钾含量表现为C类(0.30%)>A类(0.26%)>B类(0.19%),氯含量表现为 B类(0.19%)>A类(0.16%)>C类(0.15%),淀粉含量表现为C类(2.55%)>A类(2.21%)>B类(1.22%),两糖差表现为 A类(2.82%)>B类(2.71%)>C类(2.41%),糖碱比表现为C类(3.53)>B类(1.92)>A类(1.21),氮碱比表现为C类(0.16)>B类(0.10)>A类(0.05),钾氯比表现为C类(5.48)>A类(3.69)>B类(1.72)。综上,上部叶C类烟叶还原糖含量、总糖含量、总植物碱含量、总氮含量、钾含量、淀粉含量、糖碱比、氮碱比和钾氯比区间长度最大,B类氯含量区间长度最大,A类两糖差区间长度最大。

2.2 烟叶感官质量分类模型的构建及评价

本研究通过训练集优化了SVM和RF 2种模型的参数,得到烟叶感官质量最优分类模型,然后将测试集中的烟叶样品输入到2种模型中得到分类结果。图1为SVM和RF 2种模型判别测试集中不同感官质量烟叶样品的混淆矩阵。mTSc4kPbdsLsgsx9LLlx4w==2种模型均有2个样品发生了误判,总体的判别准确率均为85%。在SVM模型中,1个B类样品被误判为A类,1个C类样品被误判为B类,而在RF模型中,1个A类样品被误判为B类,1个B类被误判为A类。

基于混淆矩阵结果,进一步计算2种模型判别不同感官质量烟叶样品的精确率、召回率以及F1分数(表4)。对于A类烟叶样品,SVM模型和 RF模型的精确率均为75%,但SVM模型的召回率和F1分数均高于RF模型;对于B类烟叶样品,SVM模型的精确率、召回率和F1分数均高于RF模型;对于C类烟叶样品,SVM模型和RF模型的精确率均为100%,而RF模型的召回率、F1分数均高于SVM模型。综上,SVM模型对A类、B类烟叶样品的分类性能优于RF模型,RF模型对C类烟叶样品的分类性能优于SVM模型。

由图2可知,2种模型的精确率、召回率和F1分数的加权平均值均超过84%,其中SVM模型的3项指标稍高于RF模型,表明SVM模型对烟叶样品的整体分类性能稍优于RF模型。

3 讨论

烟叶化学成分含量以及协调性是影响感官质量的主要因素。上、中、下3个部位C类烟叶分别有7、6、6项化学指标高于A类、B类,B类烟叶分别有3、3、2项高于A类、C类,而A类烟叶分别有0、2、3项高于B类、C类。3个部位C类烟叶的还原糖含量、总糖含量、淀粉含量、糖碱比、氮碱比偏高,而总植物碱含量、总氮含量偏低,这些因素可能是制约C类烟叶感官质量的主要因素,因此为改善C类烟叶的感官质量,需整体上降低3个部位烟叶的还原糖含量、总糖含量、淀粉含量、糖碱比和氮碱比,提高总植物碱含量、总氮含量。许威等[23]的研究发现,江西省烟叶存在部分淀粉含量、糖碱比、氯含量、氮碱比、两糖比偏高,钾含量、钾氯比偏低等问题。李晓等[24]的研究发现,下部烟叶表现为高糖、高钾、高糖碱比和低烟碱,中部烟叶表现为高糖、高钾、高糖碱比和中烟碱,上部烟叶表现为中糖、高烟碱、高钾的特性。王得强等[25]的研究发现,江西省烟叶表现出高糖、高碱、中氮、富钾、低氯的规律。以上结论差异可能是由烟叶生长年份、生态环境、气候土壤等因素不同造成的。

区间长度是衡量烟叶化学成分离散程度的直观指标,区间长度越大,化学成分离散程度越高,意味着化学成分之间协调性越差;反之,区间长度越小,化学成分离散程度越低,协调性越好。上、中、下3个部位C类烟叶分别有9、9、7项化学指标高于A类、B类,B类烟叶分别有1、0、3项高于A类、C类,而A类分别有1、2、1项高于B类、C类。由此可见,3个部位C类烟叶化学成分的协调性远差于A类、B类,这可能也是导致感官质量变差的重要原因。其中,总糖含量、淀粉含量、糖碱比、氮碱比和钾氯比5项指标在3个部位C类烟叶上的区间长度最大,说明这5项指标的协调性较差;氯含量在中部、下部C类烟叶上的区间长度最大,说明中部、下部烟叶的氯含量协调性较差;还原糖含量和总植物碱含量在中部、上部C类烟叶上的区间长度最大,说明中部、上部C类烟叶的还原糖含量和总植物碱含量的协调性较差。

目前烟叶感官质量依靠人工评价,存在工作强度大、对评吸人员素质要求高等问题。机器学习技术在农产品品质判别方面已有较多研究[26],因此构建机器学习模型用于烟叶感官质量预测是一个值得研究的问题。本研究基于烟叶化学成分构建了SVM、RF 2种机器学习模型,虽然SVM模型的整体性能优于RF模型,但RF模型对C类烟叶样品具有更好的分类性能,可用于预测感官质量较差的烟叶,减轻评吸人员的工作量,具有更好的实用性。

4 小结

本研究采用方差分析、区间估计等方法分析江西省烟叶化学指标特征,并构建感官质量分类模型。研究发现,C类烟叶化学指标的差异性、协调性等特征与A类、B类存在明显区别,而A类、B类之间差异较小。SVM模型综合性能指标稍优于RF模型,但RF模型对C类烟叶的识别能力强于SVM模型,具有更好的实用性。

参考文献:

[1] 欧阳文. 卷烟工艺与评吸[M]. 成都: 西南财经大学出版社, 2008.

[2] 尹启生, 过伟民, 张艳玲, 等. 烤烟品种间理化特征的差异及其与感官质量的关系[J]. 烟草科技, 2016, 49(5): 23-29.

[3] 曹仕明, 高远峰, 曹勤华, 等. 湖北典型生态区烤烟质量风格特征及其影响因子分析[J]. 中国烟草科学, 2015, 36(1): 14-18.

[4] 杨景全, 于国锋, 冯 媛, 等. 初烤烟叶颜色与常规化学成分及感官质量相关性研究[J]. 江西农业学报, 2019, 31(5): 79-83.

[5] 赵友根, 拓阳阳, 李贵刚, 等. 复烤烟叶C3F等级主要化学成分与感官评吸质量的相关性[J]. 贵州农业科学, 2018, 46(9): 126-129.

[6] 王 芳, 王玉平, 杨 辉, 等. 贵州有机生态烟叶主要化学成分与感官质量的相关分析研究[J]. 中国农学通报, 2013, 29(22): 103-108.

[7] 王育军, 周冀衡, 李 强, 等. 曲靖烟叶化学成分可用性及其对感官评吸质量的影响[J]. 烟草科技, 2014(11): 67-73.

[8] 武广鹏, 李许涛, 李钦奎, 等. 河南烟叶化学成分与感官质量的相关性分析[J]. 江西农业学报, 2022, 34(10): 25-29.

[9] 焦绍赫, 何宽信, 王念磊, 等. 江西烤烟主要理化指标对感官评吸质量的影响[J]. 贵州农业科学, 2018, 46(1): 21-24.

[10] 沈 晗, 杨 凯, 任 伟, 等. 影响上部烟叶感官质量的主要化学成分分析[J]. 中国烟草学报, 2019, 25(6): 18-26.

[11] ZHANG J, TIAN F, YANG S, et al. An intelligent and automatic control method for tobacco flue-curing based on machine learning[J]. International journal of robotics and automation technology, 2016, 31: 509-518.

[12] 邱昌桂, 孔兰芬, 杨式华, 等. 基于GA-SVM算法的烤烟香型自动识别研究[J]. 烟草科技, 2019, 52(2): 101-108.

[13] 鲁梦瑶, 周 强, 姜舒文, 等. 基于深度学习与多尺度特征融合的烤烟烟叶分级方法[J]. 中国农机化学报, 2022, 43(1): 158-166.

[14] LI R, ZHANG X, LI K, et al. Nondestructive and rapid grading of tobacco leaves by use of a hand-held near-infrared spectrometer, based on a particle swarm optimization-extreme learning machine algorithm[J]. Spectroscopy letters, 2020, 53(9): 685-691.

[15] 张 慧, 张文伟, 张永毅, 等. 基于高光谱与纹理融合的烤烟分类方法研究[J]. 中国烟草学报, 2022, 28(3): 72-80.

[16] 李智慧, 梅吉帆, 李 辉, 等. 高光谱成像的非烟物质分类识别研究[J]. 中国烟草学报, 2022, 28(3): 81-88.

[17] 李 鑫, 汤卫荣, 张永辉, 等. 基于高光谱成像技术的烟叶田间成熟度判别模型[J]. 烟草科技, 2022, 55(7): 17-24.

[18] 邓建强,王大彬,乾 艳,等.基于高光谱成像技术的烤烟上部烟叶成熟度光谱特征分析及判别模型构建应用研究[J].中国烟草学报,2024,30(1):36-45.

[19] LI J X, ZHAO H, ZHU S P, et al. An improved lightweight network architecture for identifying tobacco leaf maturity based on deep learning[J]. Journal of intelligent & fuzzy systems, 2021, 41(2): 4149-4158.

[20] ZHU H, CHU B, ZHANG C, et al. Hyperspectral imaging for presymptomatic detection of tobacco disease with successive projections algorithm and machine-learning classifiers[J]. Scientific reports, 2017, 7(1): 4125.

[21] 别 瑞, 周婷云, 周显升, 等. 基于XGBoost算法的山东烟叶质量预测模型初探[J]. 中国烟草科学,2022,43(5): 80-86.

[22] BREIMAN L. Random forests[J]. Machine learning,2001,45(1):5-32.

[23] 许 威, 宋纪真, 谌 剑, 等. 赣州烟叶主要化学成分最优适宜范围研究[J]. 安徽农业科学, 2023, 51(2): 199-205, 211.

[24] 李 晓, 万应发, 刘建永, 等. 江西黎川基地烟叶质量特点与稳定性分析[J]. 中国烟草科学, 2013, 34(3): 89-93.

[25] 王得强, 曾 兵, 陈若星, 等. 江西烟叶质量特性分析[J]. 安徽农业科学, 2019, 47(17): 201-203, 206.

[26] 王 聪,姜舒文, 黄 坤, 等. 机器学习在农产品供应链关键环节中的应用进展研究综述[J]. 中国农机化学报,2021,42(5): 182-190.

收稿日期:2023-09-28

基金项目:江西中烟工业有限责任公司科技项目(赣烟工科计2021-11)

作者简介:黄 建(1979-),男,江西南昌人,高级农艺师,主要从事烟草栽培研究,(电话)13657088933(电子信箱)nccfhuangjian@163.com。