基于NSGA-Ⅱ遗传算法的烟用香精数字化调香研究及应用
2020-04-27蔡佳校李燕春卢红兵杨华武谭新良钟科军
孔 波,蔡佳校,邹 有,李燕春,卢红兵,杨华武,谭新良,钟科军*
1. 湖南中烟工业有限责任公司技术中心,长沙市雨花区劳动中路386 号 410007
2. 中南大学信息与网络中心,长沙市岳麓区麓山南路932 号 410083
近年来,香精在日化产品、食品、烟草制品等领域的作用日益增加,其对提升产品品质、改善产品风味有重要的作用[1-2]。烟用香精是卷烟生产中的重要原料之一,其在改善卷烟感官品质、突出烟草风格特征方面发挥着不可或缺的作用[3-4]。
烟用香精配方主要由不同用量的香原料组合而成。开发一个良好的香精配方并不是由调香人员将各种香原料随机组合而成,而是需要经验丰富的调香师,在满足一定调香基础理论的条件下,根据各香原料的基本特性及其在香精配方中的作用,经过长时间的反复验证来确定。为了简化烟用香精调香流程,提高调香效率,国内卷烟调香技术人员在利用调香理论辅助烟用调香方面进行了一些尝试,例如许式强等[5]采用香味轮廓法建立了香原料和香基的香气贡献值数据库,并以此为依据构建了卷烟辅助调香模型。目前,主要的调香理论有香气的分维理论(计算香精主题香气的奇怪吸引子的分维,“分维越接近于1,香精的目标香气就越突出”)[6]、香气共振理论(具有共振结构的香精香气比较和谐、稳定)[7]、三值理论(用于描述香比强值、留香值和香品值及其相互之间的联系)[8]等,这些理论对指导调香工作和简化调香过程有一定的参考价值。
随着计算机技术的不断发展,人工智能得到了全面的发展,复杂的决策模型可以通过深度学习大量的数据而智能地输出令人满意的结果[9-11]。对于烟用香精调香而言,可将其视为求得既满足现有调香技术又符合调香师经验的多目标最优解的过程。在科学和工程领域,多目标优化问题(Multi-objective Optimization Problem,MOP)的最优解是由所谓Pareto 最优解或非劣解组成的集合[12]。Srinivas 等[13]提出了非支配排序遗传算法(Non-dominated Sorting Genetic Algorithm,NSGA),用于求解MOP 的Pareto 最优解。NSGA通过非支配排序的方法保留优良个体,并且使同一个小生境内的个体在NSGA 中的适应度共享,以保证种群的多样性,这在很多实际问题的求解过程中取得了良好效果。但是NSGA 也存在一定缺陷,为了克服这些缺陷,Deb 等[14]在初始的NSGA 分层思想的基础上,对其进行了针对性改进,形成了新的非支配排序遗传算法(NSGA-Ⅱ),从而简化了求解过程,提高了求解效率。
在本研究中,采用基于NSGA-Ⅱ最优解的多目标最优化遗传算法,利用计算机的强大计算能力,通过充分挖掘香原料数据特征,并结合现有调香理论以及调香师经验成果,进行烟用香精配方的创作,旨在实现智能化、数字化调香,为烟用香精调配提供方法参考。
1 材料与方法
1.1 材料、试剂和仪器
用于香原料的卷烟加香作用及风格评价、香精的加香风格评价的参比卷烟均为加料未加香的卷烟,由湖南中烟工业有限责任公司提供。调香过程中使用的所有香原料和溶剂均为食用级,由广州华芳烟用香精有限公司提供。X3603SX 电子分析天平(感量0.000 1 g,瑞士Mettler Toledo 公司);KBF720 恒温恒湿箱(德国Binder 公司);HRH-286K 注射加香机(北京慧荣和科技有限公司)。
1.2 方法
1.2.1 香料香精嗅香香韵评价
烟用香料香精嗅香香韵包括常用香韵18 种(树脂香、干草香、清香、果香、辛香、木香、青滋香、花香、药草香、豆香、可可香、奶香、膏香、烘焙香、焦香、酒香、甜香和酸香),根据不同的嗅香香韵强度量化为0~9 分,记分单位为1 分,具体打分标准见表1。评价小组由7 位具有省级及以上感官评吸资格证(或培训合格证)的评委组成,对于感官评价结果,在剔除离群值后,通过计算平均值的方式确定香料香精样品各个香韵分值。在现场判断样品评价数据的离散程度,对离散度较大的样品重新进行评价,确保样品评价质量,以突出香料香精主要香韵和功能。
表1 嗅香香韵评价打分标准Tab.1 Criteria for olfactory aroma evaluation (分)
1.2.2 香料香精卷烟加香评价
为评价将香精添加到参比卷烟时其对香气风格和品质特征的贡献,参考文献[15]进行香精的卷烟加香效果评价,将烟气风格量化为0~10 分,计分单位为1 分。对于单体香原料的卷烟加香评价,考察单体香原料添加到参比卷烟后卷烟烟气的香气风格变化,量化为0~3 分,计分单位为1 分(具体打分标准见表2)。评价小组构成及评价结果确定方法同1.2.1 节。
表2 单体香原料卷烟加香风格评价打分标准Tab.2 Criteria for evaluating monomer fragrance materials for cigarette flavoring (分)
1.2.3 非支配排序遗传算法(NSGA-Ⅱ)原理
NSGA-Ⅱ算法的一般流程如图1 所示,可表述如下:①随机产生含有N 个个体的初始种群P0,进化代数n=0;②对种群Pn中所有个体进行非劣分层,计算每个个体的拥挤距离并进行非支配排序;③采用选择、交叉和变异因子建立规模为N 的子代种群Qn;④合并亲代种群和子代种群,并对其进行非劣分层,计算拥挤距离,得到非支配排序,选择最优的N 个个体形成新一代种群Pn+1;⑤判断n 是否小于代数设定值Genmax,若是,转入②,继续搜索Pareto 最优解;否则,算法结束,输出Pareto 最优解。
图1 NSGA-Ⅱ算法的一般流程Fig.1 General process in NSGA-Ⅱalgorithm
2 基于NSGA-Ⅱ数字化调香方法的建立
2.1 建立香原料描述信息库和经验配方库
本研究核心是调香算法,基础是香原料各类定性、定量数据以及经验配方单。通过仪器检测分析、感官评价、查阅国内外文献书籍和专业数据库,收集了烟草行业常用的包括158 种天然香原料和186 种合成香原料在内的344 种香原料的13 个香味定量描述指标,具体包括名称、溶解性、香比强值、留香值、香品值、来源(合成和天然)、蒸汽压、嗅香主体香韵得分及轮廓、卷烟加香风格得分及轮廓、加香作用、用量范围、作用阈值以及常用调香用途(头香、体香或基香原料)。最终整理形成香原料描述信息库,以供数字化调香算法的调用。以芳樟醇为例,其基本信息见表3。
表3 单体香原料芳樟醇基本信息Tab.3 Basic information of linalool
收集了30 个具有不同主体香气风格的香精配方单(表4),经调香师调整验证后,将其存储为经验配方单以供计算机学习和对调香模型进行约束和求解。其中,1#经验配方单的组成信息见表5。
表4 30 个经验配方单的主体香气风格Tab.4 Main flavor styles of 30 empirical formulas of tobacco flavors
表5 1#经验配方单(甜香、果香风格)的组成信息Tab.5 Information of empirical formula of tobacco flavor 1#(sweet and fruity scents)
2.2 建立调香模型
定义带约束的多目标优化目标函数如下:
Minimize f(x)=[f1(x), f2(x), f3(x)] (1)
s.t. g1(x)=a;
g2(x)=b;
g3(x)=c;
g4(x)=d;
g5(x)=e;
h1(x)>f;
其中:f(x)为3 个目标分量f1(x)、f2(x)和f3(x)组成的向量,x=(x1,x2,…,xN)为N 维决策向量,其中N 表示参与优化计算的香原料数目,xi表示第i 个香原料的用量,xi≥0,i=1,2,3,…,N。
f1(x)为三值理论模型函数:f1(x)=-log(B×L×P/1 000),B 为配方香精的香比强值,L 为配方香精的留香值,P 为配方香精的香品值,采用负对数的形式,将模型最大值求解转换成最小值求解。
f2(x)为分维理论模型函数:f2(x)=-lnM/lnN,f2(x)即分维数的相反数,M 为N 种香原料对目标香气的贡献值之和,M=ΣBiCiVi/ΣBiCi,Bi表示配方中第i 个香原料的香比强值,Ci表示配方中第i 个香原料的用量百分比,Vi表示配方中第i 个香原料与调香目标相同的香韵的嗅香主体香韵得分(如果调香目标为果香,则取该香原料果香的嗅香主体香韵得分)。
f3(x)为共振理论模型函数:f3(x)=X2/Y-Y/Z,X为配方中所有头香香原料的蒸汽压总和,Y 为配方中所有体香香原料的蒸汽压总和,Z 为配方中所有基香香原料的蒸汽压总和。
g1(x)、g2(x)、g3(x)、g4(x)、g5(x)为上述模型的等式约束;g1(x)为香原料总数约束,x 中大于0的元素个数必须等于设定的香原料总数a。
g2(x)为香原料偏好约束,b=(b1,b2,…,bN)为N维香原料偏好向量,bi表示第i 个香原料的使用偏好,其取值为1.0、0.5 或0,分别表示该香原料为必用、可用或禁用状态;若bi=1.0,则相应的xi必须大于0;若bi=0,则相应的xi必须等于0。
g3(x)为香原料主体香韵约束,c=(c1,c2,…,cN)为N 维香原料主体香韵向量,ci表示第i 个香原料的主体香韵是否满足调香目标,其取值为1.0 或0,分别表示该香原料的主体香韵满足调香目标或不满足调香目标。
g4(x)为经验配方库约束,d=(d1,d2,…,dN)为N维香原料配方向量,di表示第i 个香原料的配方使用偏好,其取值为1.0、0.5 或0,分别表示该香原料为常用、不常用或禁用状态;若di=1.0,则相应的xi必须大于0;若bi=0,则相应的xi必须等于0。
g5(x)为和合修饰约束,d=(e1,e2,…,eN)为N 维香原料和合修饰向量,ei表示第i 个香原料的使用搭配情况,其取值为1.0、0.5 或0,分别表示该香原料为必用、可用或禁用状态;若ei=1.0,则相应的xi必须大于0;若bi=0,则相应的xi必须等于0。
h1(x)为模型的不等式约束,表示香精配方中天然香原料的数量/合成香原料的数量必须大于设定的比例f。
2.3 输出调香结果
使用随机数生成m 个配方作为初始种群,通过非支配集排序后对种群进行选择、交叉和变异3个遗传操作,得到第一代子代种群;将父代种群和子代种群合并进行非支配集排序,并计算每个非支配层的个体拥挤度,根据非支配关系以及个体的拥挤度选取合适的个体组成新的父代种群;通过选择、交叉、变异得到下一代种群。如此反复,直到循环次数达到预设值,最终得到的子代种群即为生成的配方结果。
3 调香算法的应用及评价
3.1 调香目标配方单生成
分别以花香和果香香精为设计目标。以花香目标为例,依次设定调香目标,种群中个体的数量m=20,形成配方的香原料数为17(不含溶剂),迭代计算次数为15,不限定香原料使用偏好,对天然香原料与合成香原料的数量不做约束,则模型求解及配方单生成过程如下:
①首先从344 种香原料中进行随机选择,形成20 个初始配方,作为初始种群,每个种群中的香原料数为17。
②根据相应的花香调香目标,对这20 个配方单,按照配方单中所含单体香原料的基本信息(包括香比强值、留香值、香品值、蒸汽压等)分别计算其f(x)值,并将得到的f(x)值由小到大进行排序,将20 个配方两两之间随机交换原料或改变某原料形成第一代子群,得到190 个配方,将这190 个配方和初始的20 个配方构成新的具有210 个配方的种群,计算其f(x)值并由小到大排序。
③对这210 个配方,计算两两之间的不同原料个数,根据个数的差异将其分成不同的层。在该例中可以分为差异数<2 个、差异数为3~4 个、差异数>5 个等3 个层次,从这3 个层次中再按每层的配方数量比例随机抽选共20 个配方单作为新的父代种群,开始下一轮计算。
④将15 次迭代计算后得到的配方单按f(x)值由小到大排序,第一个f(x)值最小的结果则为调香结果。
经过上述模型求解过程,最终分别输出花香香精和果香香精的数字化调香结果(表6~表7)。
表6 数字化调香花香香精配方单Tab.6 Formula of floral flavor obtained by digital flavoring
3.2 调香结果评价
分别按照表6 和表7 的数字化调香配方单调制小样,充分混合均匀并适当静置后,组织具有相应资质的评价人员以香韵轮廓法[16]分别对香精的嗅香及卷烟加香风格进行评价。嗅香感官评价结果(图2~图3)表明:数字化调香花香香精以花香(7.0 分)、甜香(5.0 分)为主体香韵,辅以清香(4.0分)和果香(3.0 分);数字化调香果香香精以果香(7.0 分)、甜香(5.5 分)为主体香韵,辅以花香(3.0分)和清香(2.0 分);两种数字化调香香精头香、体香和基香均较均衡,香气一致性和稳定性较好,留香持久,符合花香和果香香精要求。
表7 数字化调香果香香精配方单Tab.7 Formula of fruity flavor obtained by digital flavoring
图2 数字化调香花香香精嗅香评价结果Fig.2 Olfactory aroma evaluation result of floral flavor obtained by digital flavoring
图3 数字化调香果香香精嗅香评价结果Fig.3 Olfactory aroma evaluation result of fruity flavor obtained by digital flavoring
分别将上述两种数字化调香香精加入参比卷烟烟丝中,添加比例为0.15%,在恒温恒湿箱中存储6 h,再卷制成烟支供评吸。加香前后卷烟加香香气风格及品质特征评价结果(图4~图6)表明:加香前叶组整体香气风格较均衡,协调性好,香气丰富性较好,以烤烟烟香(8.1 分)、甜香(2.5 分)为主体香韵,辅以清香(2.0 分)和烘焙香(1.5 分);添加数字化调香花香香精后,烟气中花香(由0.1 分提高到2.5 分)、甜香(由2.5 分提高到3.3 分)和清香(由2.0 分提高到3.0 分)香韵有较大增强;添加数字化调香果香香精后,烟气中果香(由0.5 分提高到3.2 分)、甜香(由2.5 提高到3.5 分)和清香(由2.0 分提高到3.1 分)香韵也有较大幅度提升;添加两种香精后对烟气品质特征中的香气、丰富性、杂气和烟气浓度均有一定程度的改善,与叶组配方协调性较好,较为符合烟用香精的实际应用需求。
图4 数字化调香花香香精加香前后香气风格评价结果Fig.4 Flavor style evaluation result of cigarette smoke before and after adding floral flavor obtained by digital flavoring
图5 数字化调香果香香精加香前后香气风格评价结果Fig.5 Flavor style evaluation result of cigarette smoke before and after adding fruity flavor obtained by digital flavoring
图6 数字化调香香精加香前后品质特征评价结果Fig.6 Sensory quality evaluation results of cigarettes before and after adding flavors obtained by digital flavoring
由于初始种群为随机选取,因此在迭代不充分的情况下,输出的结果存在一定差异,但仍能保持一致的香韵目标。若希望得到具有一致性调香目标且不失个性的多个候选调香结果,可通过降低迭代次数来实现。例如,以花香为主体香韵目标,配方原料数量为16(不含溶剂),迭代次数设置为6 次。进行4 次数字化调香试验,并对得到的配方单中所用香原料的占比(以香原料的主体香韵为代表)进行比较。结果(表8)表明:4 次数字化调香输出结果中均带有分别以果香、花香、甜香、清香和烤烟烟香为主体香韵的香原料,其中第1次和第2 次输出结果中,所用具有相同主体香韵的原料数量完全一致;此外,4 次结果中共有的香原料数量为7 个,占单个配方原料数量比例为43.75%。可见,该数字化调香算法能输出与主体香韵目标一致的结果,其结果的差异可以增加配方的个性特征,为后续不同的卷烟加香需求提供更多选择。
表8 4 次数字化调香结果所用香原料的主体香韵占比Tab.8 Proportion of main flavors in four digital flavoring formulas (%)
4 结论
利用计算机算法和人工智能技术,结合调香理论及实践经验,通过引入基于NSGA-Ⅱ最优解的多目标最优化遗传算法,以所建立的344 种单体香原料描述信息库和30 组香精经验配方单为基础,建立了烟用香精数字化调香方法,并实现了烟用香精的数字化调香应用。通过数字化调香制备了花香香精和果香香精,配方评价结果表明,基于上述数字化调香方法得到的香精能够满足相应的调香目标要求。其中,数字化调香花香香精的嗅香以花香和甜香为主体香韵,加香后卷烟烟气中花香、甜香和清香香韵有较大改善;数字化调香果香香精的嗅香以果香、甜香为主体香韵,加香后能明显增强烟气中的果香、甜香和清香香韵;且两种香精均能较好地与叶组配方相协调,具有较强的实用性价值。同时,由于经验配方单数量的限制,调香结果准确度仍有待进一步提高,在主体香韵突出的前提下,对于辅助香韵的协调以及香原料用量仍需调香师进一步优化。