基于MINE 算法的烤烟含氮化合物与HCN 关系分析
2015-07-15薛宝燕郭东锋邵伏文刘炎红郭建裴洲洋
薛宝燕,郭东锋,邵伏文,刘炎红,郭建,裴洲洋
(1.安徽省烟草专卖局(公司)烟叶管理处,安徽 合肥 230022;2.安徽中烟工业有限责任公司技术中心,安徽 合肥230088;3.安徽皖南烟叶有限责任公司,安徽 宣城 242000)
大量研究表明,卷烟主流烟气中的氢氰酸是烟叶中含氮化合物通过燃烧裂解产生的[1–3],氢氰酸的释放受到烟叶原料产地、部位、年份等[4–5]的影响,卷烟的温度平衡时间[6]、辅材[7]、配方打叶[8]、工艺参数[9]、化学添加剂[10–11]、抽吸方式[12]等对氢氰酸的释放也有较大影响,所以,氢氰酸释放量的大小复杂而多变。围绕主流烟气释放研究,运用统计学、数据挖掘或机器学习等手段[13–14]研究了焦油、氢氰酸、一氧化碳等烟气成分。MINE (maximal information-based nonparametric exploration)是2011年由David N. Reshef 等[15]研究开发的一种探索连续型变量间关系的新算法,目前在烟草科研中鲜有应用。笔者拟以氢氰酸与烟叶中主要含氮化合物的关系疏密为研究对象,运用MINE 算法探索氢氰酸与含氮化合物之间的关系,以期为卷烟“减害降焦”提供技术参考。
1 材料与方法
1.1 材料
选取2012年度贵州(兴义、贵阳),辽宁凤城,云南(大理、石林、玉溪),江西赣州,陕西(商洛、安康),湖南(凤凰、桂阳、宁乡),河南(宜阳、三门峡),广西百色,湖北宜昌,安徽宣城,重庆黔江濯水,福建南平,四川凉山烟区的B2F、C3F、X2F共计60个样品,采用统一辅材进行单料烟的卷制。
1.2 检测方法
1.2.1 烟气氢氰酸检测
按照YC/T 403—2011 测定烟样氢氰酸。
1.2.2 烟叶化学成分的测定
氨基酸含量的测定按照YC/T 282—2009 进行; 总氮及烟碱的测定按照YC/T 160—2002 和YC/T 161—2002 进行;烟叶硝酸根离子和蛋白质含量测定分别参照文献[16]和[17]方法进行。
1.3 数据处理方法
数据整理在Microsoft Excel 中进行,统计分析及作图在R3.1 开源软件平台进行。采用拉依达(PauTa)准则(3σ 准则)对数据进行清洗整理,对整理后出现的缺失值采取KNN(最近邻法)进行补缺。HCN 与含氮化合物间相关分析采用皮尔逊(Pearson)相关分析法。MINE 算法在R3.1 开源软件平台实现。
2 结果与分析
对烟叶中氢氰酸以及主要含氮化合物和氨基酸含量的统计描述列于表1。氢氰酸含量变幅为154~316mg/支,数据形态呈现出右偏态尖顶峰,变异系数达16.43%,数据分布较为离散;烟叶中硝酸根离子变异系数为52.10%,变异较大,数据形态呈现出右偏态平顶峰,变幅在0.004 8%~0.068 2%,数据分布离散较大;烟叶中总氮和蛋白质变异系数均在15%以下,总氮变幅在1.14%~2.09%,蛋白质变幅在3.74%~6.49%,数据分布相对集中;烟碱含量变异系数33.70%,变幅在1.13%~3.94%,数据呈现出右偏态平顶峰,数据分布较为离散;氨基酸含量变异广泛,除亮氨酸变异系数为19.17%外,其余氨基酸变异系数均超过了20%,其中苏氨酸、谷氨酸、丙氨酸、缬氨酸、蛋氨酸、色氨酸、赖氨酸、脯氨酸和氨基酸总量变异在20%~50%,而天冬氨酸、甘氨酸、半胱氨酸、异亮氨酸、络氨酸、苯丙氨酸、组氨酸和精氨酸变异系数均超过了50%,氨基酸含量在烟叶中存在较大变异,数据离散程度较高。
表1 烤烟烟叶氢氰酸与含氮化合物含量统计描述 Table 1 Statistical description for HCN yields and contents of nitrogen compositions of flue-cured tobacco leaf
表1 (续)
对氢氰酸与主要含氮化合物及氨基酸总量进行简单相关分析,结果见图1。氢氰酸与烟叶中总氮、烟碱、蛋白质、氨基酸总含量呈显著正相关,与氮碱比呈显著负相关。图2 表明,氢氰酸释放量与丙氨酸、半胱氨酸、络氨酸、组氨酸、色氨酸和精氨酸呈显著正相关。说明氢氰酸释放不仅与含氮化合物总量相关,而且与含氮化合物的种类也存在密切关系。
由于相关分析只能简单描绘2个变量间关系的疏密程度,并能严格定义变量间的因果逻辑关系,因此,为了进一步探讨氢氰酸与烟叶中含氮化合物的关系,采取MINE 算法对2组变量间的关系进一步探索。
图1 氢氰酸与主要含氮化合物相关分析矩阵 Fig.1 Scatterplot matrix between HCN and main nitrogen compositions
图2 氢氰酸与氨基酸相关分析矩阵 Fig.2 Scatterplot matrix between HCN and amino acids in flue-cured tobacco
MINE 算法作为近年来新开发的应用于研究连续型变量关系的算法,其主要评价指标MIC 具有广泛性和较强的抗干扰能力,可以遍历探索2个连续变量间的关系,且不局限于线性关系,还可以探索非线性关系,甚至是多重函数叠加的复杂关系[15,18]。
为了进一步考察氢氰酸释放量与烟叶中含氮化合物的亲疏关系,在R 开源软件平台对氢氰酸与含氮化合物之间的关系进行了分析,结果见表2。从MINE 信息提取结果MIC 指标(反映HCN 和含氮化合物之间关系强弱[15])来看,总氮/烟碱与HCN 关系达0.001 显著水平,关系最为密切;其次为总氮、烟碱、蛋白质,均达到0.05 显著水平;与HCN 关系密切的氨基酸包括半胱氨酸、精氨酸以及谷氨酸,其他氨基酸与HCN 关系亲疏程度不同,但是并未达到显著水平(在样本容量n=60 条件下)。可以看出,HCN 主要与烟叶中的总氮、烟碱、蛋白质以及氨基酸(半胱氨酸、谷氨酸、精氨酸)关系最为密切。
烟叶中的总氮、蛋白质是HCN 生成的主要来源。本研究结果表明,HCN 与烟叶常规化学成分中总氮、烟碱存在显著的关系,这与黄朝章等[19]的研究结论一致。总氮包含成分多,从具体含氮化合物单体来看,烟碱对HCN 的形成有直接影响,氨基酸中的半胱氨酸、谷氨酸、精氨酸对烟气成分中的HCN 有直接作用;王晶等[17]研究认为,所有碱性氨基酸和杂环氨基酸都与氢氰酸呈显著正相关,所有酸性氨基酸与氢氰酸都没有显著相关性,同时还认为对烟草主流烟气中氢氰酸释放量起主要作用的氨基酸依次是苯丙氨酸、色氨酸、组氨酸、丙氨酸、脯氨酸和丝氨酸,这与本研究结论有一定差异。这可能是对于数据分析所采用的方法不同所致,另一方面笔者倾向于认为相关关系仅能表达变量间关系疏密,但是从逻辑推演上来看,因果逻辑关系尚需要回归等参数或非参数方法支撑。由于烟叶中含氮化合物种类、含量的差异性,以及受数据分布形态、统计方法的运用等影响,针对含氮化合物单体的研究也不排除其他研究结果或结论的可靠性。
表2 基于MINE 算法的氢氰酸与含氮化合物关系信息提取 Table 2 Extracted information for the relationship between HCN and nitrogen compositions based on MINE algorithm
3 小结与讨论
氢氰酸是卷烟烟气中7 种有害成分之一,对卷烟的危害性指数有着重要的影响。对氢氰酸和烟叶中主要含氮化合物的相关分析表明,主流烟气中的氢氰酸与烟叶中的总氮、烟碱、蛋白质、氨基酸总含量以及游离氨基酸中的丙氨酸、半胱氨酸、络氨酸、组氨酸、色氨酸和精氨酸呈显著正相关关系,与氮碱比呈显著负相关关系。运用MINE 算法考察氢氰酸与主要含氮化合物的关系表明,氢氰酸与总氮、烟碱、蛋白质以及氨基酸关系最为密切。
综合分析认为,烟气中氢氰酸的释放量与烟叶中的总氮关系最为密切,同时氢氰酸的释放还与蛋白质、游离氨基酸中的特定氨基酸(总量、半胱氨酸、谷氨酸、精氨酸)高度相关,与郑宏伟等[20]研究天门冬氨酸的裂解行为结论有相似之处。
由于氢氰酸是卷烟在700~1 000℃燃烧时产生的,而卷烟燃烧又受辅材、配方、燃烧状态等的影响,烟叶中的含氮化合物还包括叶绿素、TSNAs、氨、酰胺等重要化合物,对这些化合物还需要进一步跟踪检测。MINE 算法虽可以得出氢氰酸与含氮化合物的关系亲疏,但是其具体函数或非函数关系需要进一步探索研究,由于本研究所用方法为机器学习MINE 算法,与传统线性分析略有不同,因此,该方法的进一步拓展应用尚需要更深入的实践和研究。
[1] 谢剑平,刘惠民,朱茂祥.卷烟烟气危害性指数研究[J].烟草科技,2009(2):5–15.
[2] 谢剑平.CORESTA 热点研究问题[J].中国烟草学报,2006,12(1):13–16.
[3] 王彦亭,谢剑平,张虹,等.降低卷烟烟气中有害成分的技术研究及应用[J].中国烟草学报,2003,9(3):3–9.
[4] 王涛,鲍峰伟,王刘胜,等.卷烟主流烟气七种有害成分释放量与烟叶产地、年份之间的关系[J].湖北农业科学,2014(6):1330–1333.
[5] 陈敏,郭吉兆,郑赛晶,等.烟叶部位、产地与卷烟主流烟气7 种有害成分释放量关系研究[J].中国烟草学报,2012,18(5):16–22.
[6] 许永,张霞,刘巍,等.温湿度平衡时间对卷烟主流烟气氢氰酸释放量影响的研究[J].应用化工,2012(7):1140–1142.
[7] 曾万怡,向能军,龚为民,等.纸质滤嘴棒对卷烟主流烟气中有害物质的影响[J].中国造纸,2014(6):35–39.
[8] 赵乐,彭斌,于川芳,等.辅助材料设计参数对卷烟7种烟气有害成分释放量的影响[J].烟草科技,2012(10):46–50.
[9] 陈昆燕,冯广林,李东亮,等.打叶复烤各工序对卷烟主流烟气氢氰酸与苯并[a]芘和巴豆醛释放量的影响[J].湖南农业大学学报:自然科学版,2014,40(2):144–147.
[10] 者为,廖头根,王明锋,等.均苯三甲酸合铜选择性降低卷烟主流烟气中的HCN[J].烟草科技,2014(10):45–48.
[11] 周宛虹,孙文梁,王律,等.胺基修饰的介孔二氧化硅选择性降低卷烟烟气中的氢氰酸[J].烟草科技,2013(4):42–45.
[12] 许永,张霞,刘巍,等.抽吸方式对卷烟主流烟气中氢氰酸释放量的影响[J].中国烟草学报,2011,17(6):4–7.
[13] 王浩军,郭东锋,杜丛中,等.基于关联规则的皖南焦甜香烟叶外观特征分析[J].中国烟草科学,2014,35(5):93–97.
[14] 侯小东,杜咏梅,刘新民,等.分类树模型在烟草农业研究中的应用[J].中国烟草科学,2012,33(5):93–96.
[15] Reshef D,Reshef A,FinucaneK,et al.Detecting novel associations in large data sets[J].Science,2011,334:1518–1524.
[16] 许自成,张莉,肖汉乾,等.烤烟硝酸盐、亚硝酸盐含量与若干品质指标的典型相关分析[J].郑州轻工业学院学报,2005(1):43–46.
[17] 王晶,胡立中,朱栋梁,等.烟叶中游离态氨基酸与卷烟主流烟气中氢氰酸的相关关系[J].光谱实验室,2012(6):3793–3797.
[18] 拉罗斯.数据挖掘方法与模型[M].刘燕权,等,译.北京:高等教育出版社,2011:116–180.
[19] 黄朝章,蔡国华,赵艺强,等.单料烟主流烟气HCN与烟叶常规化学成分的相关性[J].烟草科技,2013(2):62–64.
[20] 郑宏伟,刘新建,崔伟,等.天门冬氨酸热裂解行为对卷烟烟气成分的影响[J].湖北农业科学,2014(9):2149–2152.