基于改进Apriori 算法的烟草生产控制系统设计
2023-09-25张建晓张林岗刘方
张 涛,张建晓,张林岗,刘方
(河南中烟工业有限责任公司 南阳卷烟厂,南阳 473000)
烟草生产企业在政策保护下,企业的经营思想较为落后、竞争意识不强、生产效率低、烟草质量较差[1-2]。为了使烟草生产企业能够得到精心管理,增强自身的运营能力和质量控制能力,提高经济效益,需要设计烟草生产制造控制系统。
目前相关领域学者针对烟草生产质量控制系统进行了研究。文献[3]设计基于RFID 的智能化烟草生产自动控制系统,采用RFID 技术对控制因子的重要性进行识别,利用控制指标的一致性,求出各指标之间相关权值,与烟草生产的自动化控制方法相结合,实现烟草生产自动化控制。该系统控制效果好,但需计算每个控制指标的相对权重,计算过程较复杂;文献[4]设计基于强化学习的烟草干燥过程控制优化系统,在PID 控制的基础上,利用强化学习法构建智能系统模型,以数据为中心调整系统策略。该系统可有效控制烟草含水量,但未考虑对用户权限进行管理,系统的安全性有待提升;文献[5]提出基于热分析图谱的卷烟纸质量稳定性评价与分析方法,依据烟草的不同质量,采用NRMSE方法对烟草卷纸的差异程度开展评价,根据评价结果得知烟草内各个材料之间的差异度,通过对比不同的差异度得到影响烟草质量的主要因素,进而完成对烟草的分析及评价,该方法获取的影响因素有限,评价性能有待提高。
为了解决上述方法中存在的问题,设计基于改进Apriori 算法的烟草生产控制系统。利用三维矩阵改进Apriori 算法,对数据集进行压缩,提升系统的整体性能;对初始数据实行预处理操作,提升数据处理能力;采用改进Apriori 算法构建关联规则,进行可信度计算,划分烟草生产控制等级,完成基于改进Apriori 算法的烟草生产控制系统设计。
1 烟草生产控制系统硬件设计
1.1 用户权限管理模块
设计烟草生产控制系统之前,首先要设计一个用户权限管理模块,用户进入系统前需要注册,注册后根据不同用户设立不同权限,再在系统内实行不同的操作,设计的用户权限管理模块如图1所示。
图1 用户权限管理模块设计Fig.1 Design of user rights management module
依据图1 可知,该功能模块可以对系统内部的权限实行管理和设置,不同的用户使用该系统时,系统就会自动给出不同的权限,根据不同的权限对应相应的操作流程,从而保障系统的安全性。
1.2 烟草生产制造数据管理模块
在整个烟草生产控制系统中,烟草生产制造数据管理模块是该系统模块设计的核心,主要具有2种功能,分别是对烟草生产制造数据的管理和用户基本信息的管理[6]。在用户权限管理模块的基础上,利用该模块对烟草生产数据及用户数据实行输入和管理。若烟草生产数据在此期间发生变动,管理员可以利用自身权限对数据库中的数据实行添加、删除等操作[7],设计的数据管理模块如图2 所示。
图2 数据管理模块设计Fig.2 Design of data management module
1.3 烟草生产制造质量检测模块
设定规范且标准的质量检测流程,以此确保检测烟草生产制造质量的可靠性和精准性,具体的检测设计图如图3 所示。
图3 烟草生产制造质量检测模块设计Fig.3 Design of quality inspection module for tobacco production and manufacturing
1.4 质量评价模块
完成烟草生产制造质量检测后,需要对其制造质量实行评价。为了能够更加精准地评价出烟草生产质量,在系统硬件中设计了质量评价模块,具体设计结果如图4 所示。
图4 质量评价模块设计Fig.4 Design of quality evaluation module
对质量评价前,首先要在数据库中对烟草生产制造质量数据实行筛选,根据筛选结果设立最小支持度值与最小置信度值。再利用改进Apriori 算法对数据库内的烟草生产制造质量数据的频繁项集开展挖掘,根据获取的数据关联规则,挖掘质量评价数据,实现质量评价。
2 基于改进Apriori 算法的烟草生产控制系统
2.1 基于三维矩阵的改进Apriori 算法
在烟草生产控制系统中有很多实际的项目,且各个项目内需要挖掘的数据有很多[8]。因改进Apirori算法可以通过一次性扫描数据集,达到对候选集Lk筛选的目的,具体过程如下所示:
设置烟草生产制造数据的元素体积为N,那么该元素的样本方差[9-10]就标记为δ2。k 为样本层级,假设在第k 层中包含Nk个烟草生产数据元素,那么各个烟草样本的样本均值为
依据式(1)抽取出大小为m 的烟草生产制造数据的随机均值方差,标记为,方程表达如下:
基于烟草生产制造数据随机样本方差,采用改进Apriori 算法挖掘烟草生产制造数据,具体挖掘流程如图5 所示。
基于改进Apriori 算法生成频繁序列的具体流程如下所示:
优先对烟草生产制造质量关联数据项集设置,标记为I={x1,x2,…,x8,y4,…,z1,z2,…,z8},而min_sup则为最小支持度阈值,烟草生产制造输出数据I 中的频繁序列标记为L。
(1)对烟草生产制造数据项集实行分块处理,通过三维矩阵直接获得频繁数据集;
(2)根据得到的频繁数据集,对划分后的数据集开展扫描,从中取得烟草生产制造数据频繁项集集合D 及其支持度;并对D 内的频繁项开展支持度排序,且排序的顺序为降序,排序结果为{L1,L2,…,Ln};
(3)集合全部频繁项集,对其展开扫描,删除关联性小的数据,对数据库进行精简后,构成候选频繁项集L,并从中寻找相应的关联规则,提高频繁项集的生成速度,为快速挖掘烟草生产制造数据奠定基础。
2.2 基于改进Apriori 的控制系统技术应用
依据Sup 最小支持度,采用改进Apriori 算法自动生成一个烟草生产制造的频繁项目集,再通过最小置信度直接形成一个挖掘关联规则,把获取的烟草生产制造质量数据挖掘结果录入到表格内,通过表格显示出来,并生成数据报表。那么设计的改进Apriori 算法的数据挖掘具体工作流程如图6 所示。
图6 数据挖掘工作流程Fig.6 Data mining work flow chart
2.3 基于改进Apriori 算法的烟草生产控制
通过上述改进Apriori 算法挖掘流程,依据烟草生产质量评价管理研究成果,设置烟草中的总糖、总碱、糖碱比、氯、钾5 种指标用作评价因子,而烟草初始化数据集为X={x1,x2,…,xn},x⊂N 关联数据集为I={x1,x2,…,x5,y4,…,z1,z2,…,z5},特征向量为Y={y1,y2,…,yn},质量评价结果集为Z={z1,z2,…,zn},依据构建的关联规则,对烟草生产制造质量进行可信度计算,将质量评价划分成3 个等级,I 级单位代表最优质量,变量为Y1;II 级单位表示较优质量,变量为Y2;III 级单位表示较差质量,变量为Y3。通过改进Apriori 算法获取烟草生产制造质量在不同支持度下的评价原则,将其划分成不同的子集,以此对烟草生产制造质量样本数据实行评价,完成基于改进Apriori 算法的烟草生产控制系统设计。
3 仿真与分析
在Oracle 数据库中选取500 个数据作为仿真数据,利用改进的Apriori 算法,对数据进行预处理。经过一次性扫描获取烟草数据的频繁项集,寻找对应的关联规则,完成数据挖掘。采用改进Apriori 算法为方法1;文献[3]中基于RFID 方法为方法2;文献[4]中基于强化学习的方法为方法3,然后实行对比测试。
3.1 还原糖和总碱平均值对比测试
烟草生产制造过程中,它的化学成分对烟草的生产制造质量产生重要影响,其中,总糖、还原糖等指标与生产制造质量之间有着较强的相关性。为了能够有效地验证烟草化学成分与烟草生产制造质量之间的评价关系,选取总糖、总碱用作本次指标。
与上述指标相对应的评价函数分别表示为
式中:AS为平均值得分;A 为多次检测后的算术平均值;AC为中心值;AV为阈值;e 为评价函数。
根据上述方程表达式,分别对还原糖与总碱的最佳范围设定,再采用方法1、方法2 和方法3 获取烟草还原糖及总碱的平均值,以此确认该方法的烟草成分是否处于最佳范围内。若该方法的最终平均值在设定范围内,说明该方法的质量评价效果强,反之则差。具体测试结果如图7 所示。
图7 不同指标的平均值对比测试Fig.7 Comparison test of average values of different indicators
通过图7(a)中的数据发现,还原糖的最佳取值范围在1.5~2.5 之间。从整体可以看出,随着还原糖单位质量的不断增加,方法1 的平均值在1.6~2.1之间,在设定的最佳范围内,与方法1 相反的是,方法2 和方法3 的平均值范围分别为1.0~3.1 和1.3~2.6,在测试期间的平均值忽高忽低,且在每项测试中均不处于最佳范围内,由此可以看出方法1 的还原糖平均值最佳,也验证了方法1 不会给烟草生产制造质量带来影响。
分析图7(b)中的数据发现,设置总碱的最佳范围在2~3.5 之间,随着总碱质量的增长,3 种方法的平均值都呈现出上升趋势,方法1 烟草指标的平均值都处于最佳范围内,这主要是因为方法1 设计了烟草生产质量检测模块,该模块将烟草材料划分成不同的种类对其实行检测,使烟草材料都在最佳范围,不会给烟草生产制造质量带来影响,以此提升了系统的可靠性及检测精度。
3.2 烟草质量评价测试
根据上述取得的烟草指标平均值,建立烟草质量评价方法,用方程表达式定义为
式中:Vi为指标一致性得分;V 为检测标准偏差;VC为调整系数。
利用式(5)对3 种方法的烟草样本数据实行计算,从中获取3 种方法的烟草质量评价得分,利用获取的得分与实际得分对比,以此验证3 种方法的烟草质量评价效果,具体测试结果如图8 所示。
图8 三种方法的烟草质量得分与实际值对比测试Fig.8 Comparison test of tobacco quality scores and actual values using three methods
从图8 中可以看出,3 种方法与实际评价得分之间的运动轨迹都存在一定的距离,但方法1 与实际值之间的距离最小,得分在80 分以上,同时方法1 的评价得分与实际值最贴近,而方法2 和方法3的评价得分范围分别为40~55 分和50~65 分,两种方法评价得分均与实际值相差较大。因为方法1 采用改进Apriori 算法,根据烟草生产制造的频繁项目集,形成挖掘关联规则后进行可信度计算,提高了烟草生产制造效果。
4 结语
针对烟草生产控制系统设计方法存在的问题,设计了基于改进Apriori 算法的烟草生产控制系统。首先设计了系统硬件模块,再利用改进Apriori 算法,挖掘烟草生产质量数据,以此实现烟草生产控制系统的整体设计。在仿真测试中,设计系统的还原糖、总碱平均值均在最佳范围内,烟草质量得分与实际值相差最小,证明设计系统的烟草生产制造效果最好。