大数据分位数算法在实现烟草行业降本增效的有效性初探
2017-05-17李达许仁杰袁鹏李晓科葛
李达++许仁杰++袁鹏+++李晓科++葛文++陈珍
摘要:本文紧扣行业当前的重点,以大数据分位数算法为切入点,分析行业制丝部门对应的过程物耗损耗情况,旨在建立一套标准,将物耗管控通过大数据的手段从结果导向转换为目标引领、过程管控、结果导向三者相结合的物耗信息化管控闭环,进而系统实现“降本增效”的战略目标。
关键词:大数据;分位数预测;降本增效;物耗控制
中图分类号:F279.23 文献标识码:A 文章编号:1007-9416(2017)03-0149-04
1 大数据分位数算法对于烟草行业降本增效的有效性分析
当前,从行业看,受宏观经济曲折复苏和烟草消费环境日益趋紧的影响,行业层面增长速度回落、工商库存增加、结构空间变窄、需求拐点逼近“四大难题”进一步凸显[1],[2],[3];卷烟销量下滑、生产成本上升、商业利润透支“三个严峻形势”进一步加剧。[4]从云南中烟看,传统发展动能有所减弱,新的发展动能不强,品牌竞争力不突出,市场拓展更加艰难。从集团看,面临着优质制造、快速响应、内部挖潜、争先进位的巨大压力和挑战。
本文通过将大数据分位数算法在烟草行业制丝运用的计算公式、技术实现思路、技术实施路径、算法实现过程、实施成果等内容进行系统的阐述,证明了大数据分位数算法对于烟草行业降本增效的有效性。
2 大数据分位數算法实现过程
2.1 大数据分位数算法95%置信区间计算公式
其中,Pm——第m百分位数;L——Pm所在组的组实下限;U——Pm所在组的组实上限;f——Pm所在组的次数;Fb——小于L的累积次数;Fa——大于U的累积次数。
根据分位数计算公式,可得95%置信区间的取值范围,如图1所示,95%置信区间表示如下内容:(1)每批次物耗不在置信区间范围内的可能性仅为5%,为小概率事件,当出现时则表示物耗异常。(2)大数据分位数置信区间预测无需样本数据满足正态性,这与传统数理统计对于样本符合正态性的依赖相比,具有较高的实用性。特别是烟草行业工业现场数据均为非正态数据,大数据分位数置信区间预测有效解决了传统数理统计对于工业现场数据存在回归拟合度差的问题,能够有效挖掘工业现场数据带来的价值。[7]
2.2 大数据分位数算法技术实现思路
以大数据分位数算法为切入点,运用至烟草过程工序物耗分析,可得如图2的概率密度图。
在生产过程中,对收集的每一批次成本控制实时数据进行统计、即时化分析,计算出丝率(Z)。若Z1≤Z≤Z2,则表明成本控制处于正常范围,无需特殊控制;若Z≤Z1,则表明成本控制出现异常,需要进行人工干预;若Z≥Z2,则表明成本控制效果较好,应检查数据采集、记录、统计等环节无误后,分析导致成本下降的原因,总结经验应用于后续生产中。
2.3 大数据分位数算法技术路径(图3)
技术实施路径描述如下:首先,计算各生产点投入物料重量和产出物料重量,判断工序投入和产出的物料是否处于同一含水率标准情况下;若含水率一致,则进行工序投入产出比计算。若含水率不一致,则针对投入物料对应的含水率和产出物料对应的含水率分别进行统一标准的物料衡算(12%),衡算结束后再得出对应的工序投入产出比;其次,分品牌、分工序、分时段定出对应的大数据分位数预测区间;最后,将大数据分位数预测结果运用于日常物耗分析控制中,加载机器自学习机制,如果没有超过机器自学习周期,则该标准一直有用,如果超过了机器自学习周期,就要重新进行投入产出比计算,得出新的分位数预测区间,再用于日常物耗分析控制中。
2.3 基于R语言实现的大数据物耗管控分位数预测算法实现过程
(1)绘制流量指标折线图、求水分值均值、求累计量最大值R程序(图4)。
(2)水分折算及结果导出R程序(图5)。
(3)运用大数据分位数预测诊断算法,得出投入产出矩阵后,绘制图形R程序(图6)。
3 大数据分位数预测对于烟草行业制丝部门的实施实例
3.1 测试对象
以云南中烟红云红河集团曲靖卷烟厂为测试对策,以云烟(紫)2016年8月30日至9月18日生产云烟(紫)模组1的全部数据作为测试对象,共计133个批次。
3.2 测试方法
以大数据分析的方法基础,运用分位数预测的方法,得出各生产段对应的投入产出比合理范围,将该范围纳入过程分析管控,实现物耗分析的过程化管控标准,帮助生产厂提升物耗控制水平。
3.2.1 物耗计算需采集的数采点(表1)
3.2.2 物耗衡算公式
备注:物料衡算均已各段以12%的水分作为标准进行衡算。
3.2.3 各段投入产出比计算公式
备注(物料衡算):一级加料前物料累积量以一级加料入口水分进行折算,松散回潮物料累积量以松散回潮入口水分进行折算。
备注(物料衡算):二级加料前物料累积量(物料、糖料)以二级加料入口水分进行折算,一级加料物料累积量以一级加料入口水分进行折算。
备注(物料衡算):切丝前物料累积量(物料、糖料)以切丝入口水分进行折算,二级加料物料累积量以二级加料入口水分进行折算。
备注(物料衡算):烘丝前物料累积量以烘丝入口水分进行折算,切丝物料累积量以切丝入口水分进行折算。
备注(物料衡算):薄板丝物料累积量以烘丝冷却水分进行折算,烘丝前物料累计量以烘丝入口水分进行折算。
备注(物料衡算):加香前物料累积量、掺配物料累积量(气流丝、薄板丝、梗丝、回丝)均以烘丝冷却水分进行折算。
备注(物料衡算):装箱量累积量(物料、香料)以加香后水分进行折算,加香前物料累积量以烘丝冷却水分进行折算。
3.3 大数据分位数置信区间预测成果
3.3.1 松散回潮投入产出比(图7)
经大数据分位数预测,松散回潮投入产出比95%预测区间为【98.29%,99.46%】。
3.3.2 一级加料投入产出比(图8)
经大数据分位数预测,一级加料投入产出比95%预测区间为【98.98%,99.92%】。
3.3.3 二级加料投入产出比(图9)
经大数据分位数预测,二级加料投入产出比95%预测区间为【96.88%,99.71%】。
3.3.4 切丝投入产出比(图10)
经大数据分位数预测,切丝投入产出比95%预测区间为【96.88%,99.71%】。
3.3.5 烘丝投入产出比(图11)
经大数据分位数预测,烘丝投入产出比95%预测区间为【99.22%,99.92%】。
3.3.6 掺配投入产出比(图12)
经大数据分位数预测,掺配投入产出比95%预测区间为【98.51%,99.18%】。
3.3.7 加香投入产出比(图13)
经大数据分位数预测,加香投入产出比95%预测区间为【96.29%,99.81%】。
4 大数据分位数预测算法在烟草行业降本增效的前景分析
通过以曲靖卷烟厂作为试点,全面展示了大数据分位数算法在烟草行业制丝车间如何实现降本增效的全过程,即建立各工序投入产出比的预测置信区间,将该区间作为衡量过程物耗控制水平是否异常的标准,进而快速、高效地挖掘出过程物耗异常的改善点,进而快速实施改善,确保物耗控制水平维持在一个较高的层面,为全面实现降本增效打下坚实基础[5],[6]。
需要指出的是,通过大数据分位数预测算法建立的投入产出比置信区间是一个动态更新的过程,即需要加載机器自学习算法,在学习周期内,无需进行自学习运算[7]。当超过自学习周期,就需要重新运算,得出新的工序投入产出比置信区间[8],进而不断符合生产的实际情况,持续发挥出数据挖掘带来的价值,为行业全面实现降本增效提供了一套有效的发展之路。
参考文献
[1]朱芸.新形势对烟草行业的影响及应对策略研究[J].改革与开放,2015(07).
[2]张谦,胡剑波.新形势下云南烟草经济发展的SWOT分析与对策[J].安徽农业科学,2011(06).
[3]俞震东.中国烟草业的困境及改革路径研究[D].浙江工业大学,2014.
[4]陈建辉.顺势而为,主动作为——卷烟提税顺价对烟草商业经营影响分析及思考[M].2015.
[5]孟艳超.夯实烟草行业降本增效工作之思路[J].企业研究,2016(04).
[6]严厚平.浅析烟草企业如何实现降本增效[J]. 财经界(学术版),2016(10).
[7]何清,李宁,罗文娟,史忠植.大数据下的机器学习算法综述[J].模式识别与人工智能,2014(04).
[8]郭亚宁,冯莎莎. 机器学习理论研究[J].中国科技信息,2010(04).