农业企业集团大数据分析云平台设计及应用
2018-07-10李凤利郑国清燕照玲
范 磊,李凤利,郑国清,刘 霞,燕照玲,赵 博*,高 方,黄 保
(1.河南省农业科学院,河南 郑州 450002; 2.河南农科牧业有限公司,河南 新乡 453000; 3.确山县留庄镇农业服务中心,河南 确山 463000)
随着社会主义市场经济的发展,国内一部分早期发展壮大的农业类企业伴随着产业链条拉长,逐步演变为农业企业集团,原来以行政体制管理的农业类经济体,也有一部分转制成了农业企业集团。农业企业集团的特点是普遍附属有繁育基地、加工中心、科研中心等机构,下属机构和管理级次较多,地域分布一般广泛或分散[1-2]。机构复杂以及物理距离的分散,增加了集团化管理的难度,降低了管理效率,为了在市场经济环境下健康快速发展,现代农业企业集团需要运用现代农业科技、信息技术、物联网等,建立现代企业管理模式,充分享受企业规模化的红利,防止因规模扩大带来管理效率的降低。目前,在农业企业集团的管理中,普遍存在信息收集效率低、人为影响大、生产经营管理手段相对落后、科学化支持决策的能力弱等问题,为了提高农业企业集团管理质量和管理效率,需要将信息化建设作为重要辅助手段。为此,以物联网技术为依托,利用高效的信息采集、挖掘、处理、输入输出等技术,充分考虑农业企业集团从事业务的特殊性,构建了包含数据采集系统、云数据、云计算的大数据分析云平台构架。数据采集系统利用多种传感器、智能终端直接采集农业生产中的温度、湿度、光照等信息,实时自动收集监测数据,提高了一线生产信息收集效率,减少了不必要的人为干预[3-5]。数据经无线(或有线)传导输入大数据分析云平台,针对具体业务需求,启用云计算中内置算法和丰富的分析模型进行计算处理,将结果输出至应用层及终端,在企业管理多个环节提供智能化识别、定位、跟踪、监控和管理帮助[6],提高了数据处理分析的效率和能力、生产经营管理质量、管理决策科学化水平[7-8]。通过对大数据云平台的科学设计及合理应用,旨在为不断优化整合企业集团的信息、人力、资源及工序,促进整个集团的集成协同[9-11],提高企业智慧管理水平提供技术支撑。
1 整体架构
结合农业企业集团特点,融合物联网、通信、数据库、计算机等技术,对企业生产经营管理流程、经济及人力要素流动进行梳理,以大数据计算分析结果为依据,将各系统模块紧密集成,深入业务流程,着眼于辅助优化企业管理、支撑决策,提出农业企业集团信息化建设总体设计方案,见图1。
图1 农业企业集团信息化建设总体设计
1.1 大数据分析云平台
大数据分析云平台相当于一台电脑的CPU系统,是中央控制器,整个信息化系统的核心,负责整个系统的计算、分析,指挥着整个系统有条不紊地运行,由云数据、云计算组成,其中,云数据采用分布式数据处理方式,以更好地处理多源异构数据,云计算由基础运算层和面向实际应用的分析模型库组成。大数据分析云平台对采集到的信息进行处理、存储,通过数据挖掘提取有效信息,利用设计的算法或计算模型对终端提交的查询、计算及分析请求进行处理,并将结果发送至应用层或终端,实现智能控制和调度。
1.2 信息采集系统
从采集农作物的种子选取、生长、施药施肥及采摘各个阶段的信息开始,广泛收集生产经营相关的历史数据和现时数据。具体来说,可利用土壤养分测试仪、土壤温度传感器、土壤水分传感器、光照度测试仪及农作物反射波谱接收器等设备采集农作物的生长信息、所处环境信息及人工干预信息;可利用气体传感器、GPS等设备采集仓储及物流信息;可利用监控摄像机、二维码打印设备等采集加工及储存信息;可利用智能终端、互联网等采集传输企业管理中的各项财务、人力资源及市场经营信息。
1.3 应用分析层
应用分析层针对具体应用,利用云平台的分析计算结果,处理应用层及终端的请求,提供生产经营管理、办公管理、财务管理、人力资源管理及决策支持。
1.4 应用层
根据管理系统的设置及平台的计算分析,输出相应结果或执行相应的指令,应用于生产活动、经营活动、财务控制、投融资活动、人力资源控制、风险控制及决策支持,实现企业生产经营信息化管理。
1.5 终端
终端用于向物联网云平台发送请求,也执行云平台发送的指令。
2 大数据分析云平台设计
大数据分析云平台采用SOA(Service-oriented architecture,面向服务的架构)理念设计开发[12-13],包括云计算、云数据。云数据首先对接收到的多源异构数据进行数据清洗及数据整合,可采取基于Hadoop架构的分布式数据处理方式[14],方便海量数据的转换、存储及读取,使处理后的数据可在整个系统中共享和交互;云计算包括基础运算层和分析模型库,基础运算层提供模糊控制算法、二维向量空间模型、专家经验智能控制模型等,分析模型库面向实际应用开发,主要包含生产经营管理分析模型、财务分析模型、市场分析模型等,见图2。
图2 大数据分析云平台设计及应用
2.1 大数据分析平台工作原理
对信息采集系统输入的信息进行清洗、提取、存储,接收终端发送的请求,调用内部模型或算法计算得出结果,对调用的各模型的计算结果对比分析,根据各计算结果的权重,综合计算得出最终结果,输出应用。以下为技术实现:
识别终端发送的请求Ri(i=1,2,……,i),利用模型Mj(j=1,2,……,j)进行计算,并得出计算结果Vij(i=1,2,……i;j=1,2,……,j),根据终端发送的请求Ri及模型Mj,基于专家经验打分的Delphil法建立权重集合V,并从权重集合V中调取权重Wij,其中,V={Wij|Wij=f(Mj,Ri)},最后利用每个计算结果的加权值之和得出计算结果,即:
∑(Vij×Wij)
(1)
其中,模型Mj(j=1,2,……,j)来自分析模型库中的模型。
大数据分析云平台中核心运行器均采用双机主备冗余系统,当主运行器件处于工作状态时,备运行器处于热备状态,主运行器将工作中的通信数据实时备份到备运行器,在主运行器出现故障时,处于热备状态的备运行器立即激活,接替主运行器进入工作状态,同时发回启动信号,保证核心系统的正常运行。
2.2 分析模型库设计
根据整个集团产业链长、上下游数据丰富等特点[15-16],对汇集的信息流进行汇总、筛选和计算分析,综合利用集团内各子公司的成本、市场、经营环境等的历史数据和现势数据,构建包含生产、销售分析模型,客户、市场分析模型,财务分析模型,战略分析模型的分析模型库。大数据分析云平台根据终端请求,启动相应分析模型计算,综合后得出分析结果,可对企业生产经营走势、产业链支持变化、财务、客户购物习惯及趋势、市场运营趋势及企业运营战略进行分析,形成数据或报告。
2.3 基础运算层的技术实现
信息化系统建设运行初期,云计算中的底层算法及模型主要基于模糊控制算法、二维向量空间模型及专家经验的智能控制模型,根据功能的不断扩展,可不断增加新的模型或算法。
2.3.1模糊控制算法农作物生长涉及的环境因素多,是一种惯性、非线性系统,难以用精确的数学模型进行控制,因此,可以采用模糊控制算法来解决,这样可以把丰富的农作物生长控制经验,转换为用计算机可以实现的控制规则,技术实现如下。
将信息采集系统采集到的实际信息记为V测,同时将标准信息记为V标准,则实际信息与标准信息的偏差为e,
e=V测-V标准
(2)
根据偏差e,计算偏差变化率
(3)
其中,ec表示偏差变化率,下标c仅为区分作用,并非变量,e1表示本次采样的偏差,e2表示上次采样的误差,T表示采样间隔时间。
定义系统的输出量为u,偏差值e的模糊子集为Ai,i=1,2,……,i,偏差变化率ec的模糊子集为Bj,j=1,2,……,j,输出量u的模糊子集为Cij,根据模糊控制算法建立规则:
IFe=AiANDec=Bj,THENu=Cij
(4)
根据(4),建立各个参数之间的模糊关系
Rh=Ai×Bj×Cij
(5)
以及总模糊关系
(6)
其中,h表示模糊规则的个数,h=1,2,……,h,最后利用上述模糊关系和模糊规则,计算输出控制量:
Vij=(Ai×Bj)·R
(7)
其中,Ai表示偏差值e的模糊子集,i=1,2,……,i,Bj表示偏差变化率ec的模糊子集,j=1,2,……,j,R表示总模糊关系。
大数据分析云平台根据输出控制量Vij对相关设备发送指令,触动操作,实施智能控制。
2.3.2二维向量空间模型在对农业生产控制领域的搜索及反馈信息应用中,关键词的出现频率、出现位置、权重等与一般开放领域的搜索规则有所不同,针对农业生产技术文档特点,将单个文档分解为专业特征词和普通特征词2个向量,进一步考虑行业生产实际,综合计算专业特征权重和普通特征权重,输出搜索结果,技术实现如下。
(8)
其中,TF表示词频,IDF表示反词频,fk表示特征词Tk在词条di中出现的次数,c表示词条的总词数,N表示数据集合为D的总词条数,nk表示数据集合D中含有特征词Tk的词条总数。
根据专业性维度不同进一步调整权重,形成最终词权:
(9)
式中,α和β为常数,通过神经网络模型试验结果确定。
最后将最终词权按大小排序并输出控制量,即为计算结果Vij。
2.3.3基于专家经验的智能控制模型根据信息采集系统采集到的多年农作物生长、产品加工、仓储及物流等方面的数据信息,在专家经验模型库中建立农作物正常生长信息库、产品加工关键点信息库、仓储及物流关键指标信息库,即农作物各生长期内正常生长所需的土壤养分、土壤温湿度、环境温湿度、光照强度、农作物波谱等信息,产品加工过程中重要原料或添加剂的主要理化指标及所占比例、关键生产点需要的温度、压强等指标,仓储过程中的储存时间、温湿度、微生物含量、二氧化碳、氮等一些气体的浓度,物流过程中温度、湿度、二氧化碳、氮的浓度的值的范围等。将农作物的各项参数的标准值记为V标准,表示一个标准区间或多个标准区间,
(10)
将信息采集系统采集到的数据记为V测,V测=a测,b测,……,z测,将信息采集系统采集到的数据V测与标准值V标准比较,V测处于V标准之外表示数据采集系统采集到的数据小于标准区间的最小值,或者大于标准区间的最大值,或者处于多个标准区间之间,若V测处于V标准之外,则大数据分析云平台发送报警指令,触动相应的控制器动作,如触动控制农作物生长的灌溉、施药、遮挡的操作,生产加工中的风险预警、加减温、加减压的操作,仓储物流中的风险预警、自动抽湿、降温等操作。
3 大数据云平台的应用及分析
3.1 农产品生长过程控制
首先通过信息采集系统采集农作物的种子选取、生长、施药施肥及采摘各个阶段的信息,利用通信系统发送至大数据分析云平台储存。用户根据需要可以实现:(1)查询读取农作物信息。通过终端发出查询指令,大数据分析云平台根据指令进行检索,可获取农作物生长及对其干预的关键信息。(2)对农作物进行生产控制。根据监测的土壤养分、土壤温湿度、环境温湿度、光照强度、农作物波谱等生长条件信息,化肥种类及施用量、农药种类及施用量等干预信息,利用大数据分析云平台进行计算分析,向终端或应用层发送指令,及时自动对作物进行灌溉、遮挡、喷药等操作,实现精细、智能控制生长过程,减少农药化肥施用,科学有效提升产品品质,同时各项操作有迹可循,实现产品全程可回溯。
3.2 产品加工控制
在产品加工生成阶段,利用数字信息技术生成二维码或电子标签,把产品的关键行为信息添加到二维码或电子标签,可直接扫码读取,如需获取产品的原料来源、加工等详细信息,可通过终端发送相应请求,从大数据分析云平台获取该产品的全程生产、干预及移动状况等信息,实现回溯,做到产品质量可控。
3.3 仓储控制
农业类企业的原料及产品往往具有数量多、体积大、储藏条件要求高、保存及交货时间紧等特性,在仓库中安装温湿度传感器及气体监测传感器,监测收集温湿度、二氧化碳、氮气等气体的浓度及出入库信息,对比大数据分析云平台内各监测指标的阈值,当监测到仓库内的检测指标超出阈值时,自动报警并向相应设备发出指令,实现自动存量警报、调节温度、抽湿及换气等,智能控制库存产品的存量和质量。
3.4 物流控制
在运输车辆上安装传感器及GPS,监测运输车辆位置、运输车辆的温湿度及一些气体浓度信息,将车辆位置信息与电子地图平台实时连接,实时获取交通路况信息及路径规划行驶信息,上传至大数据分析云平台。大数据分析云平台结合库存产品存量、质量、终端发送的客户及订货信息,智能调度物流,最后通过终端扫码等方式确认收货信息,实现产品快速开单、发货、配送的高效精确控制。
3.5 财务管理信息化
关联母、子公司银行账户,将各终端收集的财务数据集中至大数据分析云平台,把各子公司需做的重复性工作集中处理,使财务数据的共享、查询、分析、统计等更加高效和精确[17-19],同时可提高财务人员编制会计凭证、合并报表等的工作效率,有效实现财务集约化;利用不同的算法和模型,可获得集团或各子公司的财务报告、产品成本报告、区域销售状况报告及客户信誉报告等,实现有效财务控制;集成集团内分散的子公司财务数据和报表,通过定量对比、分析,对一定时期内的企业生产经营业绩做出客观准确的财务评价,如分析偿债能力、获利能力、营运能力、成长能力等,实施高效财务评价。
3.6 人力资源管理信息化
在进行人力资源管理时,利用互联网环境,将员工基本信息、考勤、培训、薪资、福利、劳动合同及客户信息集中至大数据分析云平台,获授权的终端可进行数据的查询、分析、统计,消除各子公司手工作业分散、隔离的现象,减少盲区和重复劳动,保证人力资源信息在集团企业内客观真实地共享,为企业薪资体系制定、绩效考核及奖金发放、激励方案优化、供应商及客户信息管理等提供支持,精确迅速科学。
3.7 决策支持
依托云平台强大的数据存储和计算分析能力,在企业管理的关键流程,根据需要可得出多层次管理者所需的决策支持数据,辅助科学决策,提高整体决策科学性。基于大数据分析云平台的数据分析结果进行决策,避免了基础数据的层层上报,保证了决策层获取数据的高效和真实[20-21],也减轻企业管理者从事信息处理和分析的负担,使其能专注于最需要决策智慧和经验的工作,提高决策质量、效率和科学性。
4 小结
以物联网技术为基础,提出了以云计算、大数据为核心的农业企业集团大数据分析云平台架构方案,应用于现代农业企业管理中,可以优化农业生产经营管理数据的收集、处理,使企业集团信息化具备对农业生产、加工、管理、销售的全链数据支撑能力,优化重组企业生产经营流程、简化管理结构提高效率、促进决策科学化[22-23]。当然,信息化是促进经营管理水平提高、实现企业目标的现代管理手段,不是企业管理的目的,也不是万能的,所以在信息化建设中,特别是在大数据分析云平台的设计实施中,应不断利用最新的信息技术,根据企业经营环境、内部结构、用户需求等的变化,不断对系统进行二次开发、更新、优化,以适应集团企业发展变化,达到规范企业的经营管理行为提升管理质量的目的。