APP下载

基于泛在物联网和机器学习算法的资产异常状态预警系统

2021-08-20章怡

电子设计工程 2021年16期
关键词:预警系统决策树神经元

章怡

(上海电子信息职业技术学院,上海 201411)

泛在物联网是泛在电力物联网的扩展,主要指其他行业的智能化物联网应用[1-2],包括高等学校在内的各类企事业单位。其作为市场主体在经营、生产过程中,通过各个环节的联机、交互,可以实时掌握生产、运行状态并及时进行优化调整[3];另一方面,也能及时发现在生产、管理过程中的潜在漏洞,防患于未然[4-5]。

随着我国经济进入新常态的阶段,市场经济充满了不确定性,资产的稳定性影响着各类市场主体的良好发展。因此,构建合理、有效的资产异常状态预警系统尤为必要[6]。

针对以上现象,文中将泛在物联网与机器学习相结合,开展了资产异常状态预警系统的研究。通过采集泛在物联网中各个互联设备与监控系统的实时数据,作为分析资产状态的样本数据。然后,利用机器学习中的BP 神经网络与决策树算法对样本数据进行特征提取与资产状态分类,从而构建资产异常状态预警模型。然后使用Bagging 对资产异常状态预警模型进行优化,最终得到准确的数据结果。

1 资产异常状态预警系统

通过人工识别统计资产存在效率低、信息滞后与不能监测资产状态等问题,需要采用现代化的人工智能技术以有效提高资产管理效率[7]。文中基于泛在物联网与机器学习技术设计了资产异常状态预警系统,具体框图如图1 所示。

图1 资产异常状态预警系统结构框架

泛在物联网可以将各个资产设备连接起来,通过传感器实时采集各个设备工作状态下的数据[8]。这些数据作为分析资产状态的原始数据,经过预处理后被输入至基于机器学习算法的模型中,进行特征提取与模型训练。最终,可得到能够识别资产状态等级的模型。

1.1 资产异常状态预警系统结构

根据上文对资产状态识别系统的分析,整个系统采用B/S 系统架构。该系统架构中的浏览器,可以满足用户在任何地点使用Internet 进行业务查询与数据整理;而服务器可满足相关功能数据、程序的存储与运行[9]。

1.2 资产异常状态预警系统设计框架

辅助用户进行资产管理,及时发现异常资产状态并预警是文中所述系统的设计目标。在进行系统框架设计时,应以目标为核心,预警方法、预警指标为设计基础。通过设置合理的预警指标阈值来衡量资产各个状态,具体设计框架如图2 所示。

图2 资产异常状态预警系统设计框架

2 检测算法

2.1 资产预警指标

资产状态的优劣直接影响着用户的生存和发展。通过泛在物联网实时采集用户日常业务运行的数据,可对资产风险进行预估,进而达到预警的效果。由此可见,对资产风险预估所采用的风险指标选择起到了关键作用。文中将风险指标分为4 类:运营能力、偿债能力、盈利能力以及发展潜力,具体如图3 所示[10-12]。其中,总资产转换率被定义为该季度营业净利润占总资产的百分比;存货周转率被定义为营收额与平均库存余额的比值;资产负债率被定义为总负债额与总资产额的比值;流动率被定义为短期内可使用金额与总资产的比值;总资产收益率被定义为某段时间内营收净利润占总资产的比例;生产利润率被定义为营收净利润占营收额的比例;总资产增长率被定义为今年资产总增长率与去年的比值;融资能力被定义为该用户的综合信用水平。

图3 资产风险指标体系

由于泛在物联网得到的数据并不能直接用于资产异常状态的分析,需要进行标准化、聚类与排除等数据预处理。其中,文中使用Z-score标准化,具体为:

式中,x为原始数据,s、a分别为各项指标数据的标准差与平均值,X为经过标准化后的数据。

2.2 资产异常状态预警模型

BP 神经网络的全称为误差反向传播神经网络,其主要特征为误差的传播方向与正常计算方向相反。BP 神经网络为至少三层的多层神经网络,每一层含有数量不同的神经元。同层之间的神经元相互独立,相邻层之间的神经元以全连接的方式进行数据的传递。假设神经网络的输入为xi,则BP 神经网络的激活函数表达式如式(2)所示。

其中,wikj被定义为第i层第j个神经元到第i+1层第k个神经元的连接权重;而aik被定义为第i层第j个神经元的输出。神经元j的误差能量函数被定义为下式:

其中,Yj为神经元j的期望输出,yj为神经元j的实际输出。

在BP 神经网络中有两种方式可降低整个神经网络的误差,一种方式为增加隐藏层的数量;另一种方式为增加单层隐藏层神经元的数量。两种方式所消耗的训练时间及降低误差的大小对比结果,如图4所示。由图可知,随着隐藏层层数的增加,模型训练时间显著增加;单层神经元个数的增加也会使训练时间增加,且会逐渐趋于定值。而图5 中,隐藏层层数与单层神经元个数的增加均会使误差降低。值得注意的是,虽然隐藏层层数可显著降低误差,但在相同神经元个数时,无论神经元个数多少,高层数的模型训练时间均比低隐藏层层数的模型大。

图4 隐藏层神经元个数和隐藏层层数对训练时间的影响

图5 隐藏层神经元个数和隐藏层层数对误差的影响

BP 神经网络的使用虽然降低了误差,但其分类识别能力相对较低。为了加强资产状态分类的识别精度,从而实现精准预警,文中将决策树与BP 神经网络相结合。决策树是一种树形的结构,在该结构中每一个内部节点代表一个分类属性的判断。由该节点引出的分支代表判断结果,最终形成的每一个叶节点均表示分类的结果[13-16]。文中使用基尼指数进行分类属性的选取与划分,具体过程如下:

1)计算样本数据集S的纯度,表达式如下:

2)计算各个属性的Gini指数,表达式如下:

3)选择所有Gini_index(S,q)中的最小值作为该节点划分时的最佳属性。

当不修剪决策树的枝条时,BP 神经网络模型容易受到样本数据的干扰,出现识别精准度下降的现象。为了提高BP 神经网络模型的识别精准度,文中使用Bagging 算法对BP 神经网络模型进行优化。具体过程如下:

1)从输入数据中随机抽取k次含有n个数据的训练样本,从而得到k个数据集;

2)对这k个数据集分别输入至BP 神经网络模型中进行训练;

3)通过投票表决的方式生成资产状态的识别结果。

至此,文中所述的资产异常状态识别预警模型的结构,如图6 所示。一共分为4 个部分:输入层、隐藏层、分类层与输出层。经过数据预处理的样本数据被输入至隐藏层进行特征提取,并在分类层进行资产状态的识别和在输出层进行结果输出与风险预警。文中将资产状态分为3 种类别:无风险D1、低风险D2 与高风险D3。

图6 含有BP神经网络和决策树算法资产异常状态预警模型示意图

3 测试与验证

通过调用某用户的泛在物联网平台数据,得到了用于资产异常状态识别模型训练的原始数据。该数据为2014-2019 年4 个季度相关指标的数据,文中采用Modeler 18.1 作为BP 神经网络模型的创建平台。综合上文的分析,文中采用4 层隐藏层,每个隐藏层均有50 个神经元来构建资产异常状态分析模型。设定训练周期为100 次,决策树中CART 树深度为5,并使用Bagging 算法进行模型优化。表1 为该公司4 个季度的部分指标数据。分别将以上数据进行Z-score 标准化,并利用聚类法将指标进行分类。为了确定各个指标对资产状态判断结果影响的大小,分别对各个指标进行因子分析。考虑到各指标的初始数值差距较小,需要使用方差最大正交旋转法将数据特征放大。由于决策树中树的数量会影响到整个模型对资产状态的识别精度与计算速度,有必要合理选择决策树的数量。图7 展示了决策树数量对资产状态识别精度的影响。综合考虑识别精度与模型运算速度,文中将决策树数量定为70 个,整体识别精度为81.3%[17]。

表1 某公司4个季度的部分指标数据

图7 决策树数量对资产状态识别精度影响

为了验证文中所述方案的有效性,设置对照组进行对比。对照组使用BP 神经网络与Softmax 分类器,来进行资产状态识别预警模型的构建。实验组与对照组使用相同的样本数据和软硬件配置,实验结果如图8 所示。由图可知,文中所述实验组的识别精准度均比对照组高,平均识别精准度为80.1%,可为用户提供有效的资产风险预警。

图8 实验组与对照组对资产状态识别精度影响

4 结束语

文中基于泛在物联网与机器学习技术,设计了资产异常状态预警系统。根据现阶段所面临的资产风险现状,文中从系统框架出发,采用B/S 系统结构满足多场地、实时登入功能。利用泛在物联网平台收集用户生产、运营的各项数据,作为分析资产状态的样本数据,再利用机器学习中的BP 神经网络与决策树算法对样本数据进行特征提取和资产状态分类,从而构建资产异常状态预警模型。最终,采用Bagging 对资产异常状态预警模型进行优化。经测试,文中所提出的算法有较高的准确率,证明了该方案的有效性。

猜你喜欢

预警系统决策树神经元
民用飞机机载跑道入侵预警系统仿真验证
一种基于CNN迁移学习的井下烟、火智能感知预警系统
一种针对不均衡数据集的SVM决策树算法
基于ZigBee与GPRS的输电杆塔倾斜监测预警系统
决策树和随机森林方法在管理决策中的应用
跃动的神经元——波兰Brain Embassy联合办公
桥、隧安全防范声光预警系统
基于决策树的出租车乘客出行目的识别
基于二次型单神经元PID的MPPT控制
ERK1/2介导姜黄素抑制STS诱导神经元毒性损伤的作用