APP下载

基于大数据的企业信息设备生命周期动态分析及应用

2020-12-23许挺姚力

装备维修技术 2020年13期
关键词:机器学习评价指标大数据

许挺 姚力

摘要:目前,企业信息设备的全寿命生命周期过程涉及数据量大、数据种类多,通過利用大数据技术以及机器学习算法构建科学合理的过程评价机制,提高企业管理信息设备的运行水平。

关键词:信息设备;大数据;机器学习;评价指标

引言

在当前大数据技术蓬勃发展的背景下,如何对数据进行整合、交换,以及在分析过程中定位敏感信息、准确有效地保护敏感信息,在信息安全的前提下挖掘数据价值成为当下数据管理者亟待解决的关键问题。

1、产品平台生命周期概念

目前,对于产品平台学术界还没有一个统一、权威的定义,但其核心是相同的,即能够被通用或共享的所有资源都可以视为产品平台。从动态发展的角度,在原有产品族中新增产品,构建新的产品族架构,然而产品平台的升级更新要比产品族更迭更深入,可以使企业创造新的细分市场,扩大企业的市场空间。

技术系统的生命周期理论主要强调技术系统的演化过程,该理论是以需求生命周期、技术生命周期、竞争生命周期为基础的。产品平台作为一个复杂的技术系统,在演化进程中产品平台可以通过创新获得新生并向更高层次进化。其研究意义在于:产品平台不断地创新和升级为企业提供了持续生存的基础;揭示了产品平台演化过程所具有的类似生命曲线的规律;提供了一种对产品平台规划、评价与决策模式的依据。本文将产品平台生命周期(ProductPlat-formLifeCycle,PPLC)定义为在企业内、外部各种因素的影响下,企业核心产品技术发展所经历规划、开发、成熟和衰退四个阶段的过程,这一核心产品技术可以包括用于产品共享和配置的产品零部件结构平台及其相关的工艺平台等。在这一过程中,由产品平台派生出来的一个或多个产品族及其复杂的结构体系都是随着时间动态地发展。在动态发展的同时,产品平台根据市场的需要进行扩展和升级,从而由在新的产品平台上发展出新的产品族来满足市场需求。

2、问题及解决方式

根据引言中提到的问题,确定主要研究解决的方向有三。建立多维度指标评价模型,清楚企业信息设备现有运行维护管理方式,提炼对不同类别下信息设备运行状况、经济状况以及偏好使用状况的多维分析指标,对每台在运设备构建量化的等级评价模型。

信息设备采购预测分析,在多维度评价模型基础上,结合企业信息设备管理规定,对信息设备需要退役的情况进行预判,从而形成信息设备采购的预测。

推送信息设备采购建议,基于信息设备采购预测分析的基础,对历史信息设备退役情况和推荐退役情况进行多维度对比,重点分析经济指标,关注历史退役情况是否合理。对未来需要退役的信息设备推荐采购建议。

3、实现关键

(1)提炼指标,源业务数据存在质量问题,不同类型设备提炼特性指标难度和工作量极大,故对数据进行清洗,并提炼设备共性指标,主要根据设备运行时长、正常运行时长、故障时长、故障次数综合判定设备运行质量。

其中,提取和清洗数据的过程尤为重要,直接关系到后续应用的使用可信度。在提取数据阶段中,应按照需求总线矩阵中构建的星型模型,快速建立维度表和业务行为表,以信息设备被提炼出来的业务行为为主线,关联维度表,形成设备业务行为明细表,方便后续不同角度分析数据,形成最终分析应用成果。在清洗源端数据过程中,发现源业务系统字段存在很多空值、异常、不符合业务规则的情况,基于此,我们参考统计学规则,对于遴选有效信息空值列大于80%的行进行剔除,其余空值情况,对列值分布情况进行分析,在不改变其分布的情况下,填充符合统计学意义的数值。对于异常值的情况,判定是否为无效数据类型,若为无效数据的情况,将其赋予一个无意义的标识值,对于其是有效的状况,继续分类标识,确定其具体的业务含义。对于不符合业务的情况,建立数据关联匹配规则,根据具体业务逻辑做动态可修改的窗口,标记数据点位,做相关业务确认动态回填数据,保证数据的有效性。以上提取以及清洗工作完成后,对处理完成的数据是否对应用分析有效进行量化评价,根据评价值迭代数据提取和处理过程,动态调节使得最终量化评价分数达到一个阈值后,输出应用分析的结果。

(2)用L-M算法改进的BP人工神经网络BP(BackPropagation,反向传播)人工神经网络是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP人工神经网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。BP神经网络模型拓扑结构包括输入层、隐藏层和输出层。BP人工神经网络具体工作原理就是通过始末非线性变换,获得输出值,每个神经元的状况会影响下一层对应的神经元,使误差最快速度下降,通过不断反复学习训练,致使误差达到合适的范围内,训练就可以停止,若是期望值误差值与得到的值相差较大,就将误差转移到逆向传播过程,方向为输出层——隐含层——输入层3层,通过这两个过程往返交替实行,同时修正各层神经元的阈值和权值,收缩误差,直至输出值逼近期望值,网络训练至此结束,从而完成信息索取和记忆过程。在实际应用中,传统BP人工神经网络算法很难胜任,因此出现了很多改进算法。比如:利用动量法改进BP算法、自适应调整学习速率算法、动量-自适应学习速率调整算法、L-M(Levenberg-Marquardt)算法等。本文采用L-M算法,L-M算法比前述几种算法要快得多,不过对于复杂问题,这种方法需要相当大的存储空间。但是,随着以大数据、云计算、人工智能等为代表的新一代信息技术的飞速发展,计算机高速度运算、海量存储技术飞速发展,为L-M算法改进的BP人工神经网络方法的实用化提供了保证。

4、模型数据处理

4.1质量标准指标数量化

对于通用的产品质量标准数据指标有产品适用寿命、产品功能完善程度、产品外观新颖程度等指标,对洗衣机产品来说,除了这些通用的质量标准指标外,还有用途分类、容量、洗净比、洗衣方式、对织物的磨损率、耗水量、耗电量、洗涤噪音值、脱水噪音值、材质等质量标准。

因为产品质量标准数据的有些指标,比如:产品功能完善程度、产品外观新颖程度等属性难以用准确的数字来表述,所以得先采用一个恰当的词汇集合来进行表述。本研究采用的词汇集合为{高,较高,一般,较低,非常低}五级。接下来需要对词汇集合做数量化转换。通常采用模糊数学中的模糊集理论来转换。

4.2质量标准指标数据标准化

每个质量标准属性指标实际代表的涵义往往不一样,其数量级以及量纲往往也不一样。所以,需要用标准化函数做标准化转换。

结语

此分析应用采用大数据技术手段对数据进行提取、清洗、分析并利用机器学习算法对指标因子进行动态调整,对企业信息设备维护和购买行为进行预判,同时为企业提供信息设备采购依据,实现降低企业成本、提质增效的目的。使用维度模型建立数据模型的方式也可为除信息设备之外的其他设备建模进行横向扩展,适配度强,对不同行业设备全寿命周期过程的管控有借鉴和推广意义。

参考文献

[1]樊峰峰.大规模数据清洗关键技术研究[D].西北工业大学博士学位论文,2018.

[2]王兆君,岳良文.产品质量标准数据清洗模型及应用研究[J].标准科学,2020(4):88-95.

[3]林森,但斌.面向大规模定制的产品平台管理模型[J].管理工程学报,2005,19(1):51-55.

猜你喜欢

机器学习评价指标大数据
基于网络搜索数据的平遥旅游客流量预测分析
第三方物流企业绩效评价研究综述
前缀字母为特征在维吾尔语文本情感分类中的研究
基于UML的高校思想政治教育工作评价系统的分析与研究
公共文化服务体系评价指标的国际经验与启示
资源型企业财务竞争力评价研究
基于支持向量机的金融数据分析研究
基于大数据背景下的智慧城市建设研究