数据可视化与挖掘分析在资产管理中的应用
2022-12-05冯俊池安丰亮肖岩平
冯俊池,安丰亮,肖岩平
(军事科学院系统工程研究院后勤科学与技术研究所,北京 100071)
0 引言
资产是一个单位完成生产任务和开展日常工作的物质基础,也是单位生存和发展所依赖的重要资源,其管理成效直接影响单位资源能否合理配置。资产管理是单位日常管理的重要工作之一,科学有效地管理好资产,能够增强资产采购的科学性、资产配置的合理性,实现资产管理与预算管理、财务管理的紧密结合,发挥其最大使用效益,对保持和提高生产能力具有重要意义。
随着信息化的发展,资产管理信息系统逐渐得到普及,资产申请、审核、购置、登记、处置等各项管理业务流程实现线上化操作处理,资产使用及运行状态通过实时采集手段实现动态监控。在线系统产生的资产数据逐渐汇聚,规模体量逐渐庞大,资产管理过程中的规律、态势、风险等有价值的数据潜藏其中。如何有效利用数据积累,发挥信息技术优势,实现资产整体态势掌握、有效管控和统筹配置,受到了越来越多的重视。
数据可视化技术与数据挖掘分析技术是大数据利用中常用的关键技术,能够从规模巨大、类型繁多、产生迅速、价值密度低的数据中有效提取关键信息。通过在资产数据分析中应用数据可视化与挖掘分析技术,能够分析资产规模、价值、质量、使用状况及分布情况,探索变化趋势,发现存在问题,对掌握资产整体态势,盘活存量资产,优化资源配置,提高资产利用率和经营管理效能具有重要意义。
1 数据可视化与挖掘分析技术简介
1.1 数据可视化
数据可视化是数据描述的图形化表示,通过以直观的方式呈现数据,帮助用户深入理解数据内涵,有效获取数据潜在的重要信息以及特征规律[1]。数据可视化能将枯燥繁多的数据转化为生动形象的图表,为错综复杂、看上去没有关联的数据建立联系和关联[2]。
数据可视化过程包括数据采集、数据处理变换、可视化映射和用户感知4 个主要阶段[2]。数据采集主要通过从业务信息系统、离线文件、物联网采集设备等来源实现数据汇聚,通过自动化接口、人工处理等形式,将多源数据进行融合。数据处理变换将数据进行格式、形式上的转换和特征提取等操作,为数据展现提供基础。可视化映射则将数据特征映射到不同类型的图表,实现由数据值到形状、大小、颜色等图表特征的转换,常用的统计图表包括柱状图、折线图、饼状图、散点图、气泡图、雷达图、直方图、词云图、热度图、地图等。用户感知则是用户借助图表发现潜在信息和知识的过程,实现由数据到认识的最后转换。
1.2 数据挖掘分析
数据挖掘分析是通过特定的方法来发现隐藏在大量数据中的信息的过程,是大数据处理体系的核心。数据挖掘分析涵盖了统计分析、机器学习、模式识别等多个领域的技术和方法[3],主要包括数据预处理、特征工程、建立模型和应用模型4 个主要阶段。(1)数据预处理。主要针对数据进行归一化、标准化等操作,原始数据中通常存在各类问题,如:数据量纲不一致、数据项冗余、存在缺失值、类别特征不能直接使用等,需要进行处理后才能进行下一步。如在算法只接受数值特征的输入、字符型类别特征不能直接使用的情况下,需要通过one-hot[4]将字符型数据转换为数值型数据。(2)特征工程。指从数据中筛选与训练目标相关的特征,从而提高模型效果的过程。待挖掘分析的数据项一般很多,如果全部作为特征输入模型进行训练,则会带来噪声,影响模型效果。通过可视化分析可以发现影响目标的相关变量,为特征选取提供参考。(3)建立模型。指选择要使用的模型,利用数据进行训练,并不断调整优化的过程。常见的模型包括回归、聚类、分类等。针对不同的分析任务,要选取的模型也不同,需要根据任务特点和模型的适用性,选择最优模型。(4)应用模型。在建立模型阶段训练得到的模型在应用模型阶段使用,通过将待分析数据作为输入运行模型,从而得到分析结果,为业务人员决策提供指导。
2 资产数据可视化分析
数据可视化技术能够实现资产态势的掌握以及数据规律的发现,还可用于资产数据的清洗[5],进行数据的检查、纠错和转换。
2.1 资产分布分析
资产分布主要指资产数量及价值在类别、所属部门、所处位置等多个维度上的分布情况,可采用柱状图、南丁格尔图、饼图、雷达图、词云图等形式表现。针对基础设施类数据可采用地图形式表现。(1)类别分布分析。通过资产价值在不同类别资产上的分布情况对比,可查看经费投向投量,对比与整体战略是否一致。(2)部门分布分析。通过资产数据及价值在不同单位或部门的分布情况对比,分析资产分布与单位职能、规模是否匹配。(3)位置分布分析。通过资产数量及价值在不同地理位置的分布情况对比,分析是否均衡,以及与业务区域重视程度是否相符。
(4)多维分布分析。结合类型、部门、位置等多种因素,综合查看资产分布情况。在堆积柱形图中可以实现不同子分类数据的堆积,从而在展现数据分类对比的同时查看子分类的占比情况。如在针对单位资产价值的分布图中,可通过堆积不同类型资产的价值,实现查看不同单位资产价值分布情况的同时,对比同一单位不同类型资产的价值。
2.2 资产趋势分析
资产趋势分析主要指分析资产数量及价值在时间维度上的变化情况,可采用折线图、阶梯图等形式实现。通过观察资产总量、规模和结构在时间维度上的增减变动情况,可了解资产整体态势及管理情况,并判断其对单位生产效能的影响;通过观察某类资产在时间维度上的增减情况,可发现该类资产购置、使用和退出规律,为采购、维修、报废计划提供参考。资产趋势分析应用场景还包括:
(1)资产购置新增趋势分析,反映单位在特定领域建设的投入情况,检查各领域方向投入是否均衡,以及是否与业务发展重点相一致。
(2)资产报废退役趋势分析,反映资产消耗情况,检查资产消耗速度是否正常,是否存在消耗过快情况。
(3)资产使用时间趋势分析,反映资产使用规律,检查资产利用率是否合理,如利用率过低,则可能存在资产数量过多或配置不均等情况,需要根据具体原因调整资产配置。
2.3 资产损耗分析
资产损耗分析主要从质量和使用情况角度分析资产状况,发现资产使用和维护管理中存在的问题,为提升资产质量和使用效益发现可改进之处。
2.3.1 资产质量分析
资产以采购等各种形式新增,以报废、权利转移等各种形式减少,在其生命周期内,还需要关注运行(使用)、维护及处置情况,如果没有完善的管理机制,资产会出现质量问题,导致其无法发挥应有的作用。针对以上情况,分析各类资产新品、堪用品、待修品、报废品的数量及比例,可获悉资产质量分布情况,从而判断质量情况是否合理,并从以下角度分析有无问题以改进管理:①设施设备维修是否及时;②资产报废率是否过高;③资产购置及处理是否及时;④可用资产规模是否满足业务工作需求。
2.3.2 资产使用分析
如果采购时缺乏整体协调容易使得部分资产的重复购置率较高,从而造成使用效率低;部分设备类资产由于更新换代频繁、兼容性差等原因也有可能造成资产长期闲置。针对以上情况,分析每类资产以及其在不同部门的使用及闲置情况,判断资产存量是否满足需求、是否存在冗余,以及各部门间资产使用是否存在忙闲不均等情况,为资产合理配置提供数据依据,充分挖掘资产潜能,避免设备空置、重复购置等浪费现象出现。
3 资产数据挖掘分析
3.1 聚类分析
聚类分析目的是把大量数据点的集合分为若干类,使得每个类中的数据最大限度地相似,而不同类中的数据最大限度地不同。将各单位不同类型资产的数量作为特征向量,运用聚类分析方法,可挖掘具有相似资产分布特性的单位,通过与单位职能的对比分析,来辅助判断资产配置是否合理。
资产数据分析中其他可以应用聚类分析的场景还包括:
(1)根据资产使用寿命、维修周期等特征,建立聚类模型,挖掘具有相同维护特性的资产类型,以便于统一管理。
(2)针对某一类型设备,根据设备性能参数等进行聚类,如台式计算机,根据处理器、内存、硬盘、显卡等参数进行聚类分析,结合用途功能,形成系列配置,可为下一步采购、编配、调剂提供参考。
3.2 关联分析
关联分析通过寻找最能够解释数据变量之间关系的规则,来找出大量多元数据集中有用的关联规则,是从大量数据中发现多种数据之间关系的一种方法;另外,它也可以基于时间序列对多种数据间的关系进行挖掘。
关联分析的对象包括不同类别员工数量与办公设备数量之间的关系、不同类型资产之间的数量关系等,如台式计算机数量与硬盘购置数量、办公桌数量等之间的关系;还可以对各类资产数量之间进行关联分析,发现其中隐藏的不同资产之间的潜在关联,为制定配置标准、科学规范配置相关资产提供参考。
3.3 回归预测
回归分析的核心是解决连续型变量的预测问题,通过对具有连续型标签的数据进行学习,建立机器学习模型,从而对其他有相同特征的数据集进行预测。常用模型包括线性模型、决策树模型、生存回归模型等。应用回归预测对单位资产总量随时间变化情况进行分析,可发现资产变化趋势规律,辅助后续规划计划;对比不同单位资产变化情况,根据差异寻找不同及原因,推动改进管理手段和方法。
针对大型仪器设备,通过回归预测还可辅助进行运行状态监控管理。根据设备信息、维修情况以及运行特征状态数据集,构建预测模型,对设备进行使用寿命、检修维修时间等数值预测,实现设备运行状况预警,同时为采购计划、备品备件库存、维修检修计划等提供参考。
3.4 异常点检测
异常点检测又称离群点检测,是找出明显偏离其他数据,不满足一般模式或行为的数据点的检测过程[6]。常见的检测方法包括基于统计的模型、基于距离的模型等。异常点检测试图捕捉那些显著偏离多数模式的异常情况,可用于发现大量资产中存在的异常个例。如果某类资产的报废期限普遍为6~8 年,那么某个使用2 年便报废的该类资产便是典型的异常点,需要进一步结合实际情况开展分析,确定是统计错误还是实际情况,如情况属实,还可对其产生原因做进一步分析,为后期使用管理提供经验。此外,还可以针对资产数量、价值、质量等多个指标在不同维度上进行异常点检测,发现资产管理中存在的个别问题,有助于发现异常和违规情况,推动资产规范化管理。
4 结语
在信息技术特别是大数据技术迅速发展的形势下,资产数据在质和量上逐渐提升。海量资产数据如果无法得到有效利用,则不能充分发挥信息化管理的优势,无法将数据优势转化为决策优势,从而无法改进管理,提高效益。为解决这一问题,本文对数据可视化及挖掘分析技术在资产数据管理中的应用进行了分析,针对典型场景提出了应用方向和内容。通过对资产数据的深入分析得出规律,指导资产采购、使用、调配、报废等工作开展,有利于提高资产利用率,提升资产管理的科学性、准确性。