大数据统计分析方法在经济管理领域中的应用
2021-08-27张瑞
张瑞
【摘要】 经济管理工作中,数据的统计分析是基础,能为制定决策提供依据。文章从大数据统计分析对经济管理的作用出发,介绍了常见的大数据统计分析模型,对生存模型进行深度研究和剖析,最后阐述了大数据统计分析方法在经济管理领域中的应用和新思路。
【关键词】 经济管理 大数据 统计分析 生存模型 新思路
统计学属于数学知识领域,也是经济管理的基本内容,统计分析就是数据收集、整理、分析、利用的过程。随着经济社会发展,大数据统计分析应运而生,是对传统统计分析理念和方法的革新。面对激烈的市场竞争,合理运用大数据统计分析方法,有助于合理配置资源,提高管理效率。以下结合实践,探讨了大数据统计分析在经济管理领域的应用情况。
一、大数据统计分析对经济管理的作用
大数据统计分析对经济管理的作用,体现在两个方面:一是提升管理水平。企业发展面临较大压力,这种压力来源于国内同行和国外企业。在经济管理方面,只有收集市场信息,及时调整发展策略,才能获得良好发展。尤其是财务管理上,面对复杂的工作局面,采用大数据统计分析方法,能提升管理水平,积极应对市场竞争。二是积极规避风险。在经济管理领域,风险管理是一个重点和难点,因为风险无处不在。应用大数据统计分析方法,对各项业务和经济活动进行分析,能发现异常数据和隐藏规则,明确风险隐患,继而制定针对性的防范措施。
二、常见的大数据统计分析模型
基于大数据技术下,常用的统计分析模型有:行为事件模型、漏斗分析模型、分布模型、留存模型、行为路径模型、用户分群模型、属性分析模型等。以下简要介绍分布模型、留存模型。
2.1 分布分析模型
产品优化和运营是一个动态过程,需要监测数据变化,调整产品的设计或运营方法,然后继续监测效果,如此反复循环。分布分析模型,可用来了解不同区间事件的发生频次,不同事件计算变量的加和,以及不同页面浏览时长等区间的用户数量分布,如下图1所示。
例如:小王是电商产品经理,用户浏览商品详情页时,他关注的问题有:①最近1周浏览商品详情页的用户,例如1-5次、6-10次等不同区间的用户量分布情况;②最近一段时间内,每日用户浏览商品详情页人均数量、最大值、最小值、中位数、25分位、75分位的趋势;③不同广告渠道带来的用户,浏览商品详情页1-5次、6-10次等不同区间的用户量有多少。采用分布分析模型,就可以解决以上问题,直观得到各种数据结果。
2.2 留存分析模型
留存就是留下来并持续使用,不论是各类APP,还是网站、网络游戏,留存率均是一个重要的评价指标。一般情况下,留存率是指目标用户在一段时间内,回到网站或App中完成某个行为的比例,常用指标有次日留存率、七日留存率、次周留存率等,如下图2所示。做好留存才能保障新用户不会流失,而是进行持续消费,最终从新用户转变为老用户。
以某个APP为例,如果单纯看日活量,觉得数据不错,但有可能是因为近期有密集的推广拉新活动,促使大量的新用户注入。但是,真正留下来的用户不一定在增长,可能在减少,只不过被新用户数据掩盖了所以看不出来,这样的话很难获得持续增长。利用留存率进行分析,更能体现出用户对APP的依赖程度,采用留存分析模型,就能得到用户在不同时间段使用APP的情况。
三、生存模型的深度研究和剖析
3.1 概念
生存模型,描述基于时间的系统失败或生命死亡的概率模型。以某一时刻(t=0)开始记录某种设备、某类动物或某类人群的未来寿命T,未来寿命大于任意时刻(t>0)的概率P[T>t]。该模型在生存分析、生命表編制中具有重要作用。
3.2 生存函数
定义生存函数:S(t)=P(Z>t)。用(Yi,Ci,Zi)代表第i个(1≤i≤n)个体数据,其中Yi代表观测到的生存时间;Ci是0-1变量,代表观测的生存状态;Zi代表真实的生存时间。可以得到:
定义ε(t)为事件,在一个特定的时刻事件或死亡个数。R(t)为在险者,对于任意给定的时间t,观测到的生存时间超过t的个体。
3.3 KM估计
KM法即乘积极限法,是现在生存分析最常用的方法,由Kaplan和Meier在1958年提出。KM法是这样估计生存曲线的:首先计算出活过一定时期的病人,再活过下一时期的概率,然后将逐个生存概率相乘,即为相应时段的生存率。
3.4 实例分析
生存分析最初用于对病人服药后的存活时长进行预测分析,后来逐渐利用于各种与期间有关的问题中,并成为了最著名的时间变数模型。经济领域研究用户行为,用户流失是一个主要研究方向,将生存模型引入其中,既能研究期间问题,又能解释风险因子。整个分析步骤如下:①原始数据格式处理,把数据处理为用户、生存时长、是否删失的数据格式。②绘制KM估计及生存曲线。③判断协变量是否存在时变变量,有的话进行数据格式的二次处理,将数据打断为用户、起始时间、结束时间、是否删失的格式。④判断协变量系数是否存在时变效果,即PH假设检验。如果检验不通过,对时变效果进行绘制,并进行数据分层。⑤建立扩展Cox-PH模型,估计风险因子的影响。
例如:商家为了留住消费者,采用发放优惠券的方式刺激长期消费,下表1就是一个原始的生存模型分析结果。其中,系数一栏数据为正表示会增大风险,为负则会减小风险;exp值是风险增加或减小的倍数;P值代表变化是否显著。结果表明:随着发放优惠券的总数量增加,消费者流失风险明显降低;而且每增加一个优惠券,流失风险会变为原来的0.94倍。
四、大数据统计分析在经济管理领域中的应用和新思路
4.1 应用
一是財务管理。资金资源使用是否合理,风险要素控制是否有效,均和财务管理密切相关。采用大数据统计分析方法,可对财务数据进行整合,为管理决策提供支持,为各种经济活动的开展提供保障。从财务管理的具体内容看,由于数据量大、涉及范围广、存在交叉和重复情况,应用大数据统计分析方法,能确保财务管理的规范性,发现异常数据,确保经济活动有序进行。
二是营销管理。在运营方面,采用大数据统计分析方法能找出企业的发展规律,对以往发展决策的科学性、合理性进行评价,进一步优化人、财、物等资源的配置。实现信息共享,打破部门隔阂,提高沟通效率和运行效率。在销售方面,对消费数据进行统计分析,能反馈产品在市场上的受欢迎程度,明确消费者的兴趣和偏好。从而打造出爆款产品,提高销售额、增加利润空间。
4.2 新思路
基于大数据技术下,未来经济统计工作的开展,一方面要更新统计观念。树立科学发展观,站在科学发展的角度开展经济统计分析工作,对传统的管理观念进行变革,融入大数据和信息技术。同时树立风险意识,明确统计工作中常见的风险项,制定完善的风险预案,及时有效化解风险。二要变革统计方法,例如:数据挖掘、神经网络、决策树法、遗传算法等,深入研究这些技术的应用,和统计工作有机结合,不断提高统计效率和数据质量。
五、结束语
综上所述,经济管理的基础就是数据的统计分析,大数据统计分析方法能提升管理水平,积极规避风险,目前主要用在财务管理、营销管理上。文章重点介绍了分布模型、留存模型和生存模型的应用,希望为经济管理活动提供技术支持,不断提高数据统计效率和质量。
参 考 文 献
[1]肖可成,黄倩.大数据在区域经济统计中的应用探析[J].科技经济导刊,2021,29(2):8-9.
[2]蔡学琴.大数据时代下关于经济统计应用问题的思考[J].全国流通经济,2020(34):178-180.
[3]林菁.试论大数据统计分析方法在经济管理领域中的运用[J].中国集体经济,2020(34):163-164.
[4]陈雪琴.大数据统计分析方法在经济管理领域中的应用[J].山西农经,2019(5):37.