主成分分析在企业发展评估的应用
2018-10-19易采桥卢天秀岳健民
易采桥,卢天秀,岳健民
(四川理工学院 a.管理学院;b.数学与统计学院,四川 自贡 643000)
0 引言
在西方经济学中,企业发展评估即是企业在国家产业政策和区域经济规划中的地位,其主要目的是分析和评判企业的公平市场价值。可通过企业盈利能力、资产质量及资产充足率等指标来反映和考核企业未来的发展能力和前景。
在多元统计分析中,主成分分析(Principal Component Analysis,简记为PCA)是以数据信息丢失最少为原则,为突出数据间的相似和差异,通过线性变换将多指标转化为少数几个有具体性的综合指标的多元统计分析方法[1-2]。在企业发展评估中,为了全面反映企业发展状况和避免遗漏重要信息,应尽可能考虑多指标,但随着指标数目的增多,问题亦越复杂,而通过主成分分析法筛选出的几个综合指标可反映原来指标至少85%的信息[3],且相互独立,无重叠信息,因此,从数学的角度,PCA实际上是一种降维处理技术,将众多相关变量进行综合压缩,从而简化数据结构。主成分分析是因子分析的特殊形式,分析计算软件为SPSS20。
1 主成分分析建模原理及步骤
1.1 原理
将原变量指标记为x1,x2,…,xp(p∈N,N为自然数),综合指标记为z1,z2,…,zm(m∈N,m≤p)为,即有
式(1)中,z1,z2,…,zm分别为原指标x1,x2,…,xp的第1、第2、...、第m个主成分;li1,li2,…,lip称为x1,x2,…,xp在主成分zi上的荷载(1≤i≤m)。
1.2 步骤
事实上,各指标包含变异程度上的差异信息和相互影响程度上的信息,主成分分析结果会受量纲的影响,若各变量单位不同,每次改变量纲输出结果亦不同,故一般会对数据进行标准化处理[4],然后用相关系数矩阵进行分析。但实际上,数据标准化过程中,在消除量纲影响的同时,可以使得各指标的方差均为1,从而去除了各指标变异程度的差异信息,因此只需对数据进行均值化处理即可。
主成分个数的选取主要由累计贡献率来决定,贡献率越大,所包含的原始数据的信息也越全面,当累计贡献率达到85%及以上时,即:
满足要求[4]。
因此,用主成分分析法建模的步骤为:
step1:对原始数据进行标准化;
step2:计算样本的相关系数矩阵;
step3:计算相关系数矩阵的特征值和对应的特征向量;
step4:选取重要的主成分,并给出主成分表达式;
step5:计算主成分得分。
2 应用实例
表1是2013—2016年某国有银行的财务状况,根据所采集的各指标数据分析影响该银行发展的主要指标。
表1 财务状况原始数据
下面应用软件SPSS20(该软件内部自带默认数据标准化处理)对采集的10项财务指标进行主成分分析。
首先,导入数据后按照步骤分析→降维→因子分析执行。
接下来再执行下列步骤:
描述→系数→抽取→相关性矩阵→碎石图→旋转→最大方差法→载荷图→确定。
执行完毕后得到各财务指标的相关系数。
用x1,x2,…,x10依次代表平均总资产回报率、净利息收益率、风险加权资产收益率、成本收入比、不良贷款率、拨备覆盖率、贷款拨备率、一级资本充足率、资本充足率和总权益对总资产比率,相关系数矩阵如下:
此矩阵显示的是各指标间的相关性,若两指标间的相关系数的绝对值越大,说明这两指标的联系也越大。从上表中可得x10与x6和x10与x8的相关系数的绝对值均为0.995,相对其余指标间的相关系数绝对值是最大的,从而,总权益对总资产比率与拨备覆盖率、总权益对总资产比率与一级资本充足率的联系最大;而x2与x9的相关系数的绝对值只有0.291,说明资本充足率与净利息收益率的相关性最差,指标间的相关性都可按此分析。
根据相关系数矩阵得出的特征值和特征值的累计贡献率见表2。
表2 指标方差分解主成分提取分析表
现在来确定主成分。主成分的个数选取原则为累计贡献率至少为85%的前m个主成分,且累计贡献率越大时选取的主成分个数越精准。由上表可知,前两个主成分累计贡献率达到97.954%,即这两个主成分可包含原始数据的大部分信息,但仅仅根据累计贡献率来选取主成分个数有一定误差,还可结合主成分对应的特征值大于1这一原则进行主成分选取[3],SPSS20软件中的碎石图可反映各主成分所对应的特征值大小,如图1所示。
图1 碎石图
综合主成分提取分析表和碎石图,这里可选取前两个主成分继续分析。这两个主成分分别为:
将旋转中的载荷图勾选上,确定后则可生成图2。此载荷图比较直观地表明了这些指标之间的亲疏关系。观察图2可知,x5、x8和x10三个指标聚集在一起,表明这三个指标联系紧密;而x1、x3、x6和x7四个指标聚集在一起,表明这四个指标联系紧密。此外,指标位置与中心位置距离越大,说明指标与主成分间的相关系数越大。
图2 各财务指标在主成分空间上的投影
各指标主成分载荷矩阵为:主成分载荷矩阵显示了各指标与主成分之间的关系,若指标与某主成分的关联系数的绝对值越大,则二者联系越紧密。易得指标x1、x3、x5、x6、x8和x10在第一主成分上的载荷比较高,说明第一主成分较好的反映了这6个指标的信息;同理可知,x2、x4、x7和x9在第二主成分上的载荷比较高,说明第二主成分较好的反映了这4个指标的信息。所以用两个主成分已可以较全面的解释原来的指标。
为了纵向分析企业的发展,再次利用软件SPSS20计算出各主成分得分为:
最后,计算得出综合得分进行排名,得到该国有银行综合得分和年度效益排名为:
从综合得分可知2013年的发展情况最好,而2016年的企业发展情况最差,还可以清晰地看出该国有银行的发展日渐衰败,有走下坡路的趋势。
综上所述,通过对企业的各指标进行主成分分析之后,可从大量的指标中选出主要指标,用少数几个指标代替,同时也较大程度上保持了原来信息的完整性。通过本文的分析,可以确定影响该企业的主要指标为拨备覆盖率、总权益对总资产比率、不良贷款率、风险加权资产收益率、一级资本充足率和平均总资产回报率,其次为净利息收益率、资本充足率、成本收入比和贷款拨备率。
3 结语
国有企业始终是中国追求将创新作为基础的发展道路的基本力量,对国有企业的发展评估显得尤其重要。此类评估涉及多个变量,变量个数太多就会增加课题的复杂性,人们自然希望变量个数较少而得到的信息较多。但在很多情形当中,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。
主成分分析利用降低指标维数、去除指标间的相关性等方法,对于原先提出的所有变量,将重复的变量(关系紧密的变量)删去多余,建立尽可能少的新变量,使这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息,这就大大减少了工作量[6-10]。
主成分分析的应用涉及许多领域,尤其在评估问题中,伴随数学变换过程生成了信息量权数和系统效应权数,比认为确定权数更客观,因此,主成分分析在企业发展评估中将会得到更加广泛的应用。