基于SOM网络的上市公司风险评价聚类分析
2013-10-27华中科技大学武昌分校基础科学部湖北武汉430064
龙 松 (华中科技大学武昌分校基础科学部,湖北 武汉 430064)
向丽苹 (武汉人福医药集团股份有限公司,湖北 武汉 430223)
基于SOM网络的上市公司风险评价聚类分析
龙 松 (华中科技大学武昌分校基础科学部,湖北 武汉 430064)
向丽苹 (武汉人福医药集团股份有限公司,湖北 武汉 430223)
基于SOM的聚类功能,对上市公司进行了分类评价。数值计算表明,该模型对上市公司的聚类结果令人满意,对投资者如何准确地选出优质股票具有前瞻性的指导意义。
SOM网络;聚类;风险评价
随着我国市场经济建设的快速发展和市场经济体制的不断完善,人们的金融意识和投资意识日益增强。近年来,中国的股票市场迅速发展壮大,股票带来丰厚的利润的同时,也伴随着高额的风险,而作为投资者,当然是追求投资收益的最大化和投资风险的最小化,因此了解股市、分析股票成为股票投资过程中不可或缺的一个组成部分。而分析股市以及股票,最关键的就是要分析其代表的上市公司,因此,理智的股票投资者必须重视上市公司的经营业绩和发展前景,对分析对象有一个大致的判断[1-2]。
目前对上市公司的聚类分析,大多采用的是相关、回归、因子和主成分分析等传统的统计方法,这些方法多是建立在线性模型基础上的,然而上市公司的经营业绩与其驱动因素之间具有很复杂的非线性关系,因此传统的一些聚类方法也难以胜任这些工作。自组织特征映射(SOM)模型判定方法则能够根据学习获得的经验知识对复杂问题进行合理的判断,具有高度的容错能力,从而可以突破以上障碍。笔者正是基于SOM的聚类功能,拟将对上市公司进行了分类评价,通过对其结果进行分析,以帮助投资者更好的判断股市和股票。
1 SOM神经网络模型与算法
1.1SOM网络结构
1981年芬兰Helsink大学的T.Kohonen教授提出了一种自组织特征映射网(self-organizing feature map,SOM),又称Kohonen网。生物学研究的事实表明,在人脑的感觉通道上,神经元的组织原理是有序排列的,因此当人脑通过感官接收外界的特定时空信息时,大脑皮层的特定区域兴奋,而且类似的外界信息在对应区域是连续印象的。大脑的这种对于某一图形或某一频率的特定兴奋过程正是自组织特征映射网中竞争机制的生物学基础。因此,Kohonen认为,一个神经网络接收外界输入模式时,将会分为不同的对应区域,各区域对输入模式具有不同的相应特征,而且这个过程是自动完成的。
在以上原理基础上,SOM网络将实现对生物神经系统进化过程的计算机模拟,将任意维输入模式在输出层映射成一维或二维图形,并保持其拓扑结构不变;也能够根据样本出现在输入空间的概率密度自组织地形成与这个概率分布密度相对应的神经元空间分布密度关系,是一种自组织和自学习的网络。SOM网络分为上下两层:下层为输入层,上层为输出层。输入层中的神经元节点数量与其输入列矢量维数一致,其功能是获取数据。输出层神经元构成一维或二维网格(见图1)。SOM 网络是全连接的,每个输入神经元节点都同所有的输出神经元节点相连接。
图1 SOM二维网络结构
1.2SOM运行原理
SOM网的运行分训练和工作2个阶段[3]。在训练阶段,对网络随机训练集中的样本。对某个特定的输入模式,输出层会有节点产生最大响应而获胜,而在训练开始阶段,输出层哪个位置的节点将对哪类输入模式产生最大响是不确定的。当输入模式的类别改变时,二维平面的获胜节点也会改变。获胜节点周围的节点因侧向相互兴奋作用也产生较大响应,于是获胜节点及其优胜邻域内的所有节点所连接的权向量均向输入向量的方向作程度不同的调整,调整力度依邻域内各节点距获胜节点的远近而逐渐衰减。网络通过自组织方式,用大量训练样本调整网络的权值,最后使输出层各节点成为对特定模式类敏感的神经细胞,对应的内星权向量成为各输入模式类的中心向量,并且当2个模式类的特征接近时,代表这2类的节点在位置上也接近,从而在输出层形成能够反映样本模式类分布情况的有序特征图。SOM网训练结束后,输出层各节点与各输入模式类的特定关系就完全确定了,因此可用作模式分类器,当输入一个模式时,网络输出层代表该模式类的特定神经元将产生最大响应,从而将该输入自动归类。
1.3SOM学习算法
SOM网采用的学习算法称为Kohonen算法[4],是在胜者为王算法基础上加以改进而成的,其主要区别在于调整权向量与侧抑制的方式不同。在胜者为王算法中,只有竞争获胜神经元才能调整权向量,其他任何神经元都无权调整,而SOM网的获胜神经元对其邻近神经元的影响也是由近及远,由兴奋逐渐转变为抑制,因此其学习算法中不仅对获胜神经元本身要调整权向量,它周围的神经元在其影响下也要不同程度的调整权向量,这种调整函数通常有墨西哥帽函数,大礼帽函数和厨师帽函数。
2 基于SOM网络的上市公司分类模型
2.1分类指标与数据样本
在较为全面的考察了在目前上市公司年报信息范围内可能获得的各种财务比率指标之后,经过仔细筛选,最终选取了6个指标,这6项指标基本能够反映一个上市公司的大致情况。所有数据来自于新浪网站(http://finance.sina.com.cn/stock/),选取20个上市公司的财务比率数据作样本,数据截止2012年6月31日。
1)净资产收益率 又称股东权益收益率,是净利润与平均股东权益的百分比,是公司税后利润除以净资产得到的百分比率,该指标反映股东权益的收益水平,用以衡量公司运用自有资本的效率。指标值越高,说明投资带来的收益越高。
2)净利润增长率 净利润是指利润总额减所得税后的余额,是当年实现的可供出资人(股东)分配的净收益,也称为税后利润。它是一个企业经营的最终成果,净利润多,企业的经营效益就好;净利润少,企业的经营效益就差,它是衡量一个企业经营效益的重要指标。净利润增长率代表企业当期净利润比上期净利润的增长幅度,指标值越大代表企业盈利能力越强。
3)流动资产周转率 指企业一定时期内主营业务收入净额同平均流动资产总额的比率,流动资产周转率是评价企业资产利用率的一个重要指标。
4)速动比率 又称“酸性测验比率”(Acid-test Ratio),是指速动资产对流动负债的比率。它是衡量企业流动资产中可以立即变现用于偿还流动负债的能力。
5)资产负债率(Debt Asset ratio) 是指公司年末的负债总额同资产总额的比率。 表示公司总资产中有多少是通过负债筹集的,该指标是评价公司负债水平的综合指标。同时也是一项衡量公司利用债权人资金进行经营活动能力的指标,也反映债权人发放贷款的安全程度。
6)现金流量比率 是指经营活动现金净流量占总现金流出的比率。该比率用于衡量企业经营活动所产生的现金流量可以抵偿流动负债的程度。比率越高,说明企业的财务弹性越好。通过该比率分析,可了解维持公司运行、支撑公司发展所需要的大部分现金的来源,从而判别企业财务状况是否良好、公司运行是否健康。一般而言,公司现金流入以经营活动为主,以收回投资、分得股利取得的现金以及银行借款、发行债券、接受外部投资等取得的现金为辅,是一种比较合理的结构。
2.2SOM聚类算法主要参数设置
1)输入层 输入层参数为6个指标,共计6×20个数据。
2)输出层 输出层为二维平面空间,由4个神经元构成(2×2)。
3)训练参数 初始学习速率取为0.1,最大训练次数为25次。
在Matlab7.0软件环境下,利用神经网络工具箱,编写了如下程序:
P=input(‘请输入样本数据’);P=normc(P);[R,Q]=size(P);
net=newsom(minmax(P),[2,2]);W0=rands(4,R)*0.1;
net.trainParam.epochs=25;net.trainParam.show=5;
net.iw{1,1}=W0;net=train(net,P);A=sim(net,P)
3 上市公司的分类结果和评价分析
将所有数据输入网络进行训练,经过计算调整,最终得到如下分类结果:①第1类。3,7,14,16,20(公司编号);②第2类。5;③第3类。1,9,17;④第4类。2,4,6,8,10,11,12,13,15,18,19。分别求出类别中每一个指标的平均值,形成各个类别的特征指标向量,其聚类中心如表1所示。
表1 各类别在各指标下的均值比较
由表1可以看出,第1类发展较均衡,特别是成长能力,盈利能力都是最强的,而且其债权发放贷款安全程度高,财务弹性也较好,该类值得投资;第2类主要好在债权发放贷款安全程度高,经营效率和偿债能力一般,可少量投资;第3类盈利能力和成长能力较好,偿债能力和债权发放贷款安全程度较高,可以适当投资;第4类总体最差,虽然偿债能力较好,但盈利能力偏差,成长能力最差,而且财务弹性也很差,建议不投资。以下列出SOM模型所得第1类(见表2),以供参考。
表2 SOM模型所得第1类股票各指标值
当然,由于其数据截止2012年6月31日,随着时间的推移,各上市公司的财务数据会不断更新,投资者只要按照以上步骤重新输入数据,即可得到新的分类结果,以便更好的为投资者参考。
4 结 语
SOM网络模型是聚类分析的一种新方法。利用SOM网络进行股票分析,不仅具有收敛速度快、计算量小、计算复杂性低的特点,而且其具有自学习、自适应性和强容错性,可实现分类的智能化。笔者把它引入上市公司分类,得到满意的结果,对广大投资者来说,具有前瞻性的指导意义。
[1]徐志超,梁艳春,时小虎.基于SOM网络的股票聚类分析方法[J].计算机工程与设计,2008,29(9):2426-2428.
[2]张吉刚.基于SOM网络的上市公司聚类分析[J].咸宁学院学报,2007,27(6):1-3.
[3]韩力群.人工神经网络理论、设计及应用[M].北京:化学工业出版社,2007.
[4]丛爽.面向MATLAB工具箱的神经网络理论与应用[M].合肥:中国科技大学出版社,2009.
2012-11-24
龙松(1978-),男,2001年大学毕业,硕士,讲师,现主要从事金融工程、概率统计方面的教学与研究工作。
O213
A
1673-1409(2013)04-0033-03
[编辑] 洪云飞