基于Pearson相关系数模型对股票间相关性研究
2015-11-18张筱梅朱家明
张筱梅,朱家明
(1.安徽财经大学金融学院;2.安徽财经大学统计与应用数学学院,安徽蚌埠 233030)
基于Pearson相关系数模型对股票间相关性研究
张筱梅1,朱家明2
(1.安徽财经大学金融学院;2.安徽财经大学统计与应用数学学院,安徽蚌埠 233030)
针对股票间的相关性,主要运用Pearson相关系数、社会网络的相关理论,从数据挖掘、数量统计、实证分析的角度出发,利用Excel和UCINET分别建立Pearson相关系数、股票网络、CONCOR分块等模型.运用个股回报率指标建立Pearson相关系数模型度量股票间相关性,并根据相关性矩阵构建股票网络,最后通过CONCOR分块模型得到对股票市场行业的分块.
股票间相关性;Pearson相关系数;社会网络模型;UCINET
影响股票价格的因素多样导致股票市场变动的不可预测,如何理清同一板块不同行业股票之间交错的影响关系,分析股票之间内在的影响机制,关键在于对股票间相关性关系的研究,本文基于pearson相关系数模型分析同一板块中股票之间的相互影响;在股票间相关关系系数的基础上,选择合适的阀值,阀值用于衡量股票间影响关系的强弱,在此基础上建立股票间相关系数的网络模型.
1 数据的获取与假设
本文数据来源于安徽财经大学校内数学建模模拟题,为方便解决问题提出四条假设:(1)假设股票没有分红,考虑现金红利再投资的周个股回报率和不考虑现金红利再投资的周个股回报率相同;(2)假设选取的样本股票能代表这一类型股票市场的整体状况;(3)假设不同类型市场之间的相关性不强,所以选取同一类型股票市场内的股票数据进行相关性研究;
2 不同股票间的相关性分析
2.1 研究思路
根据赛题附件中股票的相关数据选取合适的指标,利用时间序列相关性知识,分析股票间的相关性,并建立合适的模型度量股票间的相关性.
首先,本文选取深圳B股为样本进行股票间相关性分析.其次,选择两支股票相同交易周份的数据进行计算,如果某个交易周份只有一只股票有交易而另一只股票停牌等原因缺失的数据在计算过程中被忽略.最后,对筛选的数据选取合适的指标进行股票间相关性分析.
2.2 研究方法——Pearson相关系数计算公式
个股回报率计算公式:
式中hi为周个股回报率;si为周收盘价格;ki为周开盘价价格;i为证券编号.
Pearson相关系数计算公式:
式中E为数学期望;cov(x,y)为x,y之间的协方差;ρxy为x,y之间皮尔逊相关系数;x和y是任意两支股票所对应的个股回报率;σx,σy为任意两支股票所对应个股回报率的方差.
2.3 数据处理
选取市场类型为8(深圳B股),交易周份为2013年8 到32周的所有股票,利用上述模型求得各股票间相关性(鉴于所得表格数据太多,这里从略).
2.4 结果分析
Pearson相关系数是一种度量两个变量间相关程度的方法,文中使用该指标度量股票间相关性.并对Pearson相关系数模型做出三点评价:⑴以个股回报率为变量指标,利用Pearson相关系数模型分析股票间相关性;⑵Pearson相关系数要求变量是连续变量,本题中以周作为交易周分,即可视为连续变量;⑶每个证券代码代表的股票的个股回报率均为上市公司运营情况所导致股息的变化和市场利率决定,故各变量之间相互独立,符合Pearson相关系数约束条件.
3 建立股票网络模型
3.1 研究思路
在前文中以市场8为例得出股票间的相关系数,在此基础上,构建该股票市场环境下股票间的相关系数矩阵.其次,分别选定阀值为0.5,0.55,0.6,0.65,0.7,0.75构建社会网络,并统计对应的结点个数,观察变化趋势,得出较合理的阀值,构建对应的股票网络.最后,从中心性角度分析网络中各股票间的关系,得出整个股票网络的特性.
定理1网络构建原则:本文中的网络是基于股票价格相关系数Cij而建立起来的股票网络,由于股票间的关系只有两种情况:有关系和无关系.选定了阀值后,如果两支股票的相关系数Cij>P,则说明两支股票间有关系,记作1,否则记作0. 3.2数据处理
以问题二中计算所得44支股票间的相关系数构建相关系数矩阵,部分数据如图1:
图1 相关矩阵部分截图
将相关系数矩阵转化为UCINET数据,在给定阈值0.5的基础上,分别选取一系列新的阈值点,构建相应的网络结构图,并算出每个阈值所构建的网络的最大连通子图的节点个数,如表2所示.
根据表2,做出节点个数随阀值变化的趋势图,如图2.
图2 节点变化趋势图
由图2可得,随着阀值的不断增加,网络图的节点个数不断减少,整个网络中的散点数不断增加,越来越多的节点成为独立的散点,同时网络结构业越来越清晰.因此,选定0.65为最佳阀值,对原相关系数矩阵进行筛选,做出对应的股票网络结构图如图3:
图3 股票网络结构图
3.3 中心性分析
分析股票市场的网络中心性时,本文从度数中心度及中间中心度两个方面进行分析.
分析度数中心度
一个核心点是处在一系列关系“核心”位置的点,该点与其它点有多个直接联系.因此,对点A的度数中心度的最简单的测量就是运用图中点A的各种度数,即与点A直接相连的其他点的个数.如果用CAD代表绝对度数中心度,那么,一个点x的绝对度数中心度的表达式为CAD(x).如果某点具有最高的度数,则称该点居于中心.
由于上述网络是无方向的,上述公式为:C'RD(x)=x,其中n是网络的规模.如果C'RD(x)=0,点x就是一个孤立点;反之,如果C'RD(x)=1,点x就是图的核心点之一.运用UCINET软件对阀值为0.65时的数据进行分析,以各个股票为中心求出中心度,按照中心度降序排序,得出各股票分析数据,如图4:
从股票网络总体分析,股票200521度数中心度最大,相对中心度及相关份额也高于其他股票,在股票网络图中占据着中间的位置.但是,度数中心度大于20的股票仅有9支,占有31.4%的市场份额,因此可见,不同的股票间存在明显的分水岭,具有核心影响力的股票只是股票市场中的小部分,其他股票间的关联程度相对较弱.
5 结束语
相关性系数模型与实际的联系紧密,利用EXCEL和UCINET软件对数据进行处理并作出各种分析图形,使股票网络更加简洁、明了、直观的呈现,易于理解和接受;但是无向网络模型只能根据相关性系数体现两只股票之间的相关性,但是却不能体现两只股票间定向影响关系,不能体现两只股票谁对谁的影响力较强.
本文通过相关系数,中心度分析等方法,对股票间相关关系进行分析,为股票间相关关系的分析研究提供了更广泛的思路.
〔1〕http://www.szse.cn/;2014年8月27日;深圳证券交易所.市场数据查询.
〔2〕http://www.eastmoney.com/;2014年8月27日;东方财富网.证券编号查询.
〔3〕余寿喜,韩立岩.中国股票市场行业交易额分布特征研究[J].首都经济贸易大学学报,2006.
〔4〕杨桂元,黄己立.数学建模[M].合肥:中国科学技术大学出版社,2008.
〔5〕罗家德.社会网分析讲义[M].社会科学文献出版社,20010.
F833.48
A
1673-260X(2015)05-0032-02
国家自然科学项目(11301001);安徽财经大学教研项目(acjyzd201429)