沪市主板与深市创业板相关性研究及实证分析
2014-04-29康桥田新民
康桥 田新民
摘要:证券市场中的相关性分析是研究证券市场中资产价格之间是否存在某种依赖关系,并对具体有依赖关系的资产探讨其相关程度及相关方向。利用Pearson和Spearman相关系数研究沪深证券市场中蓝筹板块 (上证50,上证180和深证100为代表)与成长股板块(中小板指和创业板指为代表)之间的相关性,有助于投资者从上述两个板块中选择相关性较好的股票来建立投资组合。通过利用2013——2014年的沪深股票市场的交易数据进行实证分析,发现在不同的时间阶段蓝筹板块与成长股板块之间或表现出显著相关性或表现出不相关性,而在蓝筹个股和成长个股之间则存在某种非线性关系。如果我们能够识别出某类非线性关系,则可以利用这种非线性关系来最大化我们的投资组合。
关键词:股票价格;相关系数;非线性关系;蓝筹股票;成长股票
中图分类号:F832
股票价格的波动受到国内外宏观经济政策,行业发展规划,上市公司业绩及投资者的市场预期等多种因素的影响。从最近年份的市场表现来看,主板,中小板和创业板受到某种因素影响时,其对应股票价格波动的规律也是不一样的。为此,我们有必要研究这些板块之间的相关性。相关性可以用相关系数来表示,两组变量的相关系数绝对值的大小和正负号决定了它们之间的相关性强弱及方向。在证券市场中,如果两个股票的相关系数大且正相关,表明这两只股票波动具有一致性,反之,如果两个股票的相关系数大且负相关,表明这两只股票波动具有非一致性。Spearman相关系数不仅可以表示变量间的线性关系,也可以揭示变量之间的非线性关系,而Pearson相关系数仅能表示变量间的线性关系。
一、相关系数定义
通常我们用统计学中的相关系数来描述两组数据之间的相关性。在统计学中常用的相关系数有两类:一种是Pearson系数;另一种是Spearman系数。这些系数的取值范围都是从[-1,1]。相关系数的绝对值越接近1,就代表这两组数据的相关性就越好。接近于0就代表这两组数据很可能是独立的。
Pearson系数假设两组数据有着线性关系,该相关系数被广泛用于分析线性回归的准确性上。当其中一组数据呈现增长趋势的时候,另一组数据会以常数的速率增长。反之,当一组数据呈现下降趋势的时候,另一组数据也会以常数的速率减少。其计算公式为:
然而,股票市场并非都是简单的线性关系,即增长速率都是固定并且方向都是完全單一的。在某些情况下,尽管两种股票并非完全独立,但是Pearson系数却很低。为了更好的描述这些数据,我们需要使用Spearman相关系数。
Spearman相关系数首先把数据转换成为级数,比如(10.3,21.4,5.2)将会被转换为(2,3,1)。
假设 和 为转换后的级数集。Spearman相关系数的计算如下:
Spearman相关系数的计算通过把数据转换成级数,从而降低了一些噪音的影响。并且,当相关性是非线性,比如指数或者对数关系的时候,Spearman的相关系数的计算结果比起Pearson的结果更容易显示相关性。因为级数使得变换的影响更小,与Pearson系数强制将关系理解为线性关系不同,Spearman系数可以更好的把非线性相关性表示出来。
二、数据分析
证券市场一年的交易日大约为220日,在这段期间中,一些股票存在转股,送股,配股和分红等行为。这样,发生在转股,送股,配股和分红的除权日前后两个交易日的价格是不可比较的,需要对原始数据进行复权处理。在本文中,我们选取的数据是从2013年8月19日到2014年8月15日的日收盘价格的复权数据。
为了计算相关系数,我们将上述日复权数据转换为日收益率,具体计算方法为,设Pt为t日的成交价, Pt+1为t+1日的成交价,那么收益率可以表示为以下公式:
三、相关性计算及分析
我们首先计算180指数与创业板指数之间的相关性,图1是关于这两个指数的Pearson相关性的关系描述。
首先,两个指数从2013年8月22日到2014年6月12日的201个指数数据被转换成了200个收益率。然后对他们的每30对连续的收益率进行相关系数的计算。因为有200个数据,所以从第1数据到第30个,从第2个到第31个以此类推每个指数将会有170个这样连续间断。这两组指数的收益率在这170连续段的系数表示了这两个指数在这些时间段的相关性表现。
从图1中我们不难看出随着时间的变化,180指数与创业板指数的相关系数呈现出相关性较高(相关系数大于0.6),弱相关性 (相关系数在0.3到0.4之间),和不相关性 (相关系数小于0.2)等三种现象。这就解释了在不同周期具有蓝筹股票投资组合的投资者在更新投资组合时需要充分考虑是否选择成长股票。
我们再计算180指数的成份股(共有180只股票)与创业板中的298只股票,共有478个股票的相关系数。我们利用统计软件包R计算这些股票的Pearson和Spearman相关系数。我们发现在180指数的成份股与创业板中股票之间存在一些非线性关系,我们选择Spearman系数的大于0.7,且Pearson系数比Spearman系数至少小0.3。我们选择满足这些条件的相关系数,不矢一般性,选择5个,放在表1中。
我们考虑表1中的一对股票,代码为600435(180指数成份股)和代码为300175(创业板股票),并将它们的收益率关系表示在图2中。
从图2中我们可以发现股票600435和股票300175的价格之间呈现出显著的非线性关系。在某些时间股票600435的价格变化导致股票300175的价格快速上涨,在在有些时间股票600435的价格在变化而股票300175的价格在横盘。图2揭示出这两种股票之间存在类似二次关系。事实上,如果两只股票在具有较大Spearman系数而同时Pearson系数较小的情况下,它们之间的关系一般都是非线性的。
四、总结
蓝筹板块与成长股板块指数之间的相关系数的变化为投资者动态调整其投资组合,即在何时选择成长股票加入组合或从组合中删除成长股票,提供了决策依据。我们可以通过分析蓝筹股票与成长股票之间的Pearson和Spearman相关系数的关系来确定他们之间的非线性关系,从而为增加投资组合的收益提供一种量化工具。根据这些工作,我们发现相关系数作为一种重要的投资分析工具在A股市场中将获得应有的应用。
参考文献:
[1] 周雪艳,张爱文. 沪深A股市场相关性分析[J].数理统计与管理,1999(7).
[2] 张慧明,朱涛.上海证券市场A股市率与收益率相关分析[J].合肥工业大学学报(社会科学版),2005(2).
[3] 柴文义,肖春来.股票价格 (指数) 与收益率的相关分析[J].北方工业大学学报,2005(3).
[4]张琦,闫洁.中国股权投资市场回顾与展望[J].中国市场,2014(7).
(编辑:周南)