基于多元线性回归的MSCI股票收益率影响因素分析
2019-04-05杨芊烨
杨芊烨
摘 要:本文在文献查阅总结基础上,以234只被纳入MSCI指数体系的上市公司为研究对象,分析探究其股票收益率的主要影响因素。选取2015年-2018年1季度的季度数据进行多元线性回归分析、方差分析及t检验。结果表明,净资产收益率、资产规模、沪深300市场指数与股票收益率表现出了较强的相关性,股民在购买股票时应予以重点关注。
关键词:股票收益率;多元线性回归;MSCI指数体系
一、绪论
(一)背景
随着时代的发展,居民财富水平的积累,股票作为一种资产配置方式已经走进千家万户,成为大众生活的一部分。但是大家更关心的肯定还是购买股票能获得多少收益,本文将股票收益率作为反映股票收益水平的指标。而股价的波动也受各种经济因素和非经济因素、宏观因素和微观因素的影响,所以本文将对此类影响因素展开研究。同时,2017年,摩根士丹利资本国际公司(MSCI) 宣布A股将被纳入MSCI指数,在经历了3次冲关后,A股第4次闯关终于成功。2018年5月15日,明晟公司(MSCI)正式将234只A股纳入MSCI指数体系,这是顺应国际投资者需求的必然之举,体现了国际投资者对我国经济发展稳中向好的前景和金融市场稳健性的信心。基于被纳入MSCI指数公司的重要性,本文以纳入MSCI指数的股票为研究对象,对其收益率影响因素进行分析。
(二)研究思路
(1)文献综述:首先对以往的文献和相关研究进行分析概括并总结前人以往的研究成果,尤其对被纳入MSCI股票收益率影响因素的研究。
(2)理论介绍:通过多元线性回归理论来分析股票收益率的影响因素,其中,运用大数据处理使数据误差较小,相对准确。
(3)实证分析:最后通过对MSCI上市公司的收益率增减情况和可能存在的因素进行实证分析,解释股票收益率和影响因素之间的相关性。
(三)研究方法
(1)文献查阅法:通过调查国内外调查文献来获得资料,从而了解股票盈利率的相关影响因素,便于掌握该问题的历史与现状,有助于认识到问题的全貌,寻找不同的研究视角。
(2)实证研究法:是科学实验研究的一种特殊形式,将现有的科学理论和实践结合,提出设计,用已有数据对过去状态进行分析。实证研究建立在提出的假设之上,经过证明若得出的结果和原有假设一致,则该假设成立,反之,则不成立。
二、文献综述
李训[1](2003年)针对我国上市公司的股票,研究影响其收益率的因素,以2001年6月1日至2002年5月31日时间段内我国沪深两所证券交易所总共157家上市公司的股票进行数据分析和研究。采用多因素模型,逐步回归方法,辨别不同行业影响因素的相关性,再建立回归方程模型,检验方差,对数据进行偏相关性的分析,分析回归方程所得相关因数。此文章的创新之处在于将可能存 在的影响因素划各个层次分类,不仅考虑了宏观经济因素还考虑了微观因素指标如公司盈利能力等。
李金凤[2](2014年)以2011年1月1日至2013年12月31日这一时间段为数据时间,从其中选取了于2011年之前上市的股票为研究对象,基于每股的收益率数据进行相关性研究,探求我国创业领域市场股票的定价。采用了CAPM、Fama-French和HAM模型对数据进行定量计算与回归分析。发现股票收益率与其Beta线性相关,而非系统风险则对其无影响。实证部分则采用了Fama-Macbeth的双程回归分析法,发现为检测到的Beta值与股票收益率之间有着正向的相关关系。本文只研究了在非完全竞争的环境下影响股票收益率的因素,而现实社会中,变动的社会经济环境与企业间的价格竞争、现金流都有可能影响股票受益率,需待进一步的完善。
刘瑗瑗[3](2012年)对我国股票市场的有效性进行研究,以1996年1月至2010年12月的中国上海交易所提供的736只股票数据为基准,采用三因子模型结合多元回归的方法与Fama-French的模型建立对数据进行回归分析。发现小规模公司组合比大规模组合的Beta值更低,但与Fama和French的研究发现相悖,价格作用在解释大公司时表现较为明显,而对于小公司则显得不明显,通过分析数据,得出我国股票市场有显著的效应和市场账面市值比,文献研究的增长型股票收益率与价值型之间没有明显的差异。
三、理论模型
(一)多元线性回归的一般形式
设因变量y为可以观测的随机变量,自变量X1,X2,...,XP为可以控制或测量的一般变量,则因变量与自变量的关系如下:
是未知参数,称为回归系数;为常数项;ε为随机误差,包含在Y中,但是不能被X和Y之间的线性关系所解释的变异性。对于一个实际问题,若获得了n组独立观测数据,i=1,2,…,n。则线性回归模型表示为:
写成矩阵方程为:
(二)求解方法
本研究利用最小二乘法(LSM)估计未知参数β1,β2,…,βp。为使方程能更充分地表现各点的分布规律,应该让各个实测点到线上的纵向距离平方和最小,此方法为最小二乘法。令
对未知量进行求导结果如下:
对方程组进行求解,即可求解得到未知参数β。
(三)方差檢验
在现实应用中,不能提前判断随机变量y与自变量间是否存在线性关系,所以在求线性回归方程之前,该回归模型只是一种假设,在得出最终结论之前,需要对随机变量y与自变量x1,x2,…,xp之间的线性关系进行显著性检验。若回归系数为零,则说明整体无线性关系,相反,则认为整体线性关系成立。假设如下:
不完全为零
接受H0,表明随机变量与自变量之间的关系不能用线性回归模型表示;拒绝H0,表明随机变量与自变量之间的关系可以用线性回归模型表示。若要建立针对H0的统计量检验,运用了方差思想,将因变量Y的总变异的和分解为回归部分和剩余部分。
其中SS总:,即总离均差平方和,反映未考虑到的X与Y的回归关系时的异象。
SS回归:, 即回归平方和,反映了在Y的总变异当中因为线性关系使得Y减小的部分,回归平方和数值越大,则回归效果越好
SS剩余:,即剩余平方和,各个实测点距离回归线越近,剩余平方和越小,说明直线回归的误差越小。
构建F统计量
F值越大,线性回归的效果越好,将查表所得的F值与通过计算所得到的F值做对比。当计算值小于查表值,说明线性关系不存在;反之,若计算值大于查表值,则存在线性关系。
3.4 t检验
在拒绝方差分析原假设的前提下,说明整体的线性关系成立,还需要判断各个回归系数是否为零。构建t统计量:
其中 , 为剩余标准差,SY.X越小,表示回归方程的估计精度越高。预先给定信度α,查t分布表,得到tα,与计算的t值比较,若│t│ 当有多种自变量对因变量没有明显的影响时,不能一次去掉所有显著的自变量,每次只能提除一个自变量。先剔除t绝对值最小的变量,再进行检验,直到保留的变量都对y有显著影响为止。 四、股票收益率影响因素的实证分析 (一)实证研究设计 本研究以多个潜在影响因素作为研究对象,利用Excel统计软件,通过多元回归分析等步骤,从选取的自变量(五个)层面来建立股票收益率影响因素的相关回归方程,以此来做出定量分析。 (二)数据的来源和选取 本回归分析所选取的数据来自于wind数据库和巨潮网,因为此数据库和网站数据较为全面且专业,所选取的数据的准确性和可靠性都可以得到保障。此实证分析主要研究各因素对股票收益率的影响,选取234只被纳入MSCI指数体系的上市公司为研究对象。为更加全面的反映数据内的金融关系,本文以2015年-2018年1季度的每季度的公司数据为基准,并对数据进行筛选,筛选标准如下:1)剔除存在数据缺失的样本;2)对数据进行观察,剔除异常的较大及较小值;3)数据处理、分析的软件采用Excel。 (三)所选自变量的定义 (1)净资产收益率ROE。净资产收益率ROE(Rate of Return on Common Stockholders' Equity)为净利润与平均股东权益的百分比,用以衡量公司运用自有资本的效率,体现运用自有资本获得净收益的能力。指标值越高,说明投资带来的收益越高,公司盈利能力越强。本文选择此指标代表公司的盈利能力,计算方法为净资产收益率=税后利润/所有者权益,其中所有者权益采用加权所有者权益,所得净资产收益率为是加权平均净资产收益率。 (2)资产规模Size。一个公司规模的大小指这家公司的资产多少,此因素也可能会对股票收益率产生影响。因此本文将资产规模也作为研究的自变量之一。鉴于上市公司资产规模一般在亿级,与其他指标差别过大,本文对资产规模进行对数处理。 (3)营业收入同比增长率Growth。营业收入同比增长率是指公司在某年一时间段内的收入与另一年同一时间段内的收入差与某一年该时间段内收入的比值,这一数据可以直观的反映出该公司企业在这一年中成长情况。而一个企业的成长能力与股票收益率的研究息息相关。计算方法为营业收入同比增长率=(当期营业收入-上期营业收入)/上期营业收入×100%,本文中营业收入增长率为季度同比增长率。 (4)杠杆率(负债/资本)Leverage。本文负债率是指资产负债表中负债总额与总资产的比率。杠杆率是衡量公司資本结构的指标,从侧面反映出公司的偿债能力。它最重要的作用就是来衡量公司的负债风险和还款能力,如果杠杆率太高,公司偿还负债压力大,容易破产,可能会对股票收益率产生负面影响。因此杠杆率也就成为了此研究的一个重要自变量。计算方法为负债率=负债/总资产。 (5)沪深300市场指数Market。沪深300指数是从沪深股市的两三千支股票中选出三百支业绩和规模较大的公司的股票构建的指数,可以对股票市场整体的情况分析也较为准确,反映整个股票市场的价格趋势。本文以沪深300指数为市场正常价格的参考指标。加入股票市场指数,可以有效控制因为股票市场行情变化带来的不同年份市值变化。 表2为本研究回归模型的方差分析结果。分析结果可以得出,模型方差分析构建的F统计量显著度小于0.01,符合标准,则整体方程线性关系成立。继续对各数据进行下一步的t检验分析,其分析结果如表3所示。P-value值反映的是给定原假设为真时样本结果出现的概率大小,t检验原假设为系数为0,因此此值越小越好。研究发现自变量中Growth和Leverage的值较大,P值都在0.01到0.05之间,其余各值都小于0.01。因此Growth和Leverage在1%显著度水平下不显著。说明在5%水平下,Growth和Leverage对股票收益率无影响,属于无关变量。而其他变量都对股票收益率有影响,其相关性为:ROE与股票收益率呈正相关,Size与股票收益率呈正相关,Market与股票收益率呈正相关。在1%显著度水平下,根据结果最终可以得到回归方程如下: Return=0.071923042+0.072894201ROE+0.028937591Size+0.022381048Market 五、总结与展望 (一)研究总结 本文以234只被纳入MSCI指数体系的上市公司为研究对象,对2015-2018年1季度的数据进行分析,在理论研究的基础上,选取了五个影响因素,对我国的股市的股票收益率进行研究。发现五个指标中的净资产收益率、资产规模、沪深300市场指数与股票收益率表现出了较强的相关性,股民在购买股票时应重点关注这些因素。现在正处于中国股市发展的重要阶段,相信此研究会对企业的发展和投资者有一定的参考价值。 (二)研究展望 通过自身的实践研究,发现影响股票收益率的因素复杂多样,本文可能未包含所有的影响因素。希望在今后的研究中,在提升研究水平的同时,能更加周到全面的考虑因素变化带来的影响,并与多样的分析方法相结合,来进行深一步的研究。 参考文献 [1] 李训.我国上市公司股票收益率影响因素的实证研究[D].重庆:重庆大学,1-83,2003. [2] 李金凤.中国创业板市场股票定价研究[D].厦门:厦门大学,1-47,2014. [3] 刘瑗瑗.中国股票市场的有效性实证研究[D].成都:西南财经大学,1-45,2012. [4] 范龙振,王海涛.上海股票市场股票收益率因素研究[D].上海:复旦大学,1-8,2003. [5] 张晶晶.中国上市公司股票收益率影响因素的实证研究[D].大连:大连理工大学 ,1-67,2007.