APP下载

基于MIC的持股集中度与股票价格关系研究

2014-02-13张海洋朱美琳

市场研究 2014年4期
关键词:股票价格集中度股价

张海洋朱美琳

基于MIC的持股集中度与股票价格关系研究

张海洋朱美琳

针对某证券公司内部的股票持股集中度日线数据,基于最大信息系数法,首先研究了其与自身股价日线数据间的关系,分析了股价操纵问题,然后将最大信息系数法与传统的线性回归方法进行了对比分析。

持股集中度;股价波动;最大信息系数;线性回归

一、引言

股价波动受多种因素影响,如经济因素、政治因素和人为操纵因素等。本文基于大数据挖掘方法MIC,从持股集中度这一角度分析了股价操纵问题。

由于国外的证券市场较为健全,因此国外对于股价波动与持股集中度的研究主要是从机构投资者的角度进行的。

Brady委员会(1989)调查发现,致使1987年美国证券市场全面崩盘的主要原因是机构投资者的指数套利策略和组合保险,而机构投资者所引致的流动性失败也加剧了其后几次金融危机的扩散。De Long、Shleifer和Summers等人(1990)[1]研究认为,动量交易策略一般会加剧股价的波动。Gabaix、Plerou和Stanley(2006)[4]的研究结果表明,大投资者的交易对价格产生的影响与大投资者交易量的平方根成正比。Froot和Teo(2008)[2]经过研究发现,不同风格类型机构投资者影响特定股票价格的能力,明显强于随机类型的机构投资者。King和GaoLei(2008)研究认为,机构投资者对于未来股价的预期和行为,从长期看与实际股价相关性较弱,而从短期看相关性则较强。

虽然我国的证券市场已经开始由以散户为主体变为以机构投资者为主体,但依然不成熟。2013年8月16号"光大证券乌龙指事件"就是存在股价操纵黑幕的明证,所以从持股集中度的角度对股票价格进行研究能为广大投资者提供一些指导。

吴齐华等(2001)[8]深入地研究了持股集中度与股价波动间的关系,研究显示,当期股价波动与持股集中度变动之间有较为明显的正相关关系。刘元海和陈伟忠(2003)[6]实证分析了股价波动与股东人数变化之间的关系,并以此研究了市场操纵过程。单国霞(2004)[5]对股价波动与持股集中度之间的相关关系进行了实证研究,结果表明,持股集中度与价格波动之间存在着正相关关系,也就是说,持股集中度增加,股价上涨,持股集中度下降,股价下跌,持股集中度越高,股价越走强。彭婷(2007)[7]对股东人数与股价间的相关关系进行了实证研究,发现股东人数并不总是与股价呈负相关关系,而是要受到持股结构的影响。

以上采用的主要是相关性分析与回归方法,这些方法的优点是简单、直观,但缺点是缺乏一般性,只适合于挖掘呈线性或近似线性的函数关系,无法探测到非线性或非函数的关系。本文采用了新的统计量MIC(最大信息系数),它满足大数据挖掘的一般性与公平性,与以上各种方法相比,它更适合于本次持股集中度与股票价格关系的分析。

二、持股集中度

不同的研究对于持股集中度的界定各不相同,现概述如下:

表1 持股集中度相关定义

以上几篇文章多是采用大股东所持股数占流通股的比例作为持股集中度的定义,而本文采用户均持股数(即流通股数除以户数)与流通A股股数的商作为持股集中度的指标(即持股集中度=户均持股数/流通A股股数),对样本股票进行实证分析。

三、最大信息系数法

最大信息系数法(Maximal Information Coefficient,MIC)由David N.Reshef和Yakir A.Reshef等人[3]于2011年12月提出,它满足数据挖掘方法所要求的一般性和公平性。一般性是指能识别的关系类型很广泛,公平性是指对相同噪声水平的不同关系要给出相同的得分。MIC的基本原理如下:

对于二元数据集D,可以将它的自变量分成x块,将它的因变量分成y块,这种分法叫x-y网格。给定一个网格G,对于G中的每个单元,取落在单元中的点数占总点数的比例作为该单元的概率,可以得到二元数据集D在网格G上的概率分布D│G,显然,对于固定的二元数据集D,不同的网格G会得到不同的分布D│G。

给定有限二元数据集D⊂R2、正整数x和y,则有I(*D,x,y)=max(ID│G),其中,最大值max是通过遍历所有x-y网格G获得的,(ID│G)代表分布D│G的交互信息(Mutual Information)。

MIC具有如下性质:MIC值介于0和1之间;统计意义上互相独立的变量间的MIC值趋向于0;所有处不连续的无噪声函数关系的MIC值趋向于1;更大一类的无噪声非函数关系的MIC值趋向于1;当函数关系近似于线性时,MIC值接近于R2。

四、持股集中度与股票价格关系实证研究

1.数据选择

本次分析所用的户均持股数据来自某证券公司,包括在其内部流动的所有证券的2009年6月30日~2012年11月13日日线数据。为了更有针对性地研究持股集中度与股价间的关系,我们只从中选择了1914只A股股票。分析所用的流通A股数据和股票收盘价日线数据来自CCER与Wind数据库。样本股票的选择标准如下:(1)沪深A股;(2)2011年1月1日之前上市;(3)2012年11月13日之前未退市;(4)股价日线数据的变异系数C.V≥0.1,即股价有大幅变动;(5)持股集中度日线数据的变异系数C.V≥0.1,即持股集中度有大幅变动。本文主要采用MATLAB、Excel等工具进行数据的分析与处理。

2.持股集中度与股票价格的MIC分析

本次实验分析了1914支股票的持股集中度日线数据与自身收盘价日线数据间的MIC值,并将结果按照大小排序,分别选出了MIC值最大和最小的4只股票,如表2所示。图1至图4显示了前4只股票的持股集中度与股票价格关系,其中“丹甫股份”与“天桥起重”的持股集中度以“×10-4”显示,“乐普医疗”与“沪电股份”的持股集中度以“×10-5”显示。

表2 持股集中度与股价波动间的MIC分析

图1 丹甫股份

图2 天桥起重

图3 乐普医疗

图4 沪电股份

图1所示丹甫股份的持股集中度与股票价格曲线分为两部分,左半部分是不相关函数关系,右半段是噪声几乎为零的非线性曲线。2011年3月14日限售股份上市后,丹甫股份的流通A股由3350万股变为8515.31万股,变动幅度较大,故持股集中度由2×10-5跳变为6×10-4。从右侧的非线性函数关系,几乎可以由持股集中度数据唯一地确定股票价格,这对预测股票价格走势具有极大的参考价值。

图3所示乐普医疗的持股集中度与股票价格曲线,左边是一条噪声几乎为零的光滑曲线,可以通过持股集中度数据精确地确定股票价格,而右边是两条分段线性函数曲线。

通过本次分析,证明了MIC兼具一般性与公平性的优势,它在考虑更大一类的关系的同时,也将噪声水平纳入到了评价体系中来。

3.持股集中度与股票价格的线性回归分析

本次实验采用了传统的线性回归方法分析了1914只股票的持股集中度日线数据与自身收盘价日线数据间的关系,并分别选出了R2最大和最小的4只股票,如表3所示。图5至图8显示了前4只股票的持股集中度与股票价格关系,其中“*ST韶钢”和“中兴通讯”的持股集中度数据分别以“×10-6”和“×10-4”显示,“新安股份”和“合兴包装”的持股集中度数据以“×10-5”显示。

表3 持股集中度与股价波动间的线性回归分析

图5 *ST韶钢

图6 中兴通讯

图7 新安股份

图8 合兴包装

图5所示的*ST韶钢与图6所示的中兴通讯的持股集中度与股票价格关系还较为理想,但把图7的新安股份的持股集中度与股票价格关系当作线性关系已算勉强,其实把它看成分段函数更为合适。图8所示的合兴包装的持股集中度与股票价格关系已经让人难以接受了,右半段的数据集噪声如此之高,根本难以从中获取有用的信息。

虽然R2排名2至4位的股票所呈现的都是线性正相关关系,但R2排名第1位的却是线性负相关关系,这与彭婷[7]的研究结论相一致,即持股集中度并不总是与股价呈正相关关系,而是要受到持股结构的影响。

4.MIC方法与线性回归方法的对比分析

本次实验,对比分析了MIC方法与Regression方法的优缺点。基于以上两次分析,分别选出了MIC排名与R2排名相差最大的4只股票,如表4所示。图9至图12显示了这4只股票的持股集中度与股票价格关系,其中“中粮地产”和“国海证券”的持股集中度数据分别以“×10-6”和“×10-5”显示,“陕鼓动力”和“*ST科健”的持股集中度数据以“×10-4”显示。

表4 MIC方法与线性回归方法的对比分析

图9 陕鼓动力

图10 *ST科健

图11 中粮地产

图12 国海证券

综合以上分析,MIC与线性回归法相比的优势集中体现在它的一般性与公平性上。

首先是一般性,结合"持股集中度与股票价格的线性回归分析"与"MIC方法与线性回归方法的对比分析"的实验结果,可见线性回归方法的优点是能有效挖掘出线性关系,但缺点也很明显,它对其他一些很重要的关系不灵敏,如中粮地产(图11)中的非线性关系和国海证券(图12)中的超越函数关系等,但与之相比,MIC方法能识别出这些关系。

其次是公平性,对比"持股集中度与股票价格的MIC分析"与"持股集中度与股票价格的线性回归分析"的实验结果可以看出,线性回归方法更看重线性函数关系,而往往不够重视它的噪声水平,如合兴包装(图8),虽然它的噪声很大,其实很难从中提取出有用的信息,但它的R2值仍然排到了第4位。而MIC得分最高的一批股票所呈现的并非全是线性函数关系,但相比于其他股票,这些关系的噪声水平很低,更加具有参考性,即MIC不仅考虑了关系模型,而且也综合考虑了噪声水平。

五、结束语

本文的创新之处在于:(1)虽然对影响股价波动的因素进行的研究很多,但从持股集中度这一角度进行研究的,目前国内外还很少;(2)应用了大数据挖掘算法MIC;(3)将新方法MIC与经典方法Regression进行了对比分析,挖掘结果具有较高的可信度;(4)分析结果能为证券市场的监管层提供有价值的建议。

[1]De Long J B,Shleifer A,Summers L H,et al.Positive feedback investment strategies and destabilizing rational speculation[J]. the Journal of Finance,1990,45(2):379-395.

[2]Froot K,Teo M.Style investing and institutional investors[J]. Journal of Financial and Quantitative Analysis,2008,43(04): 883-906.

[3]Reshef D N,Reshef Y A,Finucane H K,et al.Detecting novel associations in large data sets[J].science,2011,334(6062): 1518-1524.

[4]Stanley H E,Gabaix X,Gopikrishnan P,et al.Economic fluctuations and statistical physics:the puzzle of large fluctuations[J]. Nonlinear Dynamics,2006,44(1-4):329-340.

[5]单国霞.股价波动与持股集中度关系实证研究[D].杭州:浙江大学,2004.

[6]刘元海,陈伟忠.市场操纵过程的实证分析[J].经济科学,2003,(05).

[7]彭婷.股东人数与股价之间关系的实证研究[J].商场现代化, 2007(14).

[8]吴齐华,刘景,饶刚等.持股集中度与股价波动关系的实证分析[J].证券市场导报,2001(06).

(作者单位:南京大学工程管理学院)

猜你喜欢

股票价格集中度股价
基于GARCH族模型的重庆啤酒股票价格波动研究
新广告商:广告业周期性在弱化,而集中度在提升 精读
盘中股价升跌引起持股者情绪变化
我国金融机构股价和主要财务指标的相关性分析
保险公司资本结构、业务集中度与再保险需求研究
煤炭行业未来在提高集中度
股价创股灾以来新低的股票
近36年昌都市降水集中度与集中期时空变化特征
论股票价格准确性的社会效益
我国股票价格指数与“克强指数”的关系研究