APP下载

基于Apriori算法的机构投资者投资偏好研究

2012-04-29郁露露

会计之友 2012年30期
关键词:机构投资者关联规则

郁露露

【摘 要】 近年来,在“超常规发展机构投资者”的战略指导下,我国证券市场上机构投资者队伍迅速壮大。以证券投资基金、券商为代表的机构投资者正成为证券市场的主要参与者。机构投资者对市场的影响逐渐加大,逐渐成为市场的主导。文章采用Apriori算法对机构投资者投资偏好进行关联规则的挖掘,初步探讨了影响机构投资者投资的企业特征,对于分类协调和发展机构投资者,塑造多元化均衡的投资者结构,进一步稳定证券市场,提高证券市场成熟度和市场效率具有重大意义。

【关键词】 机构投资者; 关联规则; 持股偏好

一、引言

自从2000年我国提出“超常规发展机构投资者”的发展战略以来,陆续又出台了一系列鼓励机构投资者发展的政策、措施,许多“新型”投资机构获批。2001年9月,我国第一只开放式基金——华安创新发行;2002年12月,引入QFII试点;2004年10月,放宽机构投资者进入股票市场的限制,允许保险机构直接参与一级与二级市场交易。央行发布的《2006年中国金融市场发展报告》中明确指出,机构投资者已成为我国金融市场的主体。截至2009年9月底,各类机构持股市值占我国资本市场流通市值的比重超过六成。我国证券市场的结构正经历着由分散的中小投资者向专业化的机构投资者的历史性变化。同时,由于机构投资拥有的流通股股票金额较大,对上市公司的股价变化、投融资决策、股利政策、公司治理结构等方面都会产生很大影响,因此,研究机构投资者的持股偏好,对于协调发展各类机构投资者,塑造多元化均衡的投资者结构,进一步稳定证券市场,提高证券市场成熟度和市场效率具有重大意义。

二、文献回顾

国外学者对机构投资者持股情况的研究主要是从对基金或机构投资行为特征的研究和基金投资行为对市场收益和波动性影响这两个角度展开的。其中,基金投资行为对市场收益和波动性影响又分为两类投资策略。第一类就是反馈交易策略,即以股票过去的表现作为买卖判断的主要基础。DeLong Shleifer,Summer and Waldmann(1990)验证了正反馈策略是买入近期的强势股,卖出近期的弱势股;Lakonishok,Shleifer and Vishny(1992);Gompers and Merick(2001)的研究反映出负反馈策略指卖出近期的强势股,买入近期的弱势股。第二类是羊群效应,Grinblatt,Titman,Wermers(1995)、Werners(1999)的研究表明机构投资者会跟随其他的机构投资者买卖同样的股票,形成羊群效应。Paul A.Gompers and Andrew Metrick(1999)认为,机构投资者偏好规模大、流动性高的股票,使得其对大市值规模股票的需求大大增加,在供给有限的情况下,赋予了一定的溢价。Richard W.Sias(1996)通过以1977年到1991年纽约交易所所有上市公司为样本分析,发现机构投资者持有比例与股票波动性存在正相关性,且机构投资者持有比例的增加导致了股票波动性的增加。汪光成(2001)通过对1999年我国大陆上市公司年度报告中披露的基金持股信息的分析,发现基金持股多少与股票的每股收益、每股收益等呈现显著的相关性。江向才(2004)通过对219个机构投资者的研究,发现机构投资者关注公司治理好和信息透明度高的公司。肖星和王琨(2005)采用2000—2003年我国证券投资基金和上市公司的数据,发现基金关注公司外部董事的比例以及董事会成员的专业技术水平,偏好投资治理结构优良的公司。廖理、石美娟(2008)利用我国上市公司2003—2005年的数据,从安全性、谨慎性、流动性、交易成本、公司业绩和投资风格六个方面来研究养老基金的投资偏好。结果表明:流动性强、交易成本低、风险小和规模大的公司是我国养老基金最理想的投资对象。谭松涛、傅勇(2009)利用双重差分的方法研究我国股权分置改革过程中,上市公司的股权激励方案对机构投资者投资选择的影响。实证结果表明,机构投资者更倾向于持有公司治理水平较高的公司。

综上所述,关于机构投资者持股偏好的研究,目前已取得了一定的成绩,研究有一定的深度。在实证方法上,多采用多元线性回归,但是,在多元线性回归方程中,自变量之间有较强的线性关系,这种关系若超过了因变量与自变量的线性关系,则回归模型的稳定性受到破坏,回归系数估计不准确。所以有必要引入新的实证方法。

三、关联规则

(一)关联规则

数据挖掘(Data Mining)也称为数据库中的知识发现,是最近几年新兴起的一种对数据处理的技术。它是通过从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含的、人们事先不知道的,但却又潜在有用的信息和知识的过程。它是数据库技术、人工智能技术和数理统计等多方面技术的集成,是一种深层次的数据分析的方法。数据挖掘技术在近年来已被数据库研究者广泛研究,关联规则是近几年才发展起来的数据挖掘技术中的一个分支。与大多数的数据挖掘技术相同,关联规则的任务在于减少潜在的大量杂乱无章的数据,使之成为少量的易于观察、分析的可用资料。关联规则最初的应用是针对购物篮的分析。主要应用在超市对顾客购买记录数据库进行的相关规则的挖掘,从而发现顾客的购买习惯。比如,购买产品X的同时也购买产品Y,于是,超市就可以通过调整货架的布局,将X产品与Y产品放在一起,增加销量。之后,关联规则的分析被普遍应用于客户特征分析、药物配伍分析以及商业分析等领域。黄晓榕(2011)利用关联规则通过对我国40家中小企业上市公司财务报表的研究,重点分析了企业的资产负债率与负债利息率、流动负债比重和资产收益率之间的联系,并且比较了样本企业与其所处行业在关联规则上的差异。实证结果表明,大多数样本企业缺乏基于企业价值的融资管理,总体上负债率低,而流动负债比重极高;很多样本企业存在资本结构与债务利率水平、资本结构与盈利水平不相适应的问题。可见,关联规则在财务分析领域已有相关应用。

(二)Apriori算法及其适用

1.Apriori算法

从技术上说,关联规则是通过在大的样本资料中寻找项集之间有意义的关联或相关联系,揭示样本中蕴含的信息。Apriori算法是关联规则常用的算法,主要由以下两个步骤完成:

(1)产生频繁项集:设条件为Support(A=>B)>MinSuppt,从所有事务中找出大于最低支持度阈值的所有项集组成满足条件的频繁项集。具体如下:

①首先找出频繁1-项集,记为L1;

②利用L1来产生候选项集C2,对C2中的项进行判定挖掘出满足条件的频繁项集L2,即频繁2-项集;

③如此不断循环下去,直到无法发现更多的频繁k-项集为止。

(2)产生有效关联规则

对于每个频繁项集,设条件为Confidence(A=>B)>MinConf,从所有频繁项集中过滤出大于最低置信度阈值的强关联规则,即有效关联规则。

2.Apriori算法的适用性

Apriori算法的核心是基于两阶段频集思想的递推算法。采用Apriori算法,通过设置最小支持度和置信度阈值即能够及时方便、自动地对机构投资者投资的数据进行分析,从而得出符合条件的有意义的规则。通过分析这些规则有助于揭示机构投资者投资数据之间潜在的、有价值的联系,避免了传统方法需要人为引入及设置变量方面的主观性缺陷,结果更客观、准确、适用性强。

四、实证研究

(一)数据预处理

从2006年开始,机构投资者发展迅速,除证券投资基金外的其他基金如社保基金得到了较大发展,形成了多元化格局。因此,本文选取2010年上海、深圳A股上市公司作为研究对象,对样本进行如下处理:(1)剔除金融保险业上市公司,因为金融保险行业会计准则与其他行业会计准则具有较大差异;(2)剔除ST类上市公司;(3)剔除数据不全的上市公司。数据来源于CSMAR数据库。同时,为了便于提高以后挖掘过程的精度和性能,需要对相关变量进行规范化处理,具体如表1所示。

(二)关联规则挖掘结果及分析

本研究旨在通过对2010年上海、深圳A股上市公司中有机构投资者投资的企业状况进行研究,找出这些企业的共有特征,从而分析机构投资者投资的偏好,以便对塑造我国证券市场多元化均衡的投资者结构提供参考依据。

对机构投资者数据库进行关联规则分析,得到频繁项集如表2,设置最小支持度为50%,最小置信度为50%,得到符合条件的规则8条,如表3。

从表3中可以找到一些有意义的规则。例如:规则“Share holder=institutional>=F3”,其支持度为63.77473%,置信度为86.57025%,相关性为80.91638%。该规则表明,在所研究的657家沪深A股上市公司的样本中,63.77473%的有机构投资者的企业的财务杠杆系数处于[1,2)的区间;又如规则“Share holder=institutional==>E2”,其支持度为50.38052%,置信度为68.38843%,相关性为69.10606%。该规则表明,在所研究的657家上海、深圳A股上市公司的样本中,50.38052%的有机构投资者的企业的每股收益处于[0,0.5)的区间,说明机构投资者偏好每股收益较高的企业。如果将最小支持度设为40%,最小置信度设为50%,则可以得到相应的频繁项集(见表4)及符合条件的规则25条(见表5),经分析其中仍存有有价值的关联规则。例如,规则“Shareholder=institutional==>F3,E2”,其支持度为42.00913%,置信度为57.02479%,相关性为63.36411。该规则表明,在沪、深两市A股市场投资的机构投资者偏好于投资每股收益处于[0,0.5)区间且财务杠杆系数处于[1,2)区间的企业,这也印证了上述的分析结论。而规则“R2==>F3,E2”则是因为财务指标计算中的相关性所致。

五、相关对策及建议

(一)创造良好的市场环境,放宽对机构投资者的限制

从实证结果可见,机构投资者偏好投资每股收益较高、财务杠杆中等的企业。机构投资者的发展离不开良好的外在环境,因此,作为管理机构的证监会应发挥主导力量,为大力发展机构投资者创造外部政策环境,引导机构投资者关注企业的长期价值,同时,放宽对机构投资者的限制(如代理权征集的限制等),积极引入QFII(合格的境外机构机构者),利用其较成熟的公司治理经验,为稳定我国证券市场作出贡献。

(二)关注机构投资者自身的治理结构

从机构投资者自身所处的角色可以看出,它并不是资金的所有者,而只是一个代理机构,其自身的治理状况将直接影响到其能否发挥积极股东的作用。因此,完善机构投资者自身的治理结构,加强机构投资者内部控制体系的建设,提高其管理水平和操作的规范性对于机构投资者积极股东作用的发挥以及我国证券市场整体的良好发展具有重要意义。

【参考文献】

[1] DeLong, B., A. Shleifer, L. Summers, and R. Waldmann, 1990, “Positive Feedback Investment Strategies and Destabilizing Rational Speculation,” Journal of Finance, 45.

[2] Lakonishok, J., A. Shleifer and R. W. Vishny. 1992, “The impact of institutional trading on stock prices”, Journal of Financial Economics, 32(1).

[3] Wermers, R., 1999, “Mutual Fund Herding and the Impact on Stock Prices”, Journal of Finance 54.

[4] Sias, Richard W., 1996, Volatility and the Institutional Investor, Financial Analysts Journal, 3.

[5] Margarent H.Dunham.数据挖掘教程——世界著名计算机教材精选[M].北京:清华大学出版社,2005.

[6] 江向才.公司治理与机构投资人持股之研究[J].南开管理评论,2004(1).

[7] 肖星,王琨.证券投资基金:投资者还是投机者?[J].世界经济,2005(8).

[8] 廖理,石美娟.我国养老基金投资偏好研究[J].统计研究,2008(8).

[9] 谭松涛,傅勇.管理层激励与机构投资者持股偏好[J].中国软科学,2009(7).

[10] 黄晓榕.我国中小企业上市公司资本结构关联规则分析[J]. 技术经济,2011(11).

猜你喜欢

机构投资者关联规则
机构投资者、两权分离与公司资本结构
基于Apriori算法的高校学生成绩数据关联规则挖掘分析
上市公司清洁审计意见与机构投资者持股比例的研究
定向增发、股权结构与盈余管理
基于关联规则和时间阈值算法的5G基站部署研究
关联规则,数据分析的一把利器
论机构投资者与公司控股股东的投票代理权之争
关联规则挖掘Apriori算法的一种改进
基于关联规则的计算机入侵检测方法
公司治理、机构投资者与盈余管理研究