中国A股市场存在“信用风险悖论”吗?
2012-06-29艾春荣
艾春荣,张 奕
(1.上海财经大学 高等研究院,上海200433;2.上海财经大学 经济学院,上海200433)
一、引 言
现代投资理论研究表明,任何风险资产的收益与风险成正比。而西方文献对美国股票市场的实证检验却发现所谓的“信用风险悖论”,即低风险公司的股票能实现比高风险公司股票更高的收益率。这一现象扭曲了企业融资成本,影响投资者理性决策,助长投机情绪,降低股市运行效率。政府有必要制定相应的政策来矫正该现象,达到控制风险、提高资本市场效率的目的。
我国资本市场发展的历史较短,规模不大,投资人经验不足,加上上市公司监管法律和公司治理制度还不健全,在这样一个不太成熟的资本市场研究“信用风险悖论”现象是否存在,对我国制定科学的市场监管政策、引导市场向健康的方向发展具有十分重要的实际意义。本文在现有文献的基础上,运用对风险的直接度量及多种改进的模型和方法,对我国目前股票市场的数据进行实证分析,发现存在于美国资本市场的“信用风险悖论”并不存在于我国资本市场,这为我国制定相关政策提供了现实依据。
二、文献综述
经典投资理论很早证明了金融资产的风险收益正相关(Markowitz,1952;Sharpe,1964;Ross,1976)),这一研究结果如果与实际相符,那么对企业合理融资、投资者决策以及政府制定合理的市场监管政策就至关重要。究竟该理论是否能得到实际的支持呢?近十年数据显示美国股票收益率高于10年期国债收益率近200个基点,似乎验证了理论的正确性,即高风险资产确实实现了高收益。但这只是一个风险资产与一个无风险资产之间的比较,并不能说明不同水平的风险资产之间也存在类似的正相关关系。在股票市场内部,股价形成的复杂性和定价过程的主观性可能影响风险收益正相关的结果。例如,在美国股市中,以高新技术为代表的新兴产业总市值占比较高,这些企业的股票投资者往往忽视当前公司基本面,过分寄希望于未来成长带来的收益机会,而给予其股票错误的高估值。股价偏高和成长空间的限制致使其难以实现高收益,而高风险企业大多属此行业,因此美国股票市场中存在悖论现象是完全有可能的。事实上,Avramov等(2009)以信用评级作为风险变量研究收益与风险的关系时发现悖论现象,即企业评级越低股票收益率越低,其中最差评级企业股票收益率显著低于最优评级。进一步,他们及Dichev和Piotroski(2001)的研究还发现在评级下降时,投资者的过度反应使低评级企业股价大幅下降,使悖论现象更为显著;Dichev(1998)、Griffin和Lemmon(2002)以影响评级主要因素之一的企业破产概率作为风险变量,研究发现高风险企业实现的股票收益率反而低于平均值;Campbell等(2008)、Chava等(2010)以财务压力作为风险变量,研究发现高压力企业实现的股票收益率低于低压力企业;Garlappi和Yan(2011)也以此指标进行研究,发现股票收益率和风险之间的关系呈驼峰型而非正相关。值得注意的是,部分学者发现悖论主要集中在20世纪80年代以后(Dichev,1998;Chava等,2010),对悖论存在的可能解释是企业经营者过分追求业绩而采取激进的杠杆交易并购方式,投资者预期被并购高风险公司出现收购溢价和业绩反转所左右而给予其股票高估值,但低等级债市崩盘使并购失败,股价下降;另外,20世纪90年代投资者热捧以网络技术为代表的高科技股,形成“非理性繁荣”,但网络泡沫破灭使股价跳水,导致悖论现象尤为明显。
国内学者也对风险和收益关系开展了一些实证研究,但未达成一致结论。2005年之前,由于我国股市仍处于发育阶段,政策法规不健全、投资行为非理性等问题扰乱了风险与收益的关系,导致了该悖论的产生。施东晖(1996)用1993-1996年上证A股数据研究了上海股市的风险问题,发现风险与收益率负相关;陈浪南和屈文洲(2000)在1994—1998年不同市场环境下检验了CAPM模型对我国股票市场的解释力时发现,当市场下行时收益率与β系数呈反比;靳云汇和刘霖(2001)对1997-2000年我国股市CAPM模型的检验也发现收益率与β系数呈反比。此外,陈小悦和孙爱军(2000)、阮涛和林少宫(2000)、何立杰(2006)、杨浩等(2005)及姜继娇(2007)等的研究也得出类似结论。而在2005年之后,随着股票市场成熟度的提高,这一结论出现了变化。秦勤(2009)用股改后的数据研究发现CAPM模型与我国股市的适应性逐年增强;赵琳琳和李晨光(2010)及刘威(2011)分别对2006-2007年和2007-2009年上证A股进行研究发现,风险收益虽不显著但已呈现正相关关系。另外,部分学者还发现由于我国股市投机情绪较强,不同外部环境会使股价表现和投资者风险偏好产生变化,导致风险收益关系不稳定(陈浪南和屈文洲,2000;陈小悦和孙爱军,2000)。
上述国内研究得出了一些有价值的结论,但亦存有不足之处:一是从模型方法看,现有文献大都以截面回归分析为主,没有控制公司之间的差异,可能会影响结论的准确性;二是从风险变量的选取看,由于先前缺乏如国外研究使用的对公司本身风险的直接度量指标,国内学者只能依赖于统计模型从公司股价数据中间接构造,这样的做法缺乏先验的客观性和度量的全面性。另外,对目前我国股票市场悖论存在性的研究相对较少。对此,本文一方面对包括面板回归分析在内的多种方法进行改进;另一方面,由于我国信用评级产业近几年快速发展,并且于2006年开始公司主体评级业务,信用评级所具有的独立、专业和全面的特性使其能够对风险进行客观、准确的衡量。
综上,本文首次采用信用评级作为风险衡量指标,运用多种模型方法对现阶段我国股票市场是否存在“信用风险悖论”进行实证研究,同时还将检验信用评级能否比国内学者通常使用的β系数为市场提供更多风险信息。
三、研究设计
(一)数据来源
本文信用评级数据来自国内两家权威评级机构——中诚信国际信用评级有限责任公司(以下简称中诚信)和大公国际资信评估有限公司(以下简称大公国际)的评级报告。研究对象为不包括金融机构的A股市场被评级的上市公司,并剔除所属集团公司而非自身被评级的公司。根据本文的研究目的,兼顾评级产业发展和财务指标滞后性,并包含金融危机和货币政策周期,样本期间设置为2008-2011年,剔除停牌股票,总体观测值达9 773个。上市公司股价和财务数据来自Wind中国金融数据库,为月度数据。
(二)研究方法
本文在模型方法上采取基于组合和个股的分析,其中个股的分析包括个股截面分析和个股面板分析,在研究内容上进行基本检验和稳健性检验。
1.组合的分析
(1)基本检验。本文按每家公司每个月的信用评级等级分组,考察各组原始收益率均值与信用评级的关系,并采用Daniel等(1997)的独立排序法计算经规模和β系数调整的收益率,将原始收益率剔除这两者所能解释的部分后,考察其均值与信用评级的关系,目的在于检验收益率差异能否被规模解释且信用评级能否为市场带来比β系数更多的风险信息。其中β系数由对CAPM模型回归得到。当然,在个股的回归分析中还需控制其他变量。
(2)稳健性检验。稳健性检验从两方面进行:第一,考虑到信用评级反映的是中长期风险,分别检验评级后1-5个月原始收益率均值与信用评级的相关性是否一致;第二,考虑到近年来金融危机和货币政策调整形成不同经济周期和货币政策期,分时段检验原始收益率均值与信用评级相关性,考察外部环境对风险收益关系的影响。
2.个股的截面分析。采用多元回归模型及Fama和MacBeth(1973)回归法检验。
(1)基本检验。首先对原始收益率进行如下回归:
其中rating为信用评级虚拟变量。由于样本中评级有6个级别,故设置5个虚拟变量,最高等级为缺省值,并用单侧检验。模型中还控制了影响股票收益率的其他变量,包括规模(总市值的对数,size)、动量(前6个月累计收益率,sixreturn)、流动性(换手率,turnover)和价值(账面市值比,bm)。i为上市公司,t为时间点。
类似于Brennan等(1998)的方法,在模型中加入β解释收益,考察信用评级能否比β系数带来更多信息。同样对CAPM模型进行回归,但本文选取βi×(RMt-Rft)作为β解释收益,而不仅仅是β系数,因为前者更直接地概括了β系数所能解释的收益。
其中Rit-Rft为超额收益率,以它作为被解释变量是因为β解释收益中亦减去了无风险利率。
(2)稳健性检验。将模型(1)中被解释变量替换为评级后1-5个月原始收益率及不同外部环境下各时段原始收益率,分别检验风险收益关系稳健性。
3.个股的面板分析。由于在截面回归方法中无法控制个体不可观测的异质性,本文进一步采用面板回归,回归模型和分析步骤与个股截面分析一致。
四、实证结果与分析
(一)变量描述性统计
1.信用评级。样本中被评级上市公司等级涉及AAA、AA+、AA、AA-、A+和A六个级别,依次转换为C1至C6(见表1),评级下降表示风险增加。
表1 信用评级描述性统计
2.其他变量。各种股票收益率及其他控制变量描述性统计列示于表2。
表2 除信用评级外变量描述性统计
(二)信用评级作为风险衡量指标的合理性
本文考察反映风险的公司和股票特征值与信用评级相关性,以验证后者作为风险衡量指标的合理性。表3报告了不同评级等级风险特征均值。
表3 不同信用评级公司和股票特征均值
总体结果符合预期,公司规模越大、账面市值比越高、流动性越强,风险越低。从最高等级到最低等级,市值由7.38×1010元单调下降到4.60×109元,账面市值比从0.47下降到0.34,成交额由6.02×109元下降到2.34×109元,低流动性指标从0.12上升至0.40。另外,机构持股比例和关注公司股票的券商数量亦随信用评级的下降而下降,表明公司越好,风险越低,投资者关注度越高。因此,信用评级作为风险衡量指标是合理的。
(三)实证结果与分析
1.组合的分析
(1)基本检验。表4报告了各评级组合收益率均值及其他等级与最高等级均值差异。第二行和第四行显示,从C1到C6原始收益率均值上升,C4、C5和C6分别在1%和10%的水平上显著异于0,C2到C6与C1的原始收益率差为正且逐渐拉大,其中C4、C5和C1的差分别在10%和5%的水平上显著异于0。第三行和第五行显示,虽然经规模和β系数调整收益率均值小于原始收益率,但仍随评级下降而上升,而其他等级与最高等级的差异甚至比原始收益率更为显著。
表4 信用评级和收益率均值
表5 领先信用评级不同时期、不同经济周期和不同货币政策期原始收益率均值
(2)稳健性检验。表5报告了各评级组合领先于信用评级1-5个月和分时段原始收益率均值。领先1-4个月原始收益率均随着评级等级降低而增加,显著性水平上升。虽然领先5个月的显著性水平不高,但整体上仍呈现随评级等级下降收益率增加的特征。另外,不同时段信用评级和原始收益率的相关性一致,均随评级下降而原始收益率均值上升。
上述组合的分析表明“信用风险悖论”不存在,评级越低,风险越高,收益率越高,反之亦然。结论具有稳健性,滞后的信用评级对收益率依然有影响,亦不随金融危机发生和货币政策变化而改变。不同评级间收益率差异不能全被规模效应所解释,信用评级比β系数可以为市场带来更多风险信息。
2.个股的截面分析
(1)基本检验。表6第三列和第四列为模型(1)和模型(2)的横截面回归结果。从第三列评级虚拟变量的系数可以看出,C2、C3、C4、C5和C6的上市公司原始收益率比 C1分别平均高出0.75%、0.72%、2.09%、1.90%和4.72%,呈现信用评级越低、收益率越高的趋势,并且C2、C3和C1的差异不显著大于0,而C4、C5、C6和C1的差异分别在10%、5%和1%的水平上显著大于0。其他控制变量方面,公司市值对数和换手率系数均在1%的水平上显著异于0。第四列结果显示,在β解释收益系数显著的情况下,C6的系数仍在5%的水平上显著大于0,并且依然呈现信用评级越低、收益率越高的趋势。
表6 基本检验的个股回归结果
(2)稳健性检验。表7报告了稳健性检验的截面回归结果。从第三至第七列可以看出,虽然同一评级等级虚拟变量系数和调整R2随领先期拉长而逐渐减小,但是每一领先期评级虚拟变量系数均大于0且从C2到C6逐渐增大。第八至第十一列的分时段检验结果显示,信用评级和收益率关系一致,评级虚拟变量系数均大于0且随评级下降而增加。
对个股的截面分析再次证实“信用风险悖论”不存在且结论稳健,信用评级的确能为市场带来比β系数更多的风险信息。在有更多控制变量的情况下,评级虚拟变量系数依然显著,说明不同评级间收益率差异不能完全被规模效应、流动性溢价等所解释,信用评级的作用无可替代。
表7 稳健性检验的个股截面回归结果
3.个股的面板分析
(1)基本检验。表6第五和第六列为模型(1)和模型(2)的面板回归结果。模型(1)同样有C2到C6评级虚拟变量系数大于0且递增,C4、C5和C6的系数在1%的水平上显著,其他控制变量系数亦显著。模型(2)也有评级虚拟变量整体趋势不变,C6的系数在1%的水平上显著大于0。
(2)稳健性检验。表8报告了稳健性检验的面板回归结果,亦与表7截面回归结果类似。
对个股的面板分析、组合分析和个股的截面分析得出的结论一致,但需要指出的是,β解释收益系数在截面回归分析中只有0.03,大大低于理论值,而在面板回归分析中是0.94,基本接近理论值1。这一结果印证了企业差异的存在和控制企业差异的重要性,并且面板回归的显著性水平较之截面回归更高,说明面板数据模型才是正确的模型。
表8 稳健性检验的个股面板回归结果
五、结论与政策含义
本文将信用评级作为风险衡量指标,对现阶段我国股票市场是否存在“信用风险悖论”进行了实证研究,主要结论为:第一,该悖论在当前我国股市不存在,且实证结论具有稳健性,滞后的信用评级对收益率依然有解释力,两者间关系不随金融危机发生和货币政策变化而改变,亦不依赖于模型设置和统计方法。这一结论验证了当前我国股市风险收益正相关。这既与我国股市有效性水平提升有关,即2006年全面开始的股权分置改革及机构投资者进入快速发展期的确为维持市场稳定和促进市场规范高效发展起到了重要作用,也与投资者表现理性、投机行为减少相关,即价值投资理念的增强降低了外部环境波动的冲击。第二,信用评级与风险特征的相关性符合预期,不同评级间收益率的差异不能全由规模效应、流动性溢价等解释,并且信用评级能为市场提供比β系数更多的风险信息。这表明信用评级是良好的风险指标。因此,未来投资者除了关注传统股价影响因素外,亦能从简明的评级符号中获得投资决策参考,提高市场效率。
目前我国股市未出现美国股市发生的“信用风险悖论”,并不能说明前者的成熟度已超过后者,主要原因在于两个市场的结构性差异:(1)股票市场行业市值构成存在差异。美国市场更多为风险较大的新兴产业,电信科技类股票市值占比超过20%,但国内市场以传统性行业为主,这一比例不到2%。(2)公司并购重组方式存在差异。美国上市公司市场化并购重组较多,方式多样,但并购失败的可能性也较大。而国内上市公司并购重组较少,并且监管部门对如垃圾债、高收益债等债券品种限制较多,降低了并购失败的可能性。(3)经营者激励不同。美国公司高管薪酬与公司业绩联系紧密,当公司业绩大幅走弱时,经营者存在道德风险行为,而国内公司高管薪酬与业绩关联度有限,过度激励的风险行为不多。
随着创业板的正式建立,我国股市中新兴产业上市公司比重不断增加,前瞻性地防止发达国家的股票定价错误和悖论再现十分重要。因此,促进评级产业快速发展,提高对上市公司的信息披露力度是我国股市健康发展的内在需要。这要求评级机构未来发展依然坚持独立、专业、标准的原则,提升评级覆盖面和全面性,政策制定者和行业监管者也应优化信息披露方式和细化评级风险提示作用。另外,在上市公司并购普遍、方式多样,公司治理结构趋于市场化的背景下,注重完善并购相关法律法规,特别是对支付方式和手段的限制,着力保障并购顺利完成。在对我国上市公司高管采取公司业绩与薪酬挂钩的激励方式时,也应防止过度激励导致经营者的道德风险行为。
注释:
①即Amihud(2002)构造的衡量股票流动性强弱的指标,其值越大表示股票流动性越差。计算公式为由于这个值非常小,我们将所有股票每个月的这个指标同乘以109。
[1]陈浪南,屈文洲.资本资产定价模型的实证研究[J].经济研究,2000,(4):26-34.
[2]陈小悦,孙爱军.CAPM在中国股市的有效性检验[J].北京大学学报(哲学社会科学版),2000,(4):28-37.
[3]靳云汇,刘霖.中国股票市场CAPM 的实证研究[J].金融研究,2001,(7):106-115.
[4]阮涛,林少宫.CAPM 模型对上海股票市场的检验[J].数理统计与管理,2000,(4):12-17.
[5]施东晖.上海股票市场风险性实证研究[J].经济研究,1996,(10):44-48.
[6]Avramov D,Chordia T,Jostova G,Philipov A.Credit ratings and the cross-section of stock returns[J].Journal of Financial Markets,2009,12:469-499.
[7]Chava S,Purnanandam A.Is default risk negatively related to stock returns?[J].Review of Financial Studies,2010,23:2523-2559.
[8]Dichev I D.Is the risk of bankruptcy a systematic risk?[J].Journal of Finance,1998,53:1131-1148.
[9]Fama E F,MacBeth J D.Risk,return,and equilibrium:Empirical tests[J].Journal of Political Economy,1973,81:607-636.
[10]Garlappi L,Yan H.Financial distress and the cross-section of equity returns[J].Journal of Finance,2011,66:789-822.
[11]Griffin J M,Lemmon M L.Book-to-market equity,distress risk,and stock returns[J].Journal of Finance,2002,57:2317-2336.