基于SVM和粗糙集理论的董事会效率评价研究
2011-07-27张大光
张大光
(北京航空航天大学经济管理学院,北京100191)
一、引言
在现代企业制度建设及公司治理的实践中,董事会是公司治理的核心,董事会的运作效率直接关系到公司的经营业绩、股东和其他利益相关者的利益。从公司治理的角度看,董事会作为联结股东与经理层的纽带,可以看作一个受托的责任主体,它与股东全体间存在着委托-代理关系,董事会的决策能力和运行效率决定了股东所承受风险的大小,而董事会的效率低下则会给股东带来很高的成本;同时,董事会的效率水平还直接影响到公司的整体业绩水平。因此,建立董事会自身的效率评价制度,科学、客观、准确地评价董事会的效率水平,有利于对董事会进行合理的激励,有利于促进董事会提高自身的运行效率,有利于提升整个公司的经营业绩和竞争能力,具有重大的现实意义。
目前,国内外研究董事会效率的文献并不多见。已有的研究大都从理论角度阐述影响董事会作用发挥的因素[1~3],运用案例和实证分析的方法,探讨影响董事会作用发挥的各种因素[4~7],如董事会规模、董事会构成、独立董事在董事会中所占比例、董事会持股、两职状态、董事会会议次数、董事会内部委员会设置状况等。国内关于董事会效率的研究则更为少见,仅有的研究也大都停留在定性的分析上[8],缺乏对董事会效率的有效量化分析模型和方法。本文旨在构建出一套反映上市公司董事会效率的指标体系,利用多分类支持向量机方法构建董事会效率评价模型,科学、快速、方便地对上市公司的效率水平进行评价。
二、支持向量机原理简介
传统的支持向量机是由Vapnik(1995)等人最早提出的[9],该算法一经提出就引起了国内外学者的广泛关注。虽然支持向量机的研究已有十几年,但如何面对复杂的数据形式不断改进模型算法来提高模型的预测精度,并进一步扩大其应用范围,仍然是研究的热点。
(一)二分类支持向量机
二分类支持向量机算法可以简单描述如下:
考虑到样本集往往是线性不可分的,于是引入非线性函数φ(*):Rn→Rd,将低维空间不可分的样本集非线性映射到一个高维的特征空间中,使其成为线性可分问题。此时,支持向量机(SVM)分类机满足下列条件:
其中,ω代表权重向量,b是纵截距。公式(1)就是满足SVM算法中的结构风险最小化的第一个条件:保证经验风险最小。其中,使等号成立的那些样本点即为支持向量。
在保证了第一个条件的前提下,再来考虑SVM算法中的结构风险最小化的第二个条件:使分类间隔最大。公式(1)可以归结为在特征空间的一个分离超平面(ωTφ(x)+b=0)的两边构造两个平行的边界超平面,两个超平面之间的距离(带宽)等于2/(ω2),即分类间隔为2/(ω2),因此分类的间隔最大等价于最小。此外,即使在映射后的高维特征空间,在构造线性分类面时,也可能由于特殊样本点的存在导致样本线性不可分。因此在约束条件中增加一个非负的松弛项ξi。此时,求解最优超平面的优化问题为
其中,C∈R+是一个权衡带宽与分类误差重要性的调和超参数,代表着模型的推广能力。
通过求解上述优化问题,最终得到的分类决策函数为
由式(3)可知,最终决策函数涉及到在映射后的高维空间做内积运算φ(xi)Tφ(xj),如果非线性映射后空间的维数很高,会产生“维数灾难”。为解决这一难题,根据泛函理论,可以用满足Mercer条件的核函数K(xi,xj)来代替高维特征空间的内积运算:
(二)“一对多”多分类支持向量机
支持向量机的产生最初是为了解决二分类问题,但在实际应用中往往要求算法可以对多于两类的分类问题,给出准确的判断,多分类支持向量机算法就此产生。多分类支持向量机包括“一对一”和“一对多”两种算法。本文采用“一对多”多分类支持向量机。
一对多模型的主要思想是:对于k类分类问题,构造k个二分类器,每个二分类器应用于所有样本,第i个二分类器将第i类样本看出A类,其他类看出B类,进行训练,这k个二分类器组合起来就可以形成k分类的判决函数。当一个样本数据输入时,依次用这k个二分类器进行判断,如果第i个二分类器的输出是属于第i类,而其他的分类器都输出为其他类,则判断该样本属于第i类。
多分类支持向量机算法最终转化为求解如下优化问题:
其中向量vi∈Rk记录分类结果,如果样本xi属于第j类,则向量vi为第j个元素为1,其他元素为,如样本xi属于第一类,则;且映射L(yi)为第j个元素为0,其他元素为1的向量。且满足限定条件,该限制称为零和约束。
其中K(xi,xj)为简化运算的核函数。本文利用libsvm工具包[10]中 SVMtrain函数完成算法求解。
三、董事会效率评价指标体系的构建
影响董事会效率的因素究竟有哪些,国内外学者观点并不完全相同。Kose和Lemma认为影响董事会效率的因素包括董事会规模、董事会的独立性及其构成、两职状态、内部委员会设置状况、董事会成员素质状况和董事薪酬结构等[11]。Roberts,McNulty和Stiles则提出董事会效率取决于董事个体的态度和行为[12]。Chris通过逐步回归分析表明,董事会规模、董事会会议频率、经常出席会议的董事会成员比例、董事的职责、董事的引进和培训、董事任职时间和经验等因素与董事会效率之间存在着重要的关系[13]。赵增耀认为董事会的运行效率主要受董事会构成的影响,包括董事的年龄、性别、董事长与CEO是否兼任、独立董事比例等[14]。
本文参考国内外董事会效率影响因素的相关研究,从董事会组成结构、独立性状况、董事会成员与运行状况指标以及激励状况4个方面,构建了董事会效率评价的指标体系。
(一)董事会组成结构指标
(1)董事会规模。董事会的规模常常被视为影响董事会效率的关键因素。依据代理理论和组织行为学的观点,就一定规模的公司来讲,规模过大的董事会不能发挥最优的功效,或者说,规模大的董事会不如规模小的董事会更有效率。这主要是由于董事数量过多,会导致董事会在沟通与协调上产生问题,造成董事会的功能紊乱。本文用公司年报中披露的公司董事人数来表示当年度的董事会规模。
(2)是否设置专业委员会。专业委员会的设置体现了董事会的分工情况,能够增强董事会战略决策和监督能力,提高董事效率。
(3)职工和中小股东董事比例。职工和中小股东加入董事会能够使董事会及时获取到公司底层相关信息,从而提高决策的有效性。
(二)独立性状况指标
独立性状况指标是影响公司董事会效率高低的重要因素。董事会的独立性对董事会效率有显著的促进作用。一方面,公司的董事越独立,对于董事长或大股东的监督性就越强,能够更好地避免个人驾驭整个董事会,利用公司获取私利,起到监督制衡的作用;另一方面,在一个独立性较高的董事会中,往往会引进独立董事,而独立董事要求具有丰富的职业背景、专业背景和学历背景,因此,这样的董事做出的决策往往更加科学、合理。
(1)CEO是否兼任董事长。董事长与总经理是否分离影响到董事会能否对CEO和经理层起到有效地监督作用。该指标在董事长与CEO为同一人时为1,否则为0。董事长与CEO两职兼任往往被认为是阻碍董事会效率和公司绩效提高的一个重要因素。
(2)独立董事比例。实行独立董事制度,是我国上市公司治理机制改革过程中的一项重要举措。董事作为股东及其他利益相关者的信托人,其独立性是保证公司有效运作的基础。独立董事是体现董事会独立性的重要方面。相对于独立董事来说,因为总经理对他们的职务有重大的影响,内部董事很少会对总经理提出异议。
(三)董事会成员与运行状况指标
董事会成员的素质直接影响到董事会能否健康、良好、规范、有序地运行,从而影响到董事会的效率水平。反映董事会成员素质和运行状况的指标包括:
(1)董事会成员学历状况。博士学历为2,硕士学历为1,本科及以下为0,计算董事会全部成员的简单平均值,作为董事会的整体学历状况。
(2)董事长学历状况。董事长的学历水平为博士学历的为2;硕士学历为1;本科及以下的为0。
(3)董事长担任大型企业高管的年限。董事长担任大型企业高管的年限越长,说明其在公司治理、董事会运作等方面经验丰富,能够有效地发挥董事会的作用,提高公司绩效。
(4)董事会每年的培训次数。董事会的培训能够提高董事会成员的能力,促进董事成员之间的交流和沟通,提高董事会运作效率。
(5)董事会每年的会议次数。董事会会议次数也是影响董事会效率的一个因素。董事会会议次数较多可以在一定程度上说明董事会工作的投入。通常,在经过高频率的董事会会议应对公司危机之后,公司绩效会得到一定程度的提高。
(四)激励状况指标
(1)董事年度报酬。董事作为股东的代理人,起着监控经理人行为和制定公司发展战略的重要作用,董事的薪酬也应该与公司业绩和对董事的考核结果挂钩,只有董事的报酬能够充分补偿董事的劳动,才能对董事起到激励作用,才能避免董事在其位而不谋其政的现象出现。
(2)董事会持股比例。董事会持股是激励董事关注公司业绩、提高董事会工作效率的一项重要措施。从董事的角度来看,如果薪酬只是基本工资和对已完成业绩的年度奖励的话,他们必将会追求短期的利益,势必不能最大化股东的财富;让董事拥有适度的持股权,可以缓和他们与股东之间的利益冲突,使他们为企业的长远发展考虑。因此,董事持股是协调董事与股东利益的关键机制,可以以尽可能低的成本激励董事为最大化股东价值而行动。
表1 备选指标列表
(3)持股董事比例。持股董事占全部董事的比例指标能够反映出公司的激励制度对于全部董事会成员的覆盖程度。
本文将上述可能董事会效率的主要指标整理如表1,作为备选指标集。
四、实证研究:董事会效率评价与分析
本节将一对多多分类支持向量机模型和其他已有方法(神经网络算法、Logic模型)在董事会效率评价问题中的判别效果进行对比分析。
(一)样本选择及数据来源说明
本文选择的样本为制造业的机械、设备、仪表板块的上市公司,共177家。样本的相关指标数据来源为北京色诺芬信息服务有限公司提供的CCER数据库和上海万得资讯科技有限公司提供的wind金融数据库,以及样本企业的年度财务报告。
由于不同指标的量纲不同,数值差异较大,直接输入上述指标,相当于在训练时对指标赋予了不同的权重,会产生较大的预测误差。因此,对于非归一化指标,本文将其归一化处理至区间[0,1],从而确保较大值的输入指标不会覆盖较小值指标,有助于较少预测误差。具体的归一化公式为
(二)最优输入指标选择
将支持向量机应用在董事会效率评价问题时,关键的一步在于作为解释变量的输入指标的选择。指标选择的太少,算法的预测效果就不好,而指标选择过多则容易出现“过度拟合”问题,即在样本内检验效果较好而在样本外的判别效果较差。
本文采用粗糙集理论的属性约简方法来确定最优的输入指标集合。粗糙集理论是由波兰数学家Z.Pawlak(1982)提出的一种数据推理方法[15],为处理不精确、不确定与不完全数据并从数据中挖掘出需要的知识,提供了一种有效的途径,其主要思想就是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。目前,它已在数据挖掘、机器学习与知识发现、决策支持与分析等领域得到了广泛的应用。本文将粗糙集理论作为支持向量机分类模型的前置系统,通过粗糙集的属性约简方法来消除董事会效率评价系统的冗余指标,得到最小数量的必要条件属性(评价指标),以提高模型的判别精度。
对于分类来说,并非决策信息表中所有的条件属性(即评价指标)都是必要的,去除这些多余属性不会影响原有的表达效果。所谓属性约简,就是在保持知识库分类能力不变的条件下,删除其中不相关或不重要的知识,而最小约简就是要从条件属性集中最大限度地去掉一些冗余属性,计算出最小数量的必要条件属性。
本文对表1中的13个备选指标进行属性约简后,最终得到的最小约简指标集包括董事会规模、CEO是否兼任董事长、独立董事比例、董事长学历状况、董事长担任大型企业高管的年限、董事会每年的会议次数和董事会持股比例7个指标,作为支持向量机的输入指标集。
(三)支持向量机核函数选取
在支持向量机模型中,首先要考虑核函数的选择。目前核函数的选择依据尚没有定论,在有监督的学习模型中,核函数可以用多次试验方法来选取,不过多次试验方法耗时过长,比较复杂。在实际应用中,最常用的核函数是高斯核函数,因为其对应的特征空间是无穷维的,可以确保有限的样本在该特征空间里一定是线性可分的。因此,本文选取高斯核函数(RBF),其定义如下:
(四)评价结果分析
本文将董事会效率分为高、较高、一般、较差和差五个类别。采用专家打分方法,得到样本企业董事会的先验效率类别。为比较多分类支持向量机的分类效果,采用神经网络方法和Logic模型进行对比试验。在多分类支持向量机方法中,分别采用核宽分别为1、2、3时的高斯核函数。
在实验过程中,为了确保实验结果的稳健性,本文采用5组交叉验证方法(5-fold cross Validation)测试各个模型的分类结果,即将数据集分成5组,轮流将其中4组做训练,1组做测试,5次判别结果的均值作为对算法精度的估计。
最终,本文得到的评价结果如表2。
表2 董事会效率判别结果
其中,精度的计算方法为:
通过实验可以看出,不同核宽的多分类支持向量机模型的分类精度都在80%以上,比Logic模型和神经网络算法的分类精度要高得多。
(五)对模型进一步改进
在上述的实验中均假设对错误分类的惩罚是一致的,但这并不符合实际情况,不同的分类错误的严重程度可能会有所不同。例如一种错误是将效率好的董事会错分到效率较好的董事会,另一种错误是将效率好的董事会错分到效率差的董事会。在如上的算法模型中,这两种错误被视为无差异,并被赋予相同的惩罚因子。但事实上,这两种错误的程度显然不一样,即第二种错误较第一种错误来说要严重些。因此,考虑对多分类支持向量机的惩罚矩阵进行调整。
调整前的惩罚矩阵
调整后的惩罚矩阵
调整后的惩罚矩阵的含义为:当将效率为第i类的董事会正确判判定为第i类时,惩罚因子为0;当将效率为第i类的董事会正确判判定为第j类时,为了进一步区分不同错误的严重程度,将惩罚因子设定为,其中ε为外生参数。
本文将调整后的惩罚矩阵(10)中的参数ε取值为0.1,训练后得到新的分类器,用于对董事会的效率水平进行评价,实验结果如表3所示。
表3 调整后的判别结果
可以看出,经过调整惩罚矩阵后的多分类支持向量机的判别精度得到了显著改进。
五、结论
准确地对董事会的运行效率进行评价,可以有效地促进董事会主动提高自身的运行效率,从而有利于提升企业的经营业绩和竞争能力。针对董事会效率评价问题定量研究的匮乏和不足,本文在梳理国内外关于董事会效率影响因素的基础上,构建了董事会效率影响因素的指标体系,并通过机器学习领域的支持向量机方法建立了董事会效率评价的五级分类模型,特别是首次采用粗糙集理论的属性约简方法来确定最优的输入指标组合。实验结果表明,与现有的Logic模型和神经网络方法相比,本文构建的针对董事会效率评价的一对多多分类支持向量机模型的判别精度更高;而通过对惩罚矩阵进行合理的调整,评价模型的判别结果可以得到进一步提高。在未来的研究中,对董事会效率的影响因素进行挖掘、完善,以及对多分类支持向量机的惩罚矩阵进一步进行优化设定,都是值得探讨的问题。
[1]Jay,John.Outside Directors and Corporate Board Decisions[J].Journal of Corporate Finance,2005(11):37-60.
[2]Cascio.Board Governance:A Social Systems Perspective[J].Academy of Management Executive,2004,18(1):97-100.
[3]Morck,Shleife,Vishny.Management Ownership and Market Valuation:An Empirical Analysis[J].Journal of Financial Economics,1998(20):298-302.
[4]Edward,et al.Corporate Boards:Keys to Effectiveness[J].Organizational Dynamics,2002,30(4):310-324.
[5]Yermack.Remuneration,Retention,and Reputation Incentives for Outside Directors[J].Journal of Finance,2004,(59):56-63.
[6]Richard,David,Kristen.Minority Membership on Boards of Directors:The Case for Requiring Pictures of Boards in Annual Reports[J].Critical Perspectives on Accounting,2005(16):1019-1033.
[7]Denis,McConnell.International Corporate Governance[J].Journal of Financial and Quantitative Analysis,2003.(38):1-36.
[8]于东智.董事会与公司治理[M].北京:清华大学出版社,2004,39-64.
[9]Vapnik V N.The Nature of Statistical Learning Theory[M].New York:Springer,1995.
[10]Chih-Chung Chang,Chih-Jen Lin.LIBSVM:A Library for Support Vector Machines,2001 [EB/OL].http://www.csie.ntu.edu.tw/~cjlin/libsvm。
[11]Kose,Lemma.Corporate Governance and Board Effectiveness[J].Journal of Banking and Finance,1998(22):371-403.
[12]Roberts,McNulty,Stiles.Beyond Agency Conceptions of the Work of the Non-Executive Director:Creating Accountability in the Boardroom[J].British Journal of Management,2005(16):5-26.
[13]Chris C.What Makes Boards Effective?An Examination of the Relationship between Board Inputs,Structures,Processes and Effectiveness in Non-profit Organizations[J].Corporate Governance,2001,9(3):217-226.
[14]赵增耀.董事会的构成与其职能发挥[J].管理世界,2002(3):125-130.
[15]Pawlak.Rough Sets[J].International Journal of Computer Information Science,1982,11(5):341-356