新三板融资环境下中小企业信用风险评估
2018-10-16朱宗元苏为华王秋霞
朱宗元,苏为华,王秋霞
(1.浙江财经大学 数据科学学院,浙江 杭州310018;2.浙江工商大学 统计与数学学院,浙江 杭州 310018; 3.杭州电子科技大学 经济学院,浙江 杭州 310018)
一、引言
中小企业对中国经济的稳定和发展至关重要。截至2017年底,注册的中小企业数量已超过4 000万家,占企业法人总数的99%,不仅贡献了六成的产出、半数的税收,并且拉动了八成的城镇就业。但与此同时,中小企业又长期为融资难问题所困扰。长期以来,由于财务信息不透明,缺乏规范的现代企业治理制度,无法提供高质量的抵押和担保,大银行主导的金融体制不适合为中小企业服务等原因,中小企业在向银行贷款时容易遭受歧视,其融资需求难以被满足[1-2]。要摆脱对银行间接融资的过度依赖,需要拓宽资本市场的直接融资渠道,发展多层次的金融体系。面向高科技成长型中小企业的股份转让系统(新三板),正是为解决以上问题而创建。近年来,新三板市场不断扩容,挂牌企业已超过10 000家,但同时也暴露出一系列的问题,如市场定价机制不完善,二级市场交易流动性不足,上市企业信息披露混乱等[3]。
新三板市场目前尚处于摸索阶段,学者们对市场制度架构、融资行为、市场风险等方面进行了研究。已有的关注主要在两个方面:一是对新三板市场的现状调查、问题探究和前景分析。主流研究观点是,新三板市场肩负着中小(微)企业从传统债权融资转向股权融资的使命,有希望成长为“中国版纳斯达克”,但存在一级和二级市场不平衡,做市商垄断和权利义务不对等,优质企业流失、定价功能受限、金融欺诈频发等一系列的问题,需要不断完善[4-5]。二是从宏微观方面,检验新三板市场融资的有效性。市场制度设计考察包括了市场分层制度、竞价交易制度、做市商制度、信息披露制度、挂摘牌制度、市场监督体系等方面[6-7]。考察发现:存在主办券商信息披露督导滞后,缺乏有效分层,对信息披露违规企业的惩戒不足等缺点[8];从企业融资行为的影响因素和效率角度,利用DEA-Malmquist、logit等模型进行测度,发现多数企业融资未能处于效率前沿[9]。做市交易选择与公司的股权结构负相关,而与资产规模和抗压能力正相关。新三板企业需要在扩张的同时保持对风险的警惕,合理配置股权结构,稳健提升融资能力[10]。
已有研究虽涉及了新三板的诸多方面,取得了有价值的结论,但仍存在不足。对于二级市场流动性不足和信息披露不力的突出问题,现有文献集中于考察制度设计不完善导致的道德风险和逆向选择,对挂牌企业信用评级滞后这一重要原因未予重视。由于新三板的风险明显高于A股市场,所以加强挂牌企业的信用评价对有效缓释信息不对称程度、提升融资交易的可能性非常重要。对中小企业信用评级的相关研究多集中于银行贷款传统渠道,而针对新三板融资环境的研究则非常匮乏,照搬传统信用评估经验已不能适应新的交易环境[11]。本文的贡献在于利用新三板市场的公开披露信息,通过Lasso变量选择技术筛选信用评价指标体系,构建Lasso-logistic信用评估模型并进行实证分析,目的在于将披露信息映射为企业信用信号,以推动新三板市场融资的有序开展。
二、研究设计
与商业银行利用私密信息对贷款客户开展内部评级不同,对新三板中小企业的信用评级主要利用公开披露的信息,属于外部评级。研究采用经济理论与数据驱动建模相结合的思路。首先,以企业披露信息为基础,构建理论上较完备的指标体系;然后,利用Lasso方法选择变量,筛选出精简实用的指标体系;最后,构建Lasso-logistic模型评价挂牌中小企业的信用风险。
(一)信用评价指标体系构建
新三板交易平台披露了包括企业财务、企业治理、企业家人口统计特征等广泛的信息,但是很多指标存在强线性相关,因此指标体系构建需要结合理论成果和实践经验,从多角度考量和选择。已有研究发现,财务和非财务信息都能影响企业的信用,而非财务指标对中小企业的影响更大[12-14]。现代企业信用评估体系的建设原则倾向于“减少专家评估”的指标[15]。本研究从经济学意义出发,尝试搜寻理论上对企业信用可能有预测功能的变量集,为信用评价的变量筛选和调试提供基础。理论的评价指标体系包括财务和非财务指标两类。财务指标体系包括盈利能力与收益质量、资本结构与偿债能力、营运能力、成长能力以及现金流量五个部分。具体指标名称和经济含义见表1。
表1 新三板中小企业信用指标体系财务变量子集表
非财务指标包括企业家人格化特征、企业治理特征、企业基本特征等方面。非财务指标变量多为属性变量,在表2中给出了定量化设置的思路。一些样本企业数量较少的行业在分类时被归为其它。设置所属地区变量是为了捕捉区位差异对企业信用风险的影响。
(二)数据选取与预处理
1.样本企业选取。依据2011年共同制定的《中小企业划型标准规定》,少数新三板挂牌企业不符合中小企业定义,在研究中予以剔除。利用从业人数、营业收入和资产规模的区间标准值,共筛选出404家挂牌的中小企业组成研究数据集。初选的影响因素由35个变量构成,其中企业财务指标25个,非财务指标10个。企业是否违约是本研究的响应变量,35个可能的因素为预测变量。
2.变量设置。构建信用风险模型,首先需要定义违约以便分类企业样本。企业违约的确定具有多样性,最直接的狭义度量是企业财务失败导致破产。银行或债券市场中,违约一般是债务未能按约定偿还本息,以上被视为高等级违约。中国中小企业信用体系尚不健全,破产和贷款违约等信息披露不充分,难以据此开展外部评级。利用上市公司股票的交易状况作为信用风险信号是一种研究替代方法,即观察股票是否被特殊处理(ST)。根据2013年实施的《全国中小企业股份转让系统业务规则》,新三板企业触发ST的基本标准包括:最近一个会计年度的财务会计报告被出具否定意见或者无法表示意见的审计报告;最近一个会计年度经审计的期末净资产为负值以及股转系统规定的其他情形。在更广义情况下,出现企业违规、卷入诉讼、股权被法院冻结、未依法履行合同、拖欠工人工资、未及时公布公司重大事项等负面信息也可被视为低等级违约信号。
综上,本研究对新三板企业违约的定义包括:(1)企业股票被新三板市场ST警示;(2)发生拖欠支付企业员工工资的情况;(3)出现缺乏诚信违规经营的情况;(4)发生履行约定合同问题而卷入诉讼,被法院冻结资产、股权的情形。在2016年1月1日至2017年6月30日的时段内,利用Wind数据库共收集了符合违约特征的中小企业31家,发现被ST的原因基本上归于财务困境。由此得到启示,构建新三板企业的信用评价体系,仍应以财务指标为主,辅之以非财务信息。
为满足建模分析的需要,对属性解释变量做定量化设置(见表2),与连续性变量共同形成解释变量集。
表2 新三板中小企业信用指标体系非财务变量子集表
3.数据缺失和非平衡问题处理。样本企业的部分数据出现缺失和异常,分析时根据严重程度进行修补或删除。对数据缺失严重的情况,在梳理中予以删除。对少量连续指标值缺失的,利用所在Wind行业的平均值填补,缺失的离散型数据,则通过计算众数填补。处理过程共删除了57家数据缺失严重的企业。在保留的404家企业中,数据缺失的比例较低(大约2%)。由于解释变量的单位不同,在建模之前对变量实施了标准化处理。
信用风险建模时经常面临样本数据非平衡的问题,即正常企业的数量远远多于违约企业。补救方法通常包括不充分抽样、过分抽样和混合抽样改变数据结构[16]。为方便比较模型的判别能力,本研究做以下处理:首先,从原始样本中随机抽取2%的数据作为测试集,用于模型预测准确性的外推检验;然后,对训练集分违约和非违约企业,实施混合抽样获得平衡数据集。
4.Lasso-logistic信用风险评价建模思路。初步构建的理论指标体系维度较高,建模时需要进一步筛选出真正有作用的变量。使用Lasso-logistic方法构建稳健的评价模型,下面简述基本思路。
Lasso方法对最小二乘回归引入了惩罚。最小二乘估计未知参数α,β1,…,βp是通过最小化残差平方和式(1)获得:
(1)
Lasso估计方法的求解则基于式(2):
(2)
Lasso方法有显著的优点,能利用惩罚项将影响力较小的变量的估计系数压缩为0,从而得到稀疏系数模型,因此在高维变量选择时有很好的应用前景。在信用风险建模领域,Logistic回归是一直被使用的传统方法。将Lasso方法和Logistic回归结合,构建出Lasso-logistic模型。该方法能将指标筛选和风险评价统一实现。对企业是否违约的二分响应变量,Lasso-logistic模型的系数估计通过最小化凸函数式(3)给出:
(3)
其中L(β)是对数似然函数,表达式如下:
(4)
Lasso-logistic模型的系数估计值为:
(5)
选取合适的调节参数值λ,对Lasso-logistic回归的变量选择非常重要。常用方法包括交叉验证(CV)、广义交叉验证(GCV)和拔靴法(Bootstrap)。
三、实证分析
(一)变量探索性分析
利用箱线图等工具,探索比较违约和非违约企业各指标的差距,发现了一些直观结论。在企业资本结构方面,企业是否违约与最大股东持股比例没有显著的关联性。从企业成立年限的角度,企业生存时间与是否违约的关联度也不明显。在企业经营盈利能力方面,违约企业的销售毛利率中位数明显低于非违约企业,而资产周转率没有表现出明显差异。
在企业主人格化特征方面,被ST企业的董事长年龄中位数略高于正常企业,且任现职务的时间普遍较晚。按董事长受教育程度由低到高,违约比例分别为9.09%、5.26%、10.07%、5.49%和12.12%。董事长受教育程度为大专和硕士的企业违约比例较低;而董事长学位为博士的违约率最高,因此受教育程度能否被视为信用信号需进一步考量。继续考察董事长性别指标,样本中男性占绝对优势(约9∶1),分性别的违约率基本无差异(7.69%和7.67%)。在资产流动性方面,被ST企业的流动资产比率明显低于平均水平。
在企业治理结构特征方面,董事长是否兼任总经理的比例接近1∶1。两种模式下的违约比例分别为6.47%和8.87%,差异也较小。在企业特征方面,约70.3%的样本位于东部地区。东部、中部、西部和东北地区企业的违约比例分别为8.8%、3.33%、6.67%和6.67%,东部的违约率稍高于全国水平,但地区差异并不大。企业集中于北京、上海、深圳、苏州等大城市。从所属行业看,农业类企业的违约率最高,其次依次为金融业、制造业和信息技术服务业。
对各变量实施t检验分析差异性,结果见表3。发现对正常的样本企业和被ST企业,以下指标的检验缺乏显著性:大股东持股比重(P=0.73);员工人数(P=0.98);成立年限(P=0.53);营业收入增长率(P=0.62);营业利润增长率(P=0.27);利润总额增长率(P=0.44);销售净利润增长率(P=0.80);资产负债率(P=0.35);资产周转率(P=0.39);现金收入比率(P=0.27);资产减值损失率(P=0.98)、净收益营运指数(P=0.76)、流动资产比率(P=0.18);速动比率(P=0.31);现金到期债务比率(P=0.77);销售现金收入比(P=0.32);应收账款周转率(P=0.24);总资产周转率(P=0.60);股东利润增长率(P=0.37);每股收益增长率(P=0.34)及董事长任职年限(P=0.13)。上述变量在两类企业中没有显著差异,因此对违约的区分作用可能不明显。
t检验发现另一些变量在两类企业中差异显著(P<0.10)。这类指标包括:净资产收益率roe(P=0.03);总资产净利润率roa(P=0.01);销售毛利润率(P=0.02);投入资本回报率(P=0.001);营业成本收入比率(P=0.02);流动比率(P=0.07)以及全部资产现金回收率(P=0.06)。该系列指标主要表现在成长能力、盈利能力和偿债能力方面。净资产收益率、成本收入比和投入资本回报率体现企业竞争力;总资产净利润率和销售毛利润率体现了企业的盈利能力;流动比率和全部资产现金回收率衡量了企业的流动性,即在短期债务到期前变现还债的能力。
以上探索性分析对企业信用评价指标选择有积极的指导意义,但仍需进一步筛选出真正有影响的指标,并估计出其系数。下面利用Lasso-logistic方法进行建模筛选。
表3 各变量对是否被ST的t检验表
(二)Lasso-logistic模型估计
利用Lasso回归Cp值的变化,发现在第17步选择达到最小。此时自由度df=18,残差平方和Rss=21.994,Cp=16.05。Cp方法选择了17个变量,分别为所在区位、所属行业、利润总额增长率、净资产收益率、总资产净利润率、销售毛利润率、销售净利润率、现金收入比、流动资产比率、流动比率、速动比率、总资产周转率、每股收益增长率、董事长年龄、董事长受教育程度、董事长是否兼职总经理和职务年限。上述变量构成了依据Lasso方法得到的信用评价指标体系。
2.模型估计。表4中给出了Lasso-logistic模型的估计结果。部分指标的系数已被压缩至0,其影响被完全忽略。从标准化估计系数取值的情况看,系数绝对值比较大的变量有roe、流动资产比率、利润总额增长率和学历,上述估计系数均为负数,说明盈利能力、资产变现偿付能力和营运能力增强,均能有效降低新三板企业的违约风险。影响作用中等的解释变量包括:所在地区(0.018)、所属行业(-0.018 3)、销售毛利率(-0.015)、销售现金收入比(0.014 1)、每股收益增长率(0.019 3)、年龄(-0.010 3)、销售净利率(0.010 5)、总资产净利润率roa(-0.011 1)、销售现金比率(0.014 1)等变量。部分变量对于预测违约的影响较小,包括流动比率(-0.001 1)、是否兼任总经理(-0.005 2)、资产负债率(0.009 3)、现金到期债务比(-0.009 5)和董事长职务年限(-0.009 9)。
从变量的影响方向看,估计系数为负的有:企业所在行业、利润总额增长率、净资产收益率roe、总资产净利润率roa、销售毛利润率、流动资产比率、流动比率、现金到期债务比、董事长年龄、董事长任职年限。估计系数为正的有:董事长受教育程度、每股收益增长率、所在地区、现金收入比、净利润增长率和资产负债率。
表4 Lasso-logistic模型参数估计表
3.Lasso-logistic信用评级。根据Lasso方法最终筛选出的评价指标和估计结果,将企业数据导入Logistic回归方程,计算出各企业的违约概率,违约概率的计算如式(6):
(6)
根据式(6)计算的违约概率,将404个样本企业按A~E共5个信用等级来划分。违约概率小于0.2为A级,0.20~0.30为B级,0.30~0.40为C级,0.40~0.50为D级,0.50以上为E级。以违约概率不低于0.5为划分企业违约的标准。信用等级的划分结果如表5所示。
表5 样本企业的信用等级划分表
根据表5的信用等级划分结果发现,新三板企业的信用风险普遍较高,处于D级和E级的企业比例较大。在信用等级划分为E级的40家新三板挂牌企业中,被ST或*ST的企业共有25家,模型预测与实际的情况吻合度很高。
四、结论与启示
(一)结论
研究对新三板挂牌中小企业开展信用评价。首先,从经济理论出发选取了评价候选指标集;利用Lasso方法筛选了评价指标体系;构建了Lasso-logistic评价模型并预测企业的信用评级。研究获得了以下结论:
第一,新三板企业信用评价指标体系应同时包括财务和非财务指标。企业财务变量包括:盈利能力变量(利润总额增长率、净资产收益率、资产收益率、销售毛利润率、销售净利润率);偿债能力变量(资产负债率);现金流变量(销售现金收入比、现金到期债务比);股东特征变量(每股收益增长率);变现能力变量(流动资产比率、流动资产负债比率)。非财务特征变量包括:企业特征(所在区域、所属行业);企业家人格化特征(董事长年龄、学历、是否兼任总经理、任职年限)。
第二,不同变量对企业违约的影响力和方向不同。净资产收益率、流动资产比率、利润总额增长率和企业家学历对违约有较强的负向影响;企业区位、销售现金收入比、每股收益增长率、资产负债率、净利润增长率和董事长受教育程度有一定的正影响;而企业行业、销售毛利率、企业家年龄、总资产净利润率等有一定的负向影响。
第三,Lasso-logistic信用评估模型对新三板企业有较好的风险预测能力。对于检验集,该模型的预测正确率为76.27%。如果进一步扩大企业的样本量,Lasso-logistic评价模型将能持续地提升分类预测能力。
第四,新三板挂牌的中小企业普遍风险较强,信用水平偏低。模型估计发现,信用状况良好的企业比例只有大约1/3,说明新三板是一个风险较高的新兴融资市场。因此,加强对市场的信息披露监管,动态跟踪估计挂牌企业的信用状况,对提升投资者信心,提升市场透明度很有必要。
(二)启示
依据研究的结论,得到如下启示:
第一,加强对新三板挂牌企业的分层信息披露监管。新三板部分企业信息更新不及时,数据缺失较多,数据质量的全面性和准确性差,信息披露存在明显缺陷。该缺陷与新三板企业行业和规模等方面存在较强的异质性有关,因此应完善实施分创新层和基础层的分层信息披露制度。建议在《全国中小企业股份转让系统挂牌公司分层管理办法》基础上,尝试调整对不同行业、区位挂牌企业信息披露的要求;对违规披露的企业,应加大惩罚力度,严重者应强制其退出市场。
第二,科学运用信用评估手段弱化信息不对称程度。新三板企业分层依靠净利润与营收增长率等门槛。除创新层的“明星”企业,广大基础层企业的信息不对称程度更强,因此需加强评估展示其信用风险水平。高质量的信用评级将为新三板市场发展提供有力支持。挂牌企业为获得更多融资机会,有动力主动披露信息,自觉接受社会公开监督,提高其信用等级。信用评价模型的构建,并非完全依靠数据驱动,还需要依据经济学原理和专业领域的经验。值得信赖的信用评估工具,需要理论性与实用性兼具。结合理论、经验和数据的信用评价思路更加稳健、科学和实用。
第三,大力整合挖掘新三板企业数据,构建完整、高效的信息平台。在大数据思维下,更广泛的信息可能被用于评估信用风险。新三板企业的差异性显著,市场准入的门槛相比A股较弱,因此应大力构建个性化数据系统,并对投资者提供商业咨询评估服务。应引入大数据思维,深入挖掘各种信息对风险的预警能力。如动态展示企业行业的景气水平,加强行业预警;针对挂牌企业个人化或家族控制的特征,应在不侵犯隐私的前提下,整合挖掘企业家人口统计特征、消费及相关行为数据。以权威性强的信息平台为基础,构建更灵活有效的风控体系,使得新三板市场不仅能被专业机构投资,也可被无专业经验的个体投资者青睐。