APP下载

基于逻辑回归算法的债券市场实质违约因素分析与实质违约风险预警

2021-10-12田崇文西交利物浦大学理学院金融数学

营销界 2021年26期
关键词:本息展期实质

田崇文(西交利物浦大学理学院金融数学)

■ 前言

我国债券违约类型主要分为本息展期(BXZQ)、触发交叉违约(CFJCWY)、担保违约(DBWY)、技术性违约(JSXWY)、提前到期未兑付(TQDQWDF)、未按时兑付本金(WDBJ)、未按时兑付本息(WDBX)、未按时兑付回售款(WDHSK)、未按时兑付回售款和本息(WDHSKLX)、未按时兑付利息(WDLX)。最新状态主要分为实质违约(Szwy)、展期(Zq)、触发交叉违约(CFJCWY)、已兑付(Ydf)四种状态。同时公司也分为上市(Yes)与非上市(No),公司的性质也分为民营企业(MY)、中外合资企业(ZWHZ)、公众企业(GZ)、其他(QT)地方国有企业(DFGY)、中央国有企业(ZYGY)、外资企业(WZ)。本文主要通过对违约类型的总结、最新状态、公司的性质、是否上市来分析,对各种因素进行分析,以得出结论,判断各种情形对最新状态的影响,并对公司是否违约、新状态是否实质违约进行预测。

■ 逻辑回归算法的理论基础

(一)逻辑回归算法简介

在统计学中,二分类问题的常见估计方法为“逻辑回归”,这是统计学的分类问题,即考虑两点分布。在给定x 的情况下,考虑y 的两点分布概率:

其中,函数F(x,β)称为连接函数,因为它将特征向量x 与响应变量y连接起来。在给定x的情况下,y的条件期望为E(y|x)=1×p(y=1|x)+0×p(y=0|x)=p(y=1|x),可将模型的拟合值(预测值)理解为事件“y=1”的发生概率,如果F(x,β)为标准正态的累积分布函数,则其中,φ(.)与 Φ (.)分别为标准正态的密度函数与累积分布函数,此模型称为概率单位模型。由于标准正态的密度函数之积分并无解析表达式,须进行数值积分,故计算不便。由于回归参数β出现积分上限,故无法解释其含义。

如果连接函数F(x,β)为“逻辑分布”的累积分布函数,则

此模型称为逻辑回归,对逻辑函数 Λ (⋅)求导数,即可得到逻辑分布的密度函数:

本文将在下文中,依据此模型进行实证分析

(二)逻辑回归算法解释

■ 实证分析

本文的数据来自Wind 数据库,收集了2014—2021 年的债券违约事件,本文对数据进行处理,以公司的性质、是否上市、违约类型、最新状态为切入点,对债券市场进行分析。

通过python,我们得到了以下图表。

表1 数据的统计特征

结果显示,整理后的数据框ZJWYDQ 包含929 个观测值与4个变量,考察数据框的统计特征,结果表明,在全部929 个公司中,634 个民营企业,294 个未按时兑付本息,687 个未上市公司,774 个最新状态为实质违约。

表2 展示了四种最新状态(触发交叉违约,实质违约,已兑付,展期),分别在是否上市这两种分类下,四种最新情况分别所占的比例。可以分析是否上市对四种状态的影响,比如,实质违约与已支付的比例差别不大,但可以明显看出,触发交叉违约与展期的比例中,上市公司的比例几乎是非上市公司的两倍。因此可以看出,企业是否上市对违约新状态有影响。

表2 考察是否上市的影响

表3 展示了四种新违约情况对应公司的性质,表3 对公司性质的影响进行了详细的解释,本文从表中可以得到解释。在触发交叉违约类型中,除了民营企业,其他企业均为0。公众企业全部为实质违约。在已支付类型、公众企业、外资企业、中外合资企业占比均为0,在展期状态中,地方国有、其他、外资类型占比较高。通过表3 可以明显看出,公司性质对违约最新状态有明显影响。

表3 考察企业性质的影响

本文从表4 得知,当原违约状态不为触发交叉违约时,新状态不会变为触发交叉违约,当原状态为担保违约,未按时兑付回售款几乎全部变为实质违约。交叉性违约有一个相当高的比例变为已支付。而本息展期也有一个相当高的比例变为展期,但除了本息展期,仅有未兑付本金和利息与未按时兑付回售款和利息有一个较小的概率会变为展期。表4 告知了我们原违约类型对新状态确实有影响。

表4 考察违约类型的影响

本文通过python 的sklearn 模块,将样本随机分为两组,其中70%作为训练集,30%作为测试集,进行迭代与回归,我们可以得到下表。

表5 使用Numpy 的exp()得到几率比。结果显示,给定其他特征变量,当违约类型由本息展期变为触发交叉违约时,公司违约的几率将是原几率的2.28375e+1 倍,又比如,当一个公司由非上市公司变为上市公司时,公司违约的几率将是原几率的1.650774e+00 倍,当一个公司由地方国有公司变为公众公司时,公司违约的几率将是原几率的3.492696e+09 倍。

表5 考察各种变量的几率比

通过summary()方法,本文得到了以下逻辑回归的汇总表。

上表的右下角显示,准R~2 为0.4016。表格下部显示,除了Weiyue[T.DBWY],Weiyue[T.JSXWY],Weiyue[T.WDHSK]等指标以外,其余各项P 值均小于0.05,证明其余各项均在统计学上高度显著。根据左下角,除了intercept 与Xingzi[T.MY],Xingzi[T.QT],Xingzi[T.WZ],Xingzi[T.ZYGY] 的 系 数为负,其余系数均为正数,这些符号符合预期。然后我们使用get_margeff 进行数据的二次处理,得到逻辑回归的平均边际效应。

通过表6 与表7,我们可以对回归结果进行预测,并计算混淆矩阵,本文根据算法,依次得到以下数据(测试集的结果):

表6 数据汇总表

表7 特征的平均边际效应

(2)通过公式Accuracy=(table[0,0]+table[1,1])/np.sum(table)。我们得到准确率为0.9107692307692308,同理,我们得到错分率为0.08923076923076922。

(3)灵敏度为0.9649446494464945,特异度为0.6388888888888888,召回率为0.9306049822064056。以上结果显示,训练样本的预测准确率为0.9107692,但是在正例(实质违约)中的预测准确率却高达0.9649446,而在反例(其余新状态)中的预测准确率仅为0.638889。由于反例中并不仅有一种新状态,所以反例更难预测。本文在下文中,对测试集进行预测,将预测通过概率定为0.5,得到以下结果。

表8 则给出了各项的系数,通过这些系数,我们可以得到逻辑回归的公式。

表8 模块的估计系数

经过公式及python 的运算,我们得到以下数组:

表9 实质违约的概率

此数组表示了每一个公司新状态为实质违约或其他状态的概率,经过逻辑回归的python 预测,我们得到了,所以我们可以得知,前五个公司的新状态为实质违约。此数组同时也可以作为风险预警的指标,对市场进行风险预测。

由表10,我们可以得知,precision=TP/(TP+FP),精确率是精确性的指标,表示被分类器正确分为正例的个数(TP)占被分类器分为正例的样本(TP+FP)的比重。recall=TP/(TP+FN)=TP/P。召回率是覆盖面的度量,也就是被分类器正确分为正例的个数(TP)占原始数据中全部正例(TP+FN)的比重,所以上市公司的precision=TP/(TP+FP)=0.93,recall=TP/(TP+FN)=0.96。F1-score,也称为F-beta score。

表10 数据的统计指标

只有当P 和R 都很高的时候,F1才会高,所以称为调和平均数,F1的取值范围是0 到1。

support 支持度,是指原始的真实数据中属于该类的个数。通过表10,我们可以对精确性与准确性有一个全面的了解。

在图1 中,横轴为“假阳率”,即(1-特异度),而纵轴为“真阳率”,及灵敏度。图中右下角AUC=0.85,同时KAPPA率为0.6495,证明一致性较好。

图1 测试集的ROC曲线图

■ 结论

本文通过各种图表,运用逻辑回归方法,求到了各种数据,在实证分析中,也逐一分析各种特征变量对响应变量的影响。同时通过总结表,得出了各种变量的系数,检验了各种统计变量的统计学意义。在本文得到了逻辑回归的公式之后,可以得出本文所设计的风险预警系统。

通过本系统,可以对结果进行预测。例如,当最后结果为0-0.2,则意味着此公司有很小的可能性会变为实质违约,当结果为0.8-1.0 时,则意味着此公司有很大的可能性会变为实质违约。通过此系统,可以更好地检验商业风险。

猜你喜欢

本息展期实质
照猫画虎
不说话、不说真话、不说有实质内容的话 “沉默干部”的五种面孔
不给他人“提篮子”——“提篮子”的实质是“谋私利”
例说追及问题的解法归类
等额本息还款方式的数学推导与分析
题目:好……又好……
让生命“展期”
崇本息末与崇本举末