运用大数据提升信用评级质量和区分度：“咖啡馆”（CAFE）全息风险评估体系的探索

2022-03-04袁先智

清华金融评论 2022年1期

袁先智

目前，中国国内实施的信用评级体系仍面临评级虚高、区分度不足、事前预警功能弱等问题。本文介绍的基于“咖啡馆（CAFE）全息画像风险评估体系”的“先知通（IS）信用评级体系”运用大数据探索解决违约“坏”样本数量不够的问题，提升信用评级质量和区分度，对于中国构建以主体或者债项的违约率为核心的信用评级体系有积极意义。

信用评级行业是现代金融市场经济中的重要组成部分。经过近30年的发展，中国的信用评级业务已涉足金融市场的方方方面。但中国当前的信用评级体系仍面临评级虚高、区分度不足、事前预警功能弱等问题。中国的信用评级公司需要不断学习国际信用评级机构的评级理论和方法，逐步探索适合中国国情的信用评级方法和技术。

本文在分析中国金融市场信用评级体系现状的基础上，介绍了“‘咖啡馆’（CAFE）评估体系”框架建设的基本思想，希望对中国构建以主体或者债项的违约率为核心的信用评级体系起到添砖加瓦的作用。

中国金融市场信用评级体系的主要问题

信用评级行业是现代金融市场经济中的重要组成部分。信用评级行业的发展壮大乃至形成一种制度，一定程度上依赖于金融市场，特别是证券市场的发展。从20世纪初美国穆迪公司成为世界上第一家资信评级机构以来，信用评级行业经过百年发展，在推动市场发展、揭示和防范信用风险、降低交易成本以及协助政府进行金融监管等方面，发挥重要的中间作用，也经历过许多调整。

经过近30年的发展，中国的信用评级业务已涉足中国金融市场的方方方面。近年来，中国的评级行业在统一规则、完善监管、对外开放等方面取得了长足进步。不过，目前，中国国内实施的信用评级体系仍主要存在三方面的问题：一是评级虚高；二是区分度不足；三是事前预警功能弱。目前国内债券市场的信用评级分布主要以“AA”（或以上等级）为主体，而国际通用的是以中间信用等级（即，“A”和“BBB”信用级）为主导，两者之间的差异非常突出。据万得统计，截至2020年末，中国90%以上的发行主体评级分布在AA及以上的区间，整体评级较高且分布较为集中，不利于投资者辨识债券产品的风险程度，更不利于指导投资决策。目前，中国在资本市场每天基本保持存量续期的债券在5万支以上，每天有市场交易信息的债券数量约在1.2万支，其中，92%左右的债券评级被定位在AA信用级以上。这与债券本身在金融市场的真实表现情况存在差距。另外，从2018年开始，AAA评级的（国有平台的）公司或企业和债券直接倒闭、违约的事件多次发生，引发了针对目前中国信用评级体系的不信任感，不利于中国债券市场的健康发展。

构建以主体或者债项的违约率为核心的信用评级体系

作为全球第二大经济体的中国需要建立适合中国国情并与国际信用评级体系相契合的风险评估体系。2021年8月6日，中国人民银行等五部委联合发布《关于促进债券市场信用评级行业健康发展的通知》（以下简称《通知》），要求信用评价机构“应当长期构建以违约率为核心的评级质量验证机制，制订实施方案，2022年底前建立并使用能够实现合理区分度的评级方法体系，有效提升评级质量。”此后不久，2021年8月18日，中国人民银行等六部委联合发布《关于推动公司信用类债券市场改革开放高质量发展的指导意见》（以下简称《意见》），关于信用评级方法体系，其中提出“构建以违约率为核心的评级质量验证方法体系，推动形成有区分度的评级标准体系”“发挥双评级、多评级以及不同模式评级的交叉验证作用”。《通知》和《意见》都特别强调构建以违约率为核心的评级质量验证机制以及提升评级的区分度，这为提升中国信用评级质量和竞争力，与国际规则体系更加接轨，指明了方向。

构建以主体或者债项的违约率为核心的信用评级体系主要包括五部分：第一部分是构建以违约率为核心的信用评级标准；第二部分是构建信用风险需要的“违约矩阵”；第三部分是构建主体（公司）和债项信用资质变化的“信用转移矩阵”；第四部分是配套第二、三部分，针对信用模型表现的接受者操作特性曲线（Receiver Operating Characteristic Curve，简称ROC曲线）、ROC曲线下的面积（Area Under the Curve，简称AUC）进行测试；第五部分是构建反映中国资本市场真实情况需要的基本“（违约）坏样本”，这部分主要是支持第二、三、四部分，进而完成第一部分。

实践中，中国构建以主体或者债项的违约率为核心的信用评级体系面临的主要困难是，许多情况下，中国金融市场对应的资本市场 “违约坏样本”与西方国家金融市场的“违约”样本表现不同。另外，中国违约坏样本数据库样本不充足，从2007年至2020年，中国所有违约主体样本数仅有200个左右。同时，坏样本披露的（风险）信息完整度也不足。因此中国市场应该发展出适合中国情况的坏样本构建方法。中国信用评估体系也需要构建对中国坏样本的描述，而基于大数据等金融科技可实现这一构建。

“咖啡馆”（CAFE）全息风险评估体系探索

“基于咖啡馆风险评估框架下的评级应用”主要通过“先知通（Intelligence Stone，简称IS）” 评级体系实施。通过结合大数据的分析方法构建对应的非结构化“坏样本”作为分析的支撑，可以构建适合中国国情并与国际体系契合的现代信用评级体系，这个信用体系称为基于“‘咖啡馆’（CAFE）全息画像风险评估体系”的“IS信用评级体系”。

“先知通（IS）信用评级体系”不再以中国在过去近20年来较流行使用的“以AA信用等级作为投资级的基本标准”进行中国式信用等级评估服务，这就从标准的角度解决了与国际信用评级标准的差异问题，同时也能够让中国的信用评级体系体现评级迁移和违约风险等一系列配套的指标要求和信息披露。

在实现的过程中，从以下四个维度来定义公司债券的信用等级：第一，公司财务业绩的好坏；第二，公司有没有欺诈和对应的财务管理质量的好坏；第三，公司在金融资产负债方面的健康情况，即刻画公司倒闭或者违约的风险程度；第四，公司所处的生态环境和商务风险的好坏。通过建立这套全息评级系统可让评级区分度更加明显，主体信用等级更好地反映公司的实际信用状况（参见表1和表2）。

表1 BBD基于1年和2年期限数据的初评等级映射表

表2 BBD 2015—2020年转移矩阵汇总信息

“‘咖啡馆’（CAFE）全息风险评估体系”是集企业搜索、信息揭示、关联图谱等功能于一体的企业全息风险评估体系（以下简称“‘咖啡馆’信用”（CAFE Credit）），它由四个核心维度组成：公司全息画像（记为“C”，代表“Corporation”）、财务全息画像（记为“A”，代表“Accounting”）、金融行为全息画像（记为“F”，代表“Finance”）和商务生态全息画像（记为“E”，代表“Ecosystem”）。

这个体系最大的两个特征是，把静态分析转换为动态分析，再将动态分析和企业生态相结合，形成对企业评级较客观的刻画。不过，形成这样的刻画需要以2015年自主开发的全息画像（Hologram）为工具，进行异构异源大数据的融合。全息画像是利用生态并引进对场景、欺诈风险、违约风险的描述，从而形成新指标和特征提取。

需要注意的是，针对公司财务欺诈风险体系的建立，融合从财务报表分析、治理结构分析、审计与内控分析（基于“欺诈三角理论”）进行风险特征的提取和刻画，这三个方面包含传统的结构化和非结构化数据。基于欺诈三角理论的欺诈风险分析主要覆盖三个分析维度的信息：一是压力或动机维度，包含财务稳定性、外部压力、个人需要和财务目标等；二是机会或漏洞维度，包含行业属性、无效监督、组织结构等；三是借口或态度维度，包含审计维度。对此，《当代会计研究》（Contemporary Accounting Research）中《推断重大会计错误》（Predicting Material Accounting Misstatements）等文献均有提及。针对从2016年至2020年中国上市公司和非上市公司的欺诈类型进行分类，主要有占用公司资产、披露不实（其他）、违规担保、欺诈上市、擅自改变资金用途、一般会计处理不当、虚假记载（或误导性陈述）、推迟披露、虚构利润、重大遗漏、虚列资产。这十一类欺诈信息构建坏样本集合并结合审计信息，形成一个动态的、生态的企业风险评估。

解决方案：在大数据框架下基于人工智能随机搜索算法的风险特征提取

直到2020年底，中国可用来描述公司倒闭的坏样本总数仅200个左右。在结构化坏样本数量远远不足的情况下，需要另辟蹊径，探索通过提取非结构化的风险特征，来构建建模所需要的足够数量的坏样本。要支持约8000家的公司（其中上市公司约4800家，发债公司约5500家，金融机构约1000家，城投公司约2500家）在信用评级体系中针对“坏特征”的建立问题，如果基于总样本为4000家或8000家公司来考虑，按照对应1/4左右的坏样本数量标准，就需要1000或2000个左右的坏样本集合。这导致只能基于中国银保监会对上市公司和发债公司处罚的2700多个案例为原始（非结构化）数据，提取其中基于11大类的非结构化特征的坏样本，来构建至少1000个或2000个左右建模所需要的坏样本。这些非结构化坏样本与传统财务指标不同，是以文档陈述的形式出现于报告中，称为大数据样本。

为了实现这种刻画欺诈的非结构化特征的高度关联的风险特征提取，需要使用一个基于人工智能的算法工具——吉布斯抽样算法（Gibbs Sampling）。使用吉布斯抽样算法能提取出刻画财务欺诈、高度关联的非机构化风险特征因子，帮助构建甄别坏样本和好样本的风险评估体系，并达到对应模型测试的ROC曲线，ROC曲线值在0.7～0.75的区间（ROC测试结果在0.7或者以上，表明其使用特征具有较强的甄别和解释能力），从而支持“咖啡馆”体系比较有效地评估公司和债项的好坏。

公司股权结构是影响公司财务欺诈风险的重要因素。要对公司大股东、管理层、董事会、监事会按照持股比例、担任的身份、内外的比例分类分析，利用证据权重（Weight of Evidence，简称WOE）和信息价值（Information Value，简称Ⅳ）信息量来解释对评估对象可能会发生欺诈行为风险的影响。从公司治理框架的角度，可通过以下四个特征来预警可欺诈行为：第一，大股东和企业法人的持股比例在5%～50%；第二，大股东累计持股比例不超过60%；第三，管理层的大股东持股比例小于1%；第四，董事会中大股东比例不超过12%。

然后，纳入基于内部、外部审计相关数据进行特征体系的建立。实际上，公司存在欺诈行为的背后与审计机构的业务情况、违规情况、合作情况，审计师的教育经历、工作经历等都有关联。根据审计指标针对WOE分项结果和对应分析发现,审计委员会的人数、意见的不一致对公司的欺诈也有相应的影响。审计模型因子的ROC曲线是线性的，因此，外部审计只能发现有没有欺诈，但形成不了推理（如果外部审计能够形成推理，对应的ROC曲线应该是非线性的凸函数形态）；而在对公司董事会人数与公司资质关系的研究中发现,无论公司评级如何，董事会人数为7～9人的情况都占了全部公司总数的80%（大型金融机构和大型集团公司除外）。因此，在公司注册法要求的情况下，董事会的人数在合理的范围之间并不能形成对公司好坏的影响。结合董事会、内部审计和外部审计的因素发现，经常有审计公司给出错误意见（即在公司存在欺诈行为的时候给出无保留意见）。与此相对的是，全息画像技术可以用来验证外部审计做得是好还是不好。

中国金融市场信用评级的“咖啡馆”评估体系的构建

信用等级调整是信用评级机构最重要的评级行动之一，信用等级调整行为包括调升、调降和维持。在一定的时期（考察期）内，信用评级机构对债务发行人的信用等级调整结果可以形成债务发行人的信用迁移路径，这反映了债务发行人信用质量的变化。

“咖啡馆”信用转移矩阵构建的映射规则

为了使得“咖啡馆”信用评估体系的转移矩阵保持必要的稳定，对评级转移矩阵的构建按照以下方式进行处理（见表1）。

首先，将违约模型分为1年期和2年期，并进行ROC验证，确定最终的模型；然后，根据1年期和2年期的违约模型给出不同的评级结果；最后，对1年期和2年期评级结果进行整合，给出初评等级。

信用转移矩阵构建的数据样本使用说明

由于数据获取的有限性，“咖啡馆”对上市公司样本的观察数观察限于2014—2019年，2014年有完整年报财务信息的公司数为3000家，2019年为4500家。以2020年12月31日为观察日，倒回一年的违约样本数为44家；倒回两年的违约样本数为89家。

基于上面映射规则的使用，利用1年期和2年期的违约模型对评级结果进行整合后，会观察到下面的基本结论：从评级AAA-A类到CCC-C类的信用转移矩阵基本上以BBB为中心，保持良好的稳定性，从而解决AAA、AA和A级别迁移矩阵不稳定的问题（特别是针对像中国这样的新兴市场的情形）。从信用转移矩阵来看，如果将AAA到A归为一个“AAA-A”的大类来看，通过调整映射阈值后，有下面的信用转移矩阵结果（见表2）：

由转移矩阵结果可知，AAA-A等级合并后保持更好的稳定性，转移矩阵也体现出从AAA-C的在各级别稳定性上的单调递减，这就支持“咖啡馆”体系的相对稳定性问题，从而起到支持业界的作用。

基于“咖啡馆”评估系统的应用简述

作为“咖啡馆”全息风险评估系统的应用，建立的“先知通（IS）信用评级体系”根据公司财务业绩、财务舞弊、违约和生态环境的好坏，形成对中国整体公司主体和对应债项的信用评级体系的重塑。根据基于“咖啡馆”评估系统的IS信用评级体系对中国所有4800家左右上市公司进行的信用评估，在2020年底左右，中国信用评级为AA以上的上市公司占中国整体上市公司的10%左右，等级为AAA的公司只占整体的1%左右。相较于国外，美国上市公司AAA级的比例占2%～4%，日本上市公司AAA级的占比为3%～6%。从上市公司等级分布、违约概率期限结构以及ROC曲线的检测结果来看，“咖啡馆”评估系统刻画中国公司的信用风险特征更具优势，同时有较好的预测能力。

以表3中的公司为例，该公司的生态风险评分和行业平均相当，但财务绩效评分和财务舞弊概率都比行业平均的结果差。

表3 “XX科技公司”与行业平均的对比

此外，“咖啡馆”全息风险评估体系在具体的股票市场、信用市场、资本市场等不同的应用场景中可形成不同的产品落地应用。 “咖啡馆”全息风险评估体系还可以刻画行业中的风险转移和行业链场景，对应行业的产业链上下游链的全息画像，配合关键词字典的支持，其上下游链分类的正确率在65%～75%。

总结

“基于‘咖啡馆’风险评估框架下的评级应用”，其核心基础是大数据分析的全维度分析评估，同时结合“异源异构数据”与“动态本体论”，能够实现对企业风险基因的提取，解决体现中国金融市场本身特点的（违约）“坏”样本不够的问题，从而在基于针对公司主体进行全息画像（企业全貌）的基础上实现从“企业经营”“财务行为”“金融行为”“企业生态”四个维度对企业信用风险进行全方位动态评估。针对真实场景的应用表明，先知通(IS)评级体系对中国债券市场的信用等级分类具有较强的区分度。