“另类数据”对于分析研判企业财务状况的价值与思考
2022-06-19张冬
张冬
近年来,探索“另类数据”应用的研究日渐兴起,通过分析财务数据的局限以及“另类数据”的特点,研究重点探讨了其在企业业绩预测、财务困境识别与预警、财务舞弊甄别方面的应用价值,并结合应用中面临的挑战给出了建议。
数据作为数字经济时代的基本元素,已被国家明确列为与土地、劳动力、资本、技术并列的第五大生产要素并受到各方关注。数字经济环境下的数据通过计算机和互联网等工具捕捉、管理和处理形成数据集合和信息资产[1]。在财金领域,财务数据以及由此构建的财务指标形成了财务分析的基础,随着信息化、智能化技术的应用,更多“另类数据”等非财务数据被纳入分析框架,基于财务数据和非财务数据的综合评价体系日渐受到青睐。“另类数据”成为热议话题,主要得益于投资机构通过数据挖掘和检验发现了“另类因子”用以获取股市超额收益。实际上,研究探讨“另类数据”在企业业绩预测、财务预警、财务舞弊等方面的应用存在着巨大潜力。
一、财务数据用于分析研判的局限
第一,财务数据的滞后性不利于获悉企业的最新状况。虽然上市公司定期披露财务季报,信息更新频率优于非上市企业,但依旧属于事后披露,滞后的信息一来不能体现企业实时经营动态,二来此期间若遇外因(如事件)冲击,可能导致分析结论与企业现实状况不符,进而影响判断和决策。
第二,可能存在的财务数据粉饰现象无助于把握企业的真实状态。一方面,出于美化财务报表的动机,部分企业有可能在遵守会计准则的前提下粉饰现有经营成果,隐瞒或掩盖潜在风险;另一方面,亦有企业可能出于商业竞争和保密需要,合法合规合理的隐藏自身一些潜力或优势。这两类情形终将导致分析研判出现偏差。
第三,财会信息含量日趋下降使得财务分析研判的价值缩水。有学者[2]通过实证研究发现,古老的财会信息范式已渐渐不能满足当前因技术变革、交易创新、商业模式蜕变所要求的信息需求,财务数据的有用性正在减弱,例如定期发布的财报在预测企业未来盈余方面的作用越来越弱,最为主要的三个因素归结于商界无形资产的兴起、会计估计的困难、关键影响因素的缺失。
第四,财务数据自身的局限导致不能直观反映企业多维信息。财务数据不具备能够直接反映诸如行业、市场、竞争态势等企业发展趋势的外在信息,也不直接体现企业内部组织效率、文化、人才优势等内在信息。总之,财务数据及指标所能够测度的企业状况相对有限,无法直接体现和反映诸如风控、内部资源整合、社会责任履行等信息。
二、“另类数据”的界定及优势
“另类数据”至今没有统一明确的定义,摩根大通[3]将其大致分为个人活动(如社交媒体帖子、产品评论等)、商业活动(商业交易、支付数据等)和传感器生成的数据(卫星监测数据、行人和车流量等)三类。廖理[4]认为“另类数据”泛指区别于传统金融数据的有价值的信息和数据,该类数据多以文本、图片、音频、视频等非结构化形式存在,具备大体量、实时或接近实时获取、种类丰富多样等特点。其主要优势表现为:第一,拓宽了分析研判的信息维度。与财务数据相比,“另类数据”包含了更多预见和洞察力的信息,可弥补财务数据覆盖面不广的缺陷,有助于改进分析研判的工作质量;第二,增强了分析研判的时效性。“另类数据”获取和传输的实时性大为提高,有助于及时把握或預判企业真实的经营动态、处置或化解经营风险、调整或优化经营策略,从而为企业稳健经营提供参考;第三,为智能分析研判提供了机遇。“另类数据”多样化的数据形式和丰富的信息含量为有效运用数据挖掘、聚类分析、机器学习等研究方法提取蕴含其中的“金矿”,用以实现智能分析决策提供了创新和便利之道。
三、“另类数据”应用于其中的价值体现
(一)企业业绩预测
借助线上销量数据分析预测企业营收。电子商务的蓬勃发展提升了商贸活动的效率,大数据公司通过监测以电商业务为主的商家和企业的周度、月度商品销量及客户评论等数据,不仅可以实时掌握经营主体的时序销售情况、判断热销品类、获取品牌市场占有率等信息,而且还可以实时分析预判营收动态等经营指标。信息获取的领先程度大为提高,为相关方实时研判行业发展趋势、调整竞争策略、增强经营的灵活性和主动性提供了帮助。
借助卫星数据分析预测上市公司业绩。卫星遥感监测具有范围广、高效、相对精准等特点,借助卫星感知地面工厂可见光强度和温差,可以分析预测企业经营状况。通常而言,夜光强度和红外温度高,则企业生产经营活跃,最终会对业绩产生积极影响。已有科技企业对特斯拉美国加州弗里蒙特工厂(整车及零部件主要生产基地)的卫星监测显示,特斯拉夜光数据与汽车销售营收数据的二者趋势(2014年-2019年)高度一致,趋势拐点相符,对于实时掌握企业生产状况、动态预测其业绩变化提供了新渠道。
借助战略性资产分析研判企业未来业绩增长潜力。巴鲁克·列夫和谷丰[2]认为某些行业决定企业成长和保持竞争优势的因素不再是衡量历史盈利、偿债能力等为导向的财务指标,而是决定企业未来业绩的战略性资产的多寡以及管理层对这些资产配置的成效,包括在研药品临床试验的成功率,保险公司保单的续保模式,互联网企业的新客户增长率和客户流失率,企业研发的投入和专利的转化率、保护期以及保护范围,勘探中油井矿藏含量的前景,航空公司飞机运载能力使用率的趋势,企业内部科学家、明星或关键人物等特殊人才的数量及其贡献等信息。这些优势相对稀缺且更加难以模仿,是企业获得竞争优势并保持业绩领先的关键变量。
挖掘文本增量信息用以分析预测企业盈亏。相较于财务数据,运用文本挖掘技术获取前瞻性信息并构建指标来预测企业业绩的研究较为新颖。例如,管理层讨论与分析(MD&A)作为上市公司年报、业绩说明会、招股说明书所涉及的内容,有研究文献探讨了其对企业盈利的预判价值。其中,管理层对存货异常增加的讨论可以预测企业盈利[5],管理层正(负)面语调与上市公司T+1年业绩显著正(负)相关[6],招股说明书中的负面语调与IPO 后公司业绩表现显著负相关[7],MD&A语言质量综合指标对于预测公司未来财务业绩作用明显[8]。
(二)企业财务困境的识别与预警
涉及企业生产经营的动态信息开始用于财务风险识别。危机管理理论将一系列不佳的财务状况称为“财务危机”“财务困境”[9],包括企业拖欠优先股股利和债务、银行透支、破产等现象[10]。为有效把控经济结构调整期债券市场违约事件频发的风险,有科技企业通过实时监测,发现部分发债企业的员工人流强度和夜班员工比例、进出厂区的卡车数量、律师活跃度和法律诉讼案件数量可用于预判企业债风险;而商场顾客和停车位车辆变化、物业出租率等指标变动,有助于预判ABS风险。实时变化的“另类指标”为相关方提前掌握更多信息并提早应对债务违约或延期偿付等财务危机提供了新思路。
数据挖掘和整合得到大数据和机器学习等技术的支持。早期对于财务预警的研究多基于财务指标,新技术的应用为挖掘新的财务预警指标、探索财务预警新方法创造了条件。有研究人员[11]运用情感分析方法并统计网民信息发布的频次,加以融合形成传感信号,同时结合财务指标,构建基于大数据的财务风险预警模型,研究发现相对于单纯使用财务指标,预警模型具有更好的前瞻性;还有学者[12]运用机器学习法对上市公司业绩爆雷进行预警分析,通过将财务指标与企业商誉、并购指标适当结合,发现商誉和长期负债过高的企业业绩更易爆雷,而企业收益、营运能力以及现金流也对业绩爆雷产生重要影响。
已有非财务影响因素持续得到深入研究和应用。将影响企业运营的内、外部非财务信息引入财务预警模型进行研究的做法并不少见。如涵盖外部因素的实际GDP增长率、贷款利率等[13]宏观经济变量,衡量行业产出变化的中观指标[14],以及企业内部因素诸如股权结构、公司治理以及管理层激励、投资者保护[9]或者企业重大事项、人力资本[15]等微观指标。运用非财务数据与财务指标将两者结合,共同构建财务困境预警分析体系(系统),改进了模型预警的效果,拓展了财务预警的研究边界并丰富了其内涵。
(三)企业财务舞弊的甄别
数据挖掘拓展了财务舞弊甄别的信息维度。财务报表修饰和美化手段的使用,降低了单纯使用财务信息识别舞弊造假的效力,数据挖掘技术为研究使用非财务信息探究财务舞弊提供了可能。研究表明,管理者特征、企业文化、内控环境、薪酬激励等企业内部因素与企业财务欺诈相关联[16];宏观经济、行业景气、监管、关联方交易等企业外部因素也对财务舞弊产生影响,综合数据挖掘方法和非财务指标的模型可以获得更好的造假识别率[17]。此外,对于第三方渠道如审计信息的非正常变更、客户和供应商的异常、银行账户和对账单、海关报关单等信息的核实与分析,亦有助于财务舞弊的甄别。
文本挖掘有助于提升财务造假甄别的准确率。有研究人员[18]融合新闻情感指标与财务指标,依托新闻报道建立新闻“数据库”并对上市公司进行情感分析,将生成的积极、消极情感等新闻情感指标,与5个反映公司财务状况的指标相结合,共同构建财务造假识别模型,再与单纯使用财务指标或新闻情感指标构造的模型进行比较,对比发现融合了两类指标的模型对于造假识别的准确率最高。还有学者发现财务报告的负面、不确定性及财务诉讼词汇占比与财务欺诈显著相关[19];或使用决策树模型构建最能区分虚假和真实财报的词汇排序表,并以其中前200个词汇为基础采用支持向量机(SVM)技术预测财报的真实概率,得出正确的分类率约为82%[20];或从公开披露的财报等信息中提取的语言线索对比研究虚假披露和真实披露之间的差别,发现虚假披露组别更多倾向使用煽动性的语言、词汇、比喻以增加受众阅读的愉悦感,不过词汇的多样性相对更少,但披露内容较多,目的在于看上去可信,但其中包含的实质内容却更少[21]。
四、“另类数据”应用中面临的挑战
一是数据面临伦理与治理方面的争议。如果缺乏约束和有效规制,“另类数据”的独特性和稀缺性,也可能对个人、企业甚至社会产生消极影响。例如,舆情数据、支付数据、医疗保险数据、地理位置信息都可能涉及隐私问题,这些数据的商业化应用与安全使用、隐私保护之间的矛盾已成为不可回避的议题,实践中有待具体法规和政策加以持续细化。
二是数据质量问题影响研究分析的效果。由于“另类数据”来源广泛,可能存在数据維度诅咒、数据造假或数据有偏等问题,具体表现为:样本数量的限制与指标参数的激增,使得预测模型存在更高的过拟合风险;虚假评论、用户刷单等不良行为增加了获取真实数据的难度;数据覆盖范围、历史长短等因素是否较好的代表了样本整体特征等等。如果处理不妥,研究结论的可靠性就会下降。
三是数据获取和分析的高门槛限制了推广使用。“另类数据”来源广泛、形式多样、标准化程度低、挖掘提取难度较大,现有的统计方法乃至计量分析未必完全适用;自然语言处理、广义人工智能技术的嵌入,大大超出了财经类人员的专业范畴,对研究人员的综合能力特别是数据挖掘、清洗、编程、建模等能力提出了高要求。
五、思考与建议
第一,贯彻落实法律法规,强化数据治理。当前,国家涉及数据安全和个人信息保护的相关法规已经颁布,应当依法依规强化对于“另类数据”在内的数据采集和使用行为的监管,加大对于数据产权和个人信息的保护力度,为数据产业持续健康发展提供制度保障。同时,进一步完善“另类数据”规范使用和流通的政策措施,包括制定发布行业标准和规范,激发市场主体活力,畅通数据流通机制,建立健全数据要素市场并有效发挥其资源配置功能,培育有利于“另类数据”生产、使用和管理的良好环境。
第二,加强创新,不断深化“另类数据”与财务数据的融合运用。一方面要持续增强研究能力,有效发挥大数据分析和人工智能等新技术的优势,在所挖掘数据的真实性和模型适用性方面持续探索,不断拓展“另类数据”的应用空间;另一方面要重视“另类数据”这类变量在研究中的因果关联和解释,特别是明晰蕴含在其中的内在经济金融机理和逻辑关系,同时做好与财务数据的配合,建立健全适用于智能分析、预警、甄别的科学指标体系,提升分析预测的精度和效能。
第三,提升“另类数据”的标准化程度,打造更高质量的数据基础设施。相对于传统商业或科研数据库中已有的标准化财务数据,以非结构化形式存在的“另类数据”,散落并隐含在浩瀚的各类信息和资料之中,亟待提取加工并形成标准化数据,用以构建日渐兴起且覆盖更广信息维度的新型或特色数据库,为分析研判和科学决策提供支撑。同时,实践中还应明晰数据授权、共享和具体应用的规则,在提升“另类数据”使用便利化程度的同时,降低推广使用成本,为学界、业界、监管方等使用者提供更加丰富、便捷的数据产品和服务。
参考文献:
[1]何玉长,王伟. 数据要素市场化的理论阐释[J]. 当代经济研究,2021(4):33-44.
[2]巴鲁克·列夫,谷丰. 会计的没落与复兴[M].方军雄译.北京: 北京大学出版社,2018.
[3]Kolanovic M., Krishnamachari R. T. Big data and AI strategies—machine learning and alternative data approach to investing[R]. J.P. Morgan Global Quantitative and Derivatives Strategy. 2017(5): 1-276.
[4]廖理. 另类数据:经济增长的新亮点[J]. 人民论坛·学术前沿,2021(4):22-27.
[5]仇莹,张志宏. 存货异常增加与盈利预测相关性研究——基于“管理层讨论与分析”存货信息披露[J]. 湖南师范大学社会科学学报,2016(4):110-116.
[6]谢德仁,林乐. 管理层语调能预示公司未来业绩吗?——基于我国上市公司年度业绩说明会的文本分析[J]. 会计研究,2015(2):20-27.
[7]贾德奎,卞世博. 招股说明书负面语调能预测IPO后业绩表现吗?[J]. 金融论坛,2019(10):60-69.
[8]王泽霞,潘梦雪,郜鼎. MD&A语言特征与公司未来财务业绩——基于中国创业板制造业上市公司的实证研究[J]. 财会月刊,2019(2): 78-87.
[9]田宝新,王建琼. 基于财务与非财务要素的上市公司财务困境预警实证研究[J]. 金融评论,2017(5): 103-115.
[10]Beaver W. H. Financial rations as predictors of failures[J]. Journal of Accounting Research, 1966, 4(1): 71-111.
[11]宋彪,朱建明,李煦.基于大数据的企业财务预警研究[J]. 中央财经大学学报,2015(6):55-64.
[12]张宏斌,郭蒙. 机器学习与财务预测——来自中国上市公司业绩爆雷预警应用的经验研究[J]. 金融学季刊,2020(4):135-154.
[13]卢永艳. 宏观经济因素对企业财务困境风险影响的实证分析[J]. 宏观经济研究,2013(5):53-58.
[14]Platt H. D., Platt M. B. Development of a class of stable predictive variables: the case of bankruptcy prediction[J]. Journal of Business Finance and Accounting, 1990, 17(1):31-51.
[15]曾繁荣,刘小淇. 引入非财务变量的上市公司财务困境预警[J]. 财会月刊,2014(8):25-30.
[16]张力派,程晨,陈玲玲. 大数据时代对上市公司财务舞弊的影响——研究综述及展望[J]. 管理现代化,2020(5):122-129.
[17]彭子坤,曾志勇. 基于非财务信息的财务舞弊识别问题综述[J]. 财会通讯,2013(14):55-57.
[18]张春梅,赵明清,吴学子. 基于新闻情感的上市公司财务造假识别方法研究[J]. 山东科技大学学报(自然科学版),2021(1):91-99.
[19]Loughran T.,McDonald B. When is a liability not a liability? Textual analysis,dictionaries,and 10-Ks[J]. The Journal of Finance,2011, 66(1): 35-65.
[20]Purda L., Skillicorn D. Accounting variables, deception, and a bag of words: Assessing the tools of fraud detection[J]. Contemporary Accounting Research, 2015, 32(3):1193-1223.
[21]Humpherys S. L., Moffitt K. C.,Burns M.B.,Burgoon K.C., Felix W.F. Identification of fraudulent financial statements using linguistic credibility analysis[J]. Decision Support Systems, 2011,50(3): 585-594.
作者單位:中国期货业协会,高级经济师,博士。