基于文本挖掘的数字化水平与运营绩效研究
2021-06-24任碧云
任碧云,郭 猛
(天津财经大学 金融学院,天津 300072)
一、引言与文献述评
2020年5月14日,习近平总书记在中共中央政治局常委会上提出“逐步形成以国内大循环为主体、国内国际双循环相互促进的新发展格局”,这是当前中国经济发展的核心战略。在此“双循环”中如何促进国内经济良性循环则成了当前经济发展的重要问题。根据林志刚等人的观点,国内经济良性循环的关键要以产业升级为先导,加强科技突破与产业升级,而当前产业升级的核心是如何实现产业数字化和数字产业化的健康发展[1-2]。根据姚树洁提出的“板链拉动”战略,“互联网+数字经济”是推进中国内循环高质量发展的关键“链条”,数字经济还能显著解决资本错配问题,因此系统提升数字经济相关产业的发展水平成为解决该问题的核心[3-4]。本文拟在此背景下从微观角度研究企业数字化发展水平和企业运营绩效的动态关系,进而为中国数字产业发展和结构升级寻求微观经验基础。
中国共产党十九届四中全会提出将“数据要素”作为新的分配要素纳入到收入分配体系,这意味着数字经济将成为未来影响中国乃至世界经济的核心动力源之一。根据《中国数字经济发展白皮书2020》可知,中国数字经济规模已经从2005年占GDP比重的14.20%发展到2019年的36.20%,2019年绝对规模产值已达到35.84万亿元,可见数字经济已经成为中国经济增长的核心引擎[5]。在此背景下,企业不断进行数字化变革,如电信业基础支撑作用在不断增强,互联网和相关服务业稳步增长。在如此快速发展的数字经济浪潮中,企业数字化水平提高是否促进了企业运营绩效提高?如果存在这种正向效应,其传导路径是什么?这些问题在相关研究中仍没有得到有效验证。
学者对数字化水平和企业运营绩效关系的研究尚未形成统一结论,第一种观点认为数字化水平并不能对企业运营绩效水平产生促进作用,如Li和Jia采用多元面板回归方法发现数字化水平并不能促进企业运营绩效,原因是这种促进作用实现的条件无法得到满足[6]。Hajli等分析了企业异质性对此促进作用的影响,研究发现数字化水平只能提高那些对数字技术较为依赖企业的运营水平,如信息通讯业、软件与互联网企业,但是对传统的制造业、房地产业的影响并没有表现出促进效应[7]。余江等认为企业数字化水平提升可能依赖大量的投资和管理成本,这会导致企业运营绩效下降[8]。周青等通过实证方法检验了数字化水平带来的学习成本提升对企业运营绩效的抑制效应[9]。第二种观点认为数字化水平提升有助于企业运营绩效增加,代表性研究如下:汪淼军等认为企业生产绩效随着企业信息化资本的增加变化,并且大企业信息化的绩效显著高于中小企业[10]。戚聿东等认为数字化水平提升不仅有助于企业治理结构的创新,还有助于推动企业内部管理模式的变革[11]。
现有研究中对数字化水平影响企业运营绩效中介效应的相关研究很少,代表性研究如下:Al-Adwan等认为信息对称性具有完全的中介效应[12]。戚聿东等认为在数字化水平影响企业绩效的过程中存在管理活动和销售活动两条传导路径,但是销售活动表现出完全中介效应,而管理活动并不存在中介效应[13]。
从现有研究看,数字化水平提升对企业创新绩效影响的研究较少,且未得出一致结论。本文分析中国企业数字化水平对运营绩效的影响,并从信息对称性水平、商业模式创新水平和管理成本降低水平三个角度进行中介效应检验,结果发现中国数字化水平确实提高了中国企业的运营绩效,且信息对称性水平表现出完全中介效应,商业模式创新水平起到部分中介效应,管理成本降低水平并未表现出中介效应。本文创新主要表现在两个方面:一是在研究方法上使用文本挖掘技术解决了“企业数字化水平”定量测度的难题,并采用中介效应模型验证了数字化水平影响企业运营绩效的三重中介效应。二是在研究视角上从宏观转向微观,采用实证模型验证企业数字化水平对企业运营绩效的影响。本研究结论对中国企业持续深化进行数字化转型提供了实证依据和政策支持。
二、理论机制及研究假设
(一)理论机制
影响企业运营绩效的因素是多方面的,根据现有公司治理理论及相关实证研究结论,宏观经济发展及其政策背景是影响企业运营绩效的核心因素,如吴超鹏等认为社会资本可以通过缓解融资约束和减少知识产权被侵权风险等途径来促进企业运营绩效的提升[14],钟覃琳等认为反腐败可以促进企业运营绩效[15]。与此同时,企业内部治理水平也是影响企业运营绩效的主要因素[16]。除此之外,企业特征会对这些因素影响企业绩效的过程起到调节作用,这主要包括:股权性质差异、行业差异、规模和市场占有率差异、董事独立性差异等[17]。值得指出的是,宏观经济发展及政策背景具有同质性,在某个具体的时点企业面临的宏观背景是一致的,这导致该变量对企业运营绩效的影响凸显在单个企业中,但是对整个企业群进行实证分析时不具有动态可变性。因此,本文认为宏观经济发展及政策背景是影响企业运营绩效的前置变量,企业特征和企业治理则是影响企业运营绩效的核心变量。
数字化时代的到来,数字产业化进程和产业数字化进程在近五年表现出高速增长的态势,企业数字化水平对运营绩效的影响越来越明显,如谢康等构建了“大数据资源—企业能力—产品创新绩效”链式中介模型探讨了大数据从可能的生产要素成为企业现实生产要素的实现机制[18]。本文认为企业数字化水平的提升可以从三条路径影响企业运营绩效:一是企业数字化水平提高可以显著提升企业的内部信息对称性水平,从而有助于企业运营绩效提升;二是企业通过数字化转型可以改变原有商业模式,使得改革后的商业模式更契合于数字化时代的特征和客户多维需求,从而有助于提升企业运营绩效;三是数字化水平提升可以直接作用于企业的日常管理活动,使得企业管理效率得到显著提升,并可以降低管理费用进而促进企业运营绩效提升。图1表示了上述理论机制。
图1 数字化水平影响运营绩效的理论机制
值得说明的是,在影响企业运营绩效的四个核心因素中,政策背景属于典型的前置变量,企业特征和企业治理对运营绩效的研究成果较为丰富,并在理论层面、实践层面、实证研究层面取得了较为统一的研究结论,因此在控制了这些变量后,企业数字化水平成为影响企业运营绩效的核心要素。
(二)研究假设
关于企业数字化水平对企业运营绩效的研究尚未有统一的结论,目前争论的焦点有三点:一是数字化水平是否提高了企业运营绩效,二是如果数字化水平提高了企业运营绩效,其传导路径是什么?三是如果没有正向影响,其原因是什么?本文认为随着国家对“数字经济”的扶持力度进一步提高,企业数字化转型速度越来越快,已成为中国企业发展的主要趋势。企业数字化水平对企业运营绩效的促进作用会通过企业治理的帕累托改进实现,因此,提出如下假设:
假设1:企业数字化水平提高有助于企业运营绩效的提升。
随着企业数字化水平的提高,企业内部信息传递速度显著加快,企业外部市场信息会以更加密集的汇总形态融入到企业的战略规划和日常管理中,企业可以基于这些更加准确及时的信息进行精准的投融资决策、市场细分和战略目标分解,从而为企业获得更多利润提供可能性。不仅如此,根据于文超等的研究可知,随着企业信息化水平提高,政企关系重构降低企业产能利用率的效应将减弱,从而有助于提升企业运营绩效[19]。本文认为数字化水平的提升会首先提升企业内外的信息对称性水平,从而有助于企业运营绩效的提升,即信息对称性水平在数字化影响企业绩效过程中起到中介作用。因此,提出如下假设:
假设2:企业数字化水平提高运营绩效过程中,信息对称性水平起到正向中介效应。
数字化水平对企业商业模式冲击是深刻的,传统商业模式在数字化时代具有明显的受众范围窄、运营成本高、传递效率低的特点,从而逐渐丧失了核心竞争力。企业在数字产业化和产业数字化浪潮中,根据产业结构变革特征适应新的商业组织形式,不断向数字化运营、数字化管理、数字化营销、数字化成本控制等多方面转型,最终使得企业的商业模式发生根本变更。根据郭海等的研究,在数字化水平提升过程中,企业创新开放能够显著提升企业运营绩效,并且商业模式创新在两者之间起到中介作用[20]。本文认为数字化水平促进了企业商业模式创新,进而促进了运营绩效提升。因此,提出如下假设:
假设3:企业数字化水平提高运营绩效过程中,商业模式创新水平起到正向中介作用。
数字化水平提升极大地促进了企业管理效率提升,使得企业内外信息传递速度变快,同时也降低了管理成本,但是数字化过程需要大量的投资和运营费用,这部分增量成本可能会降低企业绩效。根据刘天楚的研究,企业数字化水平提升可以帮助企业同时计算定额成本和标准成本,有助于企业管理成本降低[21]。本文认为随着近年来数字经济的快速发展,中国企业已将数字化发展融入到日常管理运营中,总体上数字化水平可能表现出对管理成本的抑制,从而提高企业运营绩效。因此,提出如下假设:
假设4:企业数字化水平提高运营绩效过程中,管理成本降低水平起到正向中介作用。
三、模型设定和数据来源
(一)模型设定
(1)
(2)
(3)
表1显示了各类变量的具体说明。第一,被解释变量是企业运营绩效,选择企业总资产收益率ROA和净资产收益率ROE作为衡量运营绩效的工具变量。第二,核心解释变量是企业数字化水平,对数字化水平的衡量采用两种形式,一是通过文本挖掘获得Diga;二是采用财报附注中无形资产明细中与数字经济相关部分占无形资产总额百分比获得Digb。第三,根据研究假设设置三个中介变量,其中信息对称性水平inf利用操控性应计项目绝对值占企业上年度总资产比值度量,该比值越高企业信息对称性越低。企业总体应计项目(Tar)包含操控性应计项目(Ar)和非操控性应计项目(Nar)。本文采用Jone(1991)模型估计非操控性应计项目(Nar)和企业上年度总资产比值,然后测算操控性应计项目绝对值占企业上年度总资产比值。商业模式创新水平Sty采用文本挖掘方法计算。管理成本Cst利用企业利润表中管理费用总额和营业收入的比值进行测度。第四,影响企业运营绩效的变量还包括企业自身性质和企业治理特征,根据已有研究设置了10个控制变量(见表1),基本涵盖了企业性质治理特征差异对企业运营绩效的影响。
表1 变量说明
目前经济学研究中常采用文本挖掘的方法搜寻目标词汇出现的频率构建相关指标。根据林乐等的研究,如果目标词汇出现频率越高,说明目标企业对该词汇所代表的关键问题越重视[24]。基于此,采用Git Hub软件上的开源项目展开搜索,并基于Python中“jieba”中文分词软件选取关键词。搜索对象是企业的年度财务报告(含附注)。具体操作过程中,首先,采用手动整理和Python算法自动分析词汇方法确定财务报告中不同类型和不同行业企业对数字化水平或商业模式创新的表达方式。其次,结合第一步确认的不同表达方式,采用人工手段和计算机联想法扩展相关的关键词汇。最后,根据Gephi的图谱分析方法构建关键词图谱,确定关键词汇表,如表2。
表2 文本挖掘选择的关键词
由于不同企业规模差异较大,行业之间差异也较大,因此上述关键词出现的频数并不具有比较价值。为解决该问题,采用企业当年关键词出现的频数和当年行业内所有企业出现总频数的比值作为度量指标。具体计算如式(4),其中keywordi,t代表第i家企业第t年的同类关键词出现的频数,totalkeywordi,t表示某个行业j中所有企业同类关键词出现的总频数。经过上述测算,数字化水平Diga和商业模式创新水平Sty的取值范围在0至1之间,其中个别企业的Sty取值为0,说明这类企业商业模式几乎没有创新。
(4)
(二)数据来源
近年来数字经济总产值占GDP的比重在加速增长,如2014年数字经济产值占GDP比重为26.10%,2019年该比重已经提升到36.20%,但是中国数字经济蓬勃发展时间并不长,2014年后才真正实现高速增长。因此,本文选取2015年至2019年沪深A股中上市公司作为样本。在选样时设定如下:(1)剔除金融类上市公司。(2)剔除公司存续时间在5年以下的样本,原因是存续周期较短的公司其组织架构和公司治理表现出较显著的异常性,这会降低模型稳健性。(3)剔除ST类上市公司。(4)剔除数据严重缺失的公司。样本数据来自Wind数据库,对个别数据不完整的样本通过对比CSMAR数据库进行了补正。经过上述过程最终确定了1 102家上市公司2015年至2019年的相关数据。样本公司具体行业分布如表3所示。
表3 样本公司的行业分布
四、实证分析
(一)描述性统计
表4显示了各类变量的基本统计信息。被解释变量Roa、Roe的平均值小于中位数,说明部分企业的运营绩效水平偏低,使得平均运营绩效水平被拉低。解释变量中,文本挖掘得到的数字化水平Diga均值0.021 4小于中位数0.027 1,标准差1.028 3相对较高,说明数据离散程度较高。Digb平均值大于中位数,说明部分企业的数字化水平偏高,拉升了整体数字化水平,其标准差达到17.832 2,离散程度较大。中介变量中信息对称性水平inf的均值大于中位数,标准差10.221 4较大,具有一定程度的离散性。商业模式创新水平Sty最小值为0,说明有部分企业并未进行商业模式创新,平均值大于中位数,方差2.051 4较小,说明该数据离散性较低。控制变量中股权性质Stc平均值为29.31,说明样本中有29.31%的企业属于国有企业,资产负债率Deb的平均值为49.24%,最大值为67.19%,说明企业整体财务杠杆较高。除了Digb和部分控制变量的JB统计量没通过统计检验,其他变量均通过不同置信水平的JB检验,说明这些变量具有良好的正态分布属性。
表4 描述性统计
(二)基本回归过程
通过对式(1)进行多元面板回归完成基本回归过程。在面板模型估计中需要对数据进行单位根检验,经过面板ADF检验发现,数字化水平Digb、固定资产百分比、第一股东持股比例、管理成本、股权性质、两职合一性、董事会独立性几个变量存在单位根,属于I(1)变量。经过面板协整检验后发现这些变量间至少存在一个长期协整关系,因此可以对式(1)原始数据进行模型构建。经过豪斯曼检验发现式(1)适合构建时间固定效应和截面固定效应的双固定效应模型。表5显示了估计结果。
根据表5可知,第2列和第3列分别显示了用Roe和Roa作为被解释变量的回归结果。结果发现:(1)用Roa作被解释变量时,核心解释变量数字化水平Diga的系数为正,且在10%置信水平上统计显著,说明企业数字化水平和企业运营绩效存在正向关系。
表5 多元面板回归结果
(2)用Roe解释数字化水平提升了企业经营绩效。调整R2为0.602 3,模型拟合效果较好;DW值为2.121 1,说明模型不存在一阶自相关问题;整体F检验在1%水平上统计显著,说明模型整体拟合度较高。核心解释变量数字化水平Diga的系数为正,且在5%置信水平上统计显著,说明企业数字化水平和企业运营绩效存在正向关系。(3)除去个别控制变量不显著,其余控制变量在不同的置信水平上统计显著,说明控制变量选择具有科学性。
表6显示了模型稳健性检验的结果。稳健性检验采用两种方式进行,一是将式(1)中的解释变量数字化水平Diga替换为Digb,对应的回归结果如表6中第2列和第3列。二是对样本进行分类删减后重新回归。在选择的1 102个样本中,信息技术业(G)、社会服务业(K)和传播与文化业(L)的数字化水平较高,其中信息技术业(G)是数字产业化发展的主要行业,其数字化水平Diga和Digb的平均水平分别高于其他行业(不含G、K、L)19.70%和14.23%。社会服务业(K)具有较高的社会服务属性,其数字化水平Diga和Digb的平均水平分别高于其他所有行业(不含G、K、L)平均水平14.21%和11.33%。传播与文化业(L)因为具有较高的信息传播属性,其数字化水平Diga和Digb的平均水平分别高于其他行业(不含G、K、L)7.24%和8.15%。三个行业的样本数量分别是111、70、47,在总样本中剔除这些样本后对式(1)进行回归,结果如表6中第4列和第5列。根据表6可知,两种稳健性检验中数字化水平的系数均为正数,回归结果和表5基本吻合,说明模型具有稳健性。
表6 解释变量和对样本分类删减重新回归后的稳健性检验
(三)中介效应
表7是对信息对称性水平中介效应的检验结果,对应方程为式(2)和式(3)。表7第2列是信息对称性水平和数字化水平的回归结果,可见数字化水平Diga回归系数为正且在5%置信水平上统计显著,这说明可能存在中介效应。第3列和第4列分别是使用Roa和Roe作为被解释变量,以数字化水平Diga和信息对称性水平inf为核心解释变量的实证结果,第3列和第4列中数字化水平Diga不显著,但是信息对称性水平inf分别在1%和10%置信水平上统计显著。根据中介效应判断依据可知:在数字化水平影响企业运营绩效过程中,信息对称性水平具有完全中介效应。第3列和第4列Sobel检验值分别为4.483 1和4.692 1,大于临界值0.97,说明存在中介效应。根据Boostrap检验得到的置信区间均不包括0值且为正,说明通过了Boostrap检验且存在正向中介效应。
表7 信息对称性水平中介效应检验
表8是对商业模式创新水平中介效应的检验结果。第2列数字化水平Diga在1%置信水平统计显著且系数为正,说明可能存在正向中介效应。第3列和第4列回归结果中,数字化水平Diga回归系数在5%置信水平上统计显著且均为正数,商业模式创新水平Sty系数为正且分别在1%和5%置信水平上显著,第3列和第4列Diga的系数均小于表5中不考虑中介效应时Diga的系数,根据中介效应判断条件,商业模式创新水平Sty存在部分中介效应。第3列和第4列对应的Sobel检验值超过临界值,说明模型通过了中介效应检验。根据Boostrap检验得到的置信区间均不包括0值且为正,说明模型通过了Boostrap中介效应检验。综上所述,数字化水平在影响企业运营绩效过程中,商业模式创新水平具有部分中介效应。
表8 商业模式创新水平中介效应检验
表9是对管理成本降低水平的中介效应检验结果。数字化水平Diga的系数并不显著,且第3列和第4列Boostrap检验的置信区间包含0值,说明在数字化水平影响企业创新绩效过程中,管理成本降低水平的中介效应并不存在。
表9 管理成本降低水平中介效应检验
根据上述结果可得到如下结论:第一,根据表5可知,无论采用Roa还是Roe作被解释变量,企业数字化水平Diga和企业运营绩效均呈现显著正相关性,说明中国企业通过提升数字化水平提高了运营绩效,即验证了假设1。第二,根据表7和表8可知,企业数字化水平Diga提升企业运营绩效(Roa和Roe)过程中,信息对称性水平inf和商业模式创新水平Sty起到正向中介效应的作用,即验证了假设2和假设3。不同的是,信息对称性水平inf的中介效应是完全的,而商业模式创新水平Sty的中介效应是部分的。企业数字化水平提升可以通过企业运营、生产、销售、战略规划及实施多个维度提升企业信息传递效率从而可以通过提升信息对称性水平来提升运营绩效。不仅如此,数字化水平提升改变了企业的组织模式、战略柔性和商业发展模式,这些模式创新可以对企业运营绩效产生正向的影响。根据实证研究结论,目前商业创新水平的中介效应不完全,仍需要在未来运营中进一步挖掘。第三,根据表9可知,企业数字化水平Diga影响企业运营绩效(Roa和Roe)过程中,成本降低水平不具有中介效应,即否定了假设4。可能的原因有两点,一是企业数字化水平提高本身需要较高的投资和新增的管理费用,这部分费用的增加会降低企业近期的运营绩效。由于中国企业数字化水平在近5年才实现高速发展,选样区间是2015年至2019年,这可能导致此中介效应并不突出。二是中国企业可能并未真正将数字化水平融入到日常生产运营过程中,数字化水平提升对管理成本降低效应可能还没有完全显现出来。
将数字化水平Diga替换为Digb重复表7至表9的中介效应验证过程,稳健性检验结果见表10、表11和表12。将核心解释变量替换后,表10第2列数字化水平Digb的系数显著为正,说明可能存在中介效应,第3列和第4列Digb的系数均不显著,说明存在完全的中介效应,这和表7结果一致,即在数字化水平提升企业运营绩效过程中,信息对称性水平具有完全中介效应。
表10 信息对称性水平中介效应的稳健性检验
表11显示了商业模式创新水平中介效应的稳健性检验结果,第2列Digb的系数显著为正,说明可能存在中介效应,第3列和第4列将中介变量Sty和核心解释变量Digb同时放入回归模型后,两个变量分别在10%和5%显著性水平上显著,且对应Digb的系数大小均小于表6中第2列(被解释变量Roe)和第3列(被解释变量Roa)对应系数,说明存在部分中介效应,这和表8结果一致,即在数字化水平提升企业运营绩效过程中,商业模式创新水平具有部分中介效应。
表11 商业模式创新水平中介效应的稳健性检验
表12显示了管理成本降低水平中介效应的稳健性检验结果,第2列Digb回归系数不显著,说明不存在中介效应,这和表9回归结果一致,即在数字化水平提升企业运营绩效过程中,管理成本降低水平不具有中介效应。
表12 管理成本降低水平中介效应的稳健性检验
五、结论和建议
本文利用2015年至2019年中国沪深A股上市企业数据,结合文本挖掘方法和中介效应检验实证分析了数字化水平和企业运营绩效的关系,并验证了三重中介效应的存在性。研究发现:企业数字化水平提升对企业运营绩效具有显著促进效应,在此过程中,数字化水平通过提高企业信息对称性水平和促进企业商业模式创新两条中介路径来提升企业运营绩效。另外,成本降低的中介路径并未凸显,说明中国企业数字化水平需要提升,数字化没有深入到企业日常管理活动中。研究结论对指导企业进一步数字化转型提供了依据。基于上述结论,提出如下政策建议:
第一,企业应该进一步深入实施数字化转型战略,通过切实提高数字化水平实现产业转型升级进而为经济良性循环提供基础保障。目前数字产业化和产业数字化发展战略在国家大力推动下实现了较快发展。本研究发现数字化水平提升对企业运营绩效的促进作用是显著的,因此中国企业应该在当前有利政策背景下,深入挖掘数字化转型的可能性,尽快完成数字化转型,切实提高自身数字化水平。具体而言,企业应该积极结合政府对数字化转型发展的促进政策,积极实施诸如“云计算战略”“智能制造战略”“数字发展战略”,努力加强企业和政府、企业和数字产业市场之间的动态战略合作关系,并努力打造开放式的数字化发展实验区。
第二,企业应该积极构建或借助现有动态的数字信息分享平台。根据实证研究结论,信息对称性水平是企业数字化水平提升对运营绩效促进作用的中介路径之一,企业在提升自身数字化转型过程中,如何借助或者构建数字化信息分享平台则成为转型成功的关键。企业应该努力形成和外部数字信息网络良性合作的平台,借助现有诸如百度云、阿里云等信息平台提升自身数字网络的关联质量,进而提升自身数字化水平。资金雄厚的企业可以尝试自主开发动态数字平台,将日常运营管理、市场细分与定位、营销策略、战略规划等各方面工作纳入到该数字平台中,从而提升自身数字化水平。
第三,企业应该在现有商业模式基础上不断进行数字化商业模式创新。根据实证结论,商业模式创新水平是企业数字化水平提升对企业运营绩效促进作用的中介路径之一,因此,在数字化发展背景下商业模式创新成为企业数字化转型成功与否的又一关键因素。数字化改变了传统企业在营销理念、生产组织方式、销售渠道、市场定位细分、日常管理、人力资源管理和企业战略规划方面的形式,使得数字化形式参与到企业各个层面,因此,企业应该积极改变传统商业模式,积极创新基于数字化发展的商业模式。
第四,企业应该注重数字化进程中的成本控制。根据研究可知,在数字化促进企业运营绩效的过程中成本降低中介效应并未得到实证支持,说明理论上存在的中介效应尚未在中国企业的具体实践中凸显。可能的原因是企业数字化转型成本较高。数字化转型应该是将数字化转型资源耗费和企业其他资源耗费形成动态联动机制,并积极探索数字化转型中的成本控制能力提升路径,只有这样才能真正实现数字化水平的提升。
综上所述,积极推进以数字经济和产业结构升级为抓手的产业发展是中国经济实现良性内循环的保障,本文对企业数字化水平和企业运营绩效的实证研究在一定程度上为理论发展和实践应用提供坚实的微观基础,具有重要的研究意义和适用价值。