数字鸿沟是否抑制了居民消费
——基于中国家庭的微观证据
2023-01-15林楷涵薛羽珂
林楷涵 薛羽珂
(南京财经大学 江苏南京 210000)
过去10年,中国经济取得了长足进步,占世界经济的比重由2010年的9.14%上升到2021年的18.45%左右。然而,与世界其他国家相比,中国经济的高速增长伴随着中国居民的消费不足与高储蓄率(Chamon&Prasad,2010;戴圣涛和卜京,2019)。与此同时,近年来以互联网为代表的数字技术正在改变个体生产、分配、交换等行为,其中自然包括居民的消费行为(杜丹清,2017)。但是,由于互联网等数字资源在人群间的不均衡,未能成功掌握数字技能的个体无法享受数字红利且不断边缘化,从而带来新的社会治理难题——数字鸿沟。
早期的数字鸿沟被定义为个体无法使用计算机或接入互联网,即接入沟(也称为第一级数字鸿沟)(Attewell,2001),随着互联网的发展,接入沟逐渐得到弥合。学者发现,即使拥有相同的硬件接入条件,也并不意味着人们将按照完全相同的方式和程度使用互联网,体现在使用时间、使用类型和使用内容等方面(Van Deursen &Van Dijk,2014)。这种使用上的数字差距,学者称之为使用沟(也称为第二级数字鸿沟),其中以个体互联网使用技能或使用频率的研究最为常见。
数字鸿沟的存在,往往引起生产生活的不平等。近年来,开始有学者关注数字鸿沟对居民消费的影响,但主要从间接角度进行研究,如互联网使用与否(张永丽和徐腊梅,2019;周应恒和杨宗之,2021;殷志高和任太增,2022)、互联网使用技能和使用频率(祝仲坤和冷晨昕,2017)、互联网使用内容(Munyegera,2016;崔海燕,2016;王晓彦和胡德宝,2017;易行健和周利,2018)等,直接考察数字鸿沟影响的论文并不多见,基于微观层面的研究更少(黄漫宇和窦雪萌,2022),且多针对老年人或农村居民。事实上,数字鸿沟所包含的信息日益复杂化和多元化,世界各国居民遭受数字鸿沟的现状不容乐观,有必要对此展开深入探讨。
1 模型设定、数据来源及变量选取
1.1 模型设定
本文使用OLS回归模型,估计数字鸿沟对家庭消费数量的影响,模型设定如下:
其中,Consumptioni表示第i个家庭的人均消费数量;Digital _dividei表示第i个家庭面临的数字鸿沟程度,分为第一级和第二级;Xi表示相关控制变量;εi为随机扰动项。
1.2 数据来源
本文选取中国家庭追踪调查(China Family Panel Studies)CFPS2018年的调查数据,剔除户主年龄18岁以下、60岁以上及家庭消费数量、户主是否使用互联网等关键变量缺失的样本。经过数据清洗,最终获得样本8591个。
1.3 变量构建
(1)因变量。本文的主要因变量为家庭人均消费数量。为避免异方差性,家庭人均消费数量取对数。
(2)自变量。本文的自变量是数字鸿沟,分为第一级和第二级。
第一级数字鸿沟(接入沟),通过互联网接入情况衡量。CFPS2018问卷中存在“是否移动上网”和“是否电脑上网”两个关于互联网接入的问题,两者皆不使用赋值为1,否则赋值为0。
第二级数字鸿沟(使用沟),通过互联网使用频率衡量。CFPS2018问卷中询问了受访者“一般情况下,您使用互联网络学习(如搜索学习资料、上网络学习课程等)、工作、社交活动(如聊天、发微博等)、娱乐(如看视频、下载歌曲等)、商业活动(如使用网银、网上购物)的频率”,频率从高到低分别赋值为1、2、3、4、5、6、7。以此为基础,对上述五个指标进行因子分析(经检验,KMO值为0.707),计算出来的得分表示使用沟,取值越大,则表明个体使用互联网的总体频率越低,所面临的使用沟越大。
(3)控制变量。参照以往文献(易行健和周利,2018),本文选取的控制变量包括户主特征变量(性别、年龄、年龄的平方/100、受教育年限、婚姻状况、健康状况和居住地区)、家庭特征变量(家庭规模、家庭老人占比(60岁以上人口数占比)、家庭儿童占比(16岁以下人口数占比))、家庭总收入和家庭总资产、地区特征变量(所在省份人均GDP)及省份虚拟变量。其中,家庭总收入、家庭总资产和所在省份人均GDP取对数。表1为主要变量的描述性统计。
表1 主要变量的描述性统计
2 实证结果
2.1 基准估计结果
基于OLS模型,本文考察了不同级别数字鸿沟对中国居民消费规模的影响,相关结果如表2所示。由表2结果(1)可知,接入沟的影响负向且在1%的水平上显著;由结果(2)可知,在加入相关控制变量和省级虚拟变量后,接入沟的影响仍负向且在1%的水平上显著,说明未使用互联网会显著降低家庭人均消费。类似的,由结果(3)~(4)可知,使用沟的影响同样为负向且在1%的水平上显著,意味着互联网使用频率越低,其家庭人均消费就会越少。
表2 数字鸿沟对家庭消费的影响
2.2 稳健性检验
稳健性检验一,改变因变量。此时,将因变量由家庭人均消费替换为家庭总消费,同样取对数进行研究。
稳健性检验二,改变自变量。第一,用家庭未接入互联网人数占比衡量接入沟。第二,对于使用沟,不再采用因子分析法,而是采用加总后取均值的方法进行测度。
稳健性检验三,改变控制变量。此时,本文重新定义受教育年限,用家庭劳动力占比替换家庭老人占比和家庭儿童占比,将家庭总收入和家庭总资产以万元为单位。
稳健性检验四,剔除极端值。为了避免极端值的影响,此时删除家庭人均消费最低前5%和最高前5%的样本后进行回归。
稳健性检验五,剔除北上广深。众所周知,北京市、上海市、广州市和深圳市四座城市无论是互联网发展水平还是经济发展水平,均在中国处于领先地位。相应的,居民使用互联网的可能性较高,使用往往更为频繁,互联网的重要性毋庸置疑,同时居民的收入和消费水平也相对较高。因此,此时剔除这四座城市的样本进行回归。
无论是更换变量还是改变样本,接入沟和使用沟的影响均为负向显著,表明表2中的估计结果是稳健的。限于篇幅,此处未将结果详细列出,如有需要,可向作者索取。
2.3 内生性讨论
在考察数字鸿沟对消费的影响时,可能会面临内生性问题的干扰,对于此类问题,经典的解决方法是采用IV进行估计。参考已有文献(Zhu et al.,2020)并结合数据现实,本文按照同一省份、同一收入阶层数字鸿沟均值作为工具变量进行回归。
在引入工具变量后,接入沟和使用沟对消费的影响依然负向显著;Kleibergen-Paap rk LM检验在1%水平上显著,Kleibergen-Paap Wald rk F统计量大于Stock-Yogo检验10%水平上的临界值,以上结果表明不存在工具变量识别不足及弱工具变量的问题。另外,在考虑内生性问题后,接入沟和使用沟对消费的负面影响仍是负向显著,再次证明了表2中基准结果的稳健性。如有需要,可向作者索取结果。
3 结语
随着互联网的日益普及和迅猛发展,人们所面临的数字鸿沟慢慢由有形的接入沟转化为无形的使用沟。本文基于CFPS2018数据,就数字鸿沟对中国居民家庭消费规模的影响进行理论探讨与实证检验。研究表明:总体而言,接入沟和使用沟显著抑制家庭消费数量,即居民没有使用互联网,互联网使用频率越低,则居民消费数量显著下降,稳健性分析和内生性讨论结果表明,这一结论比较稳健可靠。