大数据视域下中国数字化转型研究
2021-12-03上海科技管理干部学院
文/黄 卓(上海科技管理干部学院)
数字化早在21 世纪初期即已被广泛提及,迄今逾二十年,相关技术发展已非常成熟。《2021 年政府工作报告》中提出“加快数字化发展,打造数字经济新优势,协同推进数字产业和产业数字化转型”的目标;《中华人民共和国国民经济和社会发展第十四个五年规划和2035 年远景目标纲要》中,以一个专篇的形式提及“加快数字化发展,建设数字中国”,将数字化转型发展上升为国家“十四五”发展的重大战略。数字化转型作为中国经济新旧动能转换、经济结构转型发展、国际疫情应对与中美经贸摩擦等系列重大问题的破题之策,弄清数字化的发展历程与方向,将对顺利推进数字化转型起到至关重要的指引作用。
一、数字化概述——信息化、数字化与数字化转型
现阶段提及数字化转型时,信息化、数字化、数字化转型是三个联系密切且时常被混用的概念,但三者有本质的不同。
信息化(Informatization),在1997年召开的首届全国信息化工作会议,对信息化和国家信息化定义为:“信息化是指培育、发展以智能化工具为代表的新的生产力并使之造福于社会的历史过程。”中共中央办公厅、国务院办公厅2006 年印发的《2006—2020 年国家信息化发展战略》中指出:“信息化是充分利用信息技术,开发利用信息资源,促进信息交流和知识共享,提高经济增长质量,推动经济社会发展转型的历史进程”。
数字化(Digitalization)原指使用0和1 两位数字编码来表达和传输一切信息的一种综合性技术。具体是指与“模拟技术”相对的一个概念,将原先采用模拟技术来表达、存储、传输信息变革后的一种新型信息技术路线或技术方法。
数字化转型(Digital Transformation)是当前热点,对此的理解并不统一,主要包含两种主流看法:一是信息化,二是智能化。
在中国科协举办的第九届中国科技政策论坛上,国防科技大学原副校长兼教育长、中国科学院院士王怀民认为数字化分为三个阶段,第一阶段是普及计算机,第二阶段是普及网络,第三阶段是普及人工智能,意指数字化转型是以基于大数据的人工智能为源头创新,采用人工智能、人机交互等核心技术实现普及人工智能的过程。中国科协副主席、中国航天科技集团副总经理李洪认为,以中国航天业的发展为例,中国航空航天事业加快了数字化转型步伐,已初步形成了模型化、协同化的数字化研制体系,使中国航天得以大幅提升研发效率,数字化转型就是一个数字赋能的过程。中国半导体行业协会集成电路分会理事长叶甜春认为,类似于工业时代的钢铁,信息与数字时代的钢铁是芯片,数字化转型就是通过集成电路(芯片)支撑的产业和社会大变革。阿里研究院副院长安筱鹏认为,数字化转型始于技术终于组织,数字化转型是组织边界、组织方式、组织合作与组织架构全面变革的过程。在该次高峰论坛上,对数字化的看法主要集中在信息化与智能化两种看法之上,但多位学者的看法都趋向于数字化将实现“产业与社会的大变革”。在《中华人民共和国国民经济和社会发展第十四个五年规划和2035 年远景目标纲要》中提到“迎接数字时代,激活数据要素潜能,推进网络强国建设,加快建设数字经济、数字社会、数字政府,以数字化转型整体驱动生产方式、生活方式和治理方式变革”,该文本清晰地描绘了数字化转型后的社会蓝图。
综合以上所述来看,数字化转型是指在数字技术支撑下,以信息化建设为代表手段,实现自动化、智能化等目的,并在此过程中,发展新型经济、实现新型业务、进行新型管理的一个变革过程。
二、 不同视角下的数字化认知概况
1.搜索引擎视角下的国内外数字化转型的关注度趋势
通过获取Google 搜索引擎从2004 年至2021 年4 月以Informatization、Digitalization、Digital Transformation 为搜索关键词的搜索数据分析,美国从2004 年至今,对信息化的搜索量整体平稳,并处于较低的关注水平,反映美国社会在此阶段已完成了对信息化概念的认知,社会关注度处于平稳低位;对数字化的搜索量呈现明显的“U 形曲线”特征,在2007 年至2017 年间,整体处于低关注水平,而在此前逐年下降、此后逐年上升,和历史上对数字化的认识阶段相吻合;对数字化转型的关注热情明显始于2014 年,当年4 月,首次出现数字化转型关键词热度显著上升以及稳定超越数字化关键词热度,在2015年后期至2016 年初期,开始呈现加速上升的态势并持续至今,在2020年9 月达到历史峰值(2021 年数据不完整未予考察)(相关数据如图1 所示,图中横坐标为时间,按Google 图例,纵坐标数值是搜索热度,无具体单位,数字代表相对于图表中指定区域和指定时间内最高点的搜索热度,热度最高的字词记100 分,下同)。
图1 关键词搜索热度(美国范围)
分析Google 世界范围与美国范围的英文搜索数据,以关键词Informatization、Digitalization、Digital Transformation 检索的结果曲线,计算出拟合度,分别为0.0014、0.3501、0.9587,显示世界范围和美国范围关注趋势相对一致,在数字化转型方面二者具有高度一致性(相关数据如图2 所示)。
图2 关键词搜索热度(世界范围)
分析中国关注趋势,因Google 在中国境内未能提供有效业务,且其在国内因搜索工具对早期数据的支持不够完整难以参考,因此,选取中国知网数据样本予以近似分析。在中国知网中检索数字化转型关键词,命中文献总数16967 篇,其中2006 年9篇,2010 年90 篇,2014 年增速加快,环比增速59.8%,2016 年976 篇,2018 年以来增速进一步加剧,2019年环比增长率达到94.6%。显示中国学界对数字化转型的关注度和美国趋势吻合,其中2014 年的较高增速具有高度一致性。
2.政府文件视角下的数字化概况
政府文件往往和国民生活中的重点问题联系密切,通过观察政府文件中对某一特定议题的关注情况,可以侧面了解该议题的发展情况。
对中国知网公开收录的中国各级政府文件进行分析,在其“政府文件”栏目下进行高级检索,以“全文”包括“数字化”关键词进行宽泛检索,获得近二十年来中国政府公开的各级各类政府文件数据。
数据显示从2002 年到2021 年间(2021 年数据截止到2021 年7 月10 日,下文部分相同),中央文件数和地方文件数均呈现或阶段性地呈现递增的趋势,具体而言,中央文件数因为总量较地方文件数少,但是从2002 年起连续呈现增长趋势,在2017 年达到432 件的峰值;地方文件数较中央文件数多,并呈现出完整的逐年递增趋势,并在2017 年和2018年连续稳定在5000 件以上的峰值数量水平,但从2019 年开始连续下降(见表1)。
表1 知网以“数字化”关键词检索命中政府文件数(单位:份)
更改关键词,以“数字化转型”为关键词,按照“全文”检索方式进行检索,检索数据相比“数字化”的检索结果而言具有明显的变化。
数据结果显示,命中数据的覆盖时间明显晚于“数字化”的检索结果,首个命中结果出现在2009 年,比“数字化”的首个命中结果2002 年晚了7年;其次,数据的递增性特征显著,无论中央文件还是地方文件,均从2018年起开始加速递增,2019 及2020 年增速进一步加大,并在2020 年呈现数据峰值(如表2 所示)。
表2 知网以“数字化转型”关键词检索命中政府文件数(单位:份)
3.学术研究视角下的数字化概况
中国知网是由清华大学承建的中国知识基础设施工程,是目前中国中文学术领域覆盖最广、收录最全的数据检索平台,对于知网数据的检索结果可以有效反映中文学界的学术研究情况。
通过对中国知网数据检索结果进行关键词共现分析,剔除原始关键词“数字化转型”与同义英文词“digital transformation”,并将其中无效标签予以清洗,剩余头部共现关键词共14个(Top14),分别是工业互联网13.4%、人工智能13.32%、数字出版12.75%、云计算9.15%、智能制造7.48%、物联网7.03%、制造业6.01%、数字经济5.84%、疫情防控5.52%、出版业4.45%、数字出版产业4.05%、银行业3.8%、新一代信息技术3.64%、商业模式3.56%。将相关数据聚类后形成6 个类别,分布情况是IT 类占46.54%、出版类占21.25%、制造类占13.49%、商业类占9.4%、公共卫生占5.52%、金融类占3.8%。
数据分析结果提示数字化转型发展存在显著的行业效应,在上述优先行业中分布具有明显的倍数关系。“数字化转型”共现IT 类关键词占比近半,体现IT 技术是数字化转型的支撑基础,符合基本逻辑。“数字化转型”共现出版类关键词占比21.25%,是非IT 关键词中占比最高的,这一点和公众对数字化转型的偏见领域有较大出入,结合制造业、商业等后续共现领域分析,传统出版业、传统制造业及传统商业是受移动互联网这波数字化浪潮影响最为深刻的几个经济领域,受数字化挤压最深、数字化转型意愿最强,从这个角度来解释的话,该数据暗示“数字化转型”的共现词领域,与数字化转型的优先领域具有高度相关性。此外,“数字化转型”的共现类别存在明显倍数关系,大约存在1/2 的倍数效应,即在Top6 的共现类别中,存在按某一系数逐级递减的现象,这一“系数”均值为-38.7%。
4.大众视角下的数字化关注概况
StatCounter Global Stats 显示,在中国地区,百度搜索引擎是中文互联网世界中使用最普遍的搜索工具,2021 年5 月,百度国内市场份额为72.63%,排名第一。选取百度搜索引擎的搜索数据,可以有效反映中文互联网世界中的真实情况。
基于百度搜索引擎的搜索数据,以“数字化”“数字化转型”两个关键词进行数据分析,可以得到以下数据:
(1)在2021 年6 月14 日—2021年6 月20 日这一周的时间区间内,“数字化”关键词的搜索相关词,前三名分别是“数字”“数字经济”“数字化转型”。考虑到“数字”这一关键词作为其他关键词的共性词根,并不能准确反映关键词的相关性,修正后的前三名关键词分别是“数字经济”“数字化转型”“信息化”。值得补充的是,并列第三位的还有“智能化”关键词;“数字化转型”的搜索相关词前三名分别是“数字经济”“数字化”“数字中国”。通过两类关键词的相关词分析,数字经济与数字化、数字化转型具有高度关联性。
(2)在2020 年6 月25 日—2021年6 月25 日这一年的时间区间内,“数字化”关键词搜索热度最高的省市前三名依次是广东、浙江、北京(如图3 所示);“数字化转型”关键词搜索热度最高的省市前三名依次是北京、广东、上海(如图4 所示),显示出广东和北京在近一年内对数字化与数字化转型具有稳定的较高关注。
图3 热度区域分布(数字化)
图4 热度区域分布(数字化转型)
(3)在2021 年5 月1 日—2021年5 月31 日这一个月的时间区间内,20~29 岁年龄段用户对“数字化”与“数字化转型”的搜索占比约为40%,30~39 岁年龄段用户对“数字化”与“数字化转型”的搜索占比约为35%;在两性中,对两个关键词的搜索区别不大,在搜索总量上女性搜索占比与男性搜索占比为4∶6。显示全人群中对数字化与数字化转型关注的人群显著集中在20~39 岁这一中青年群体,其中男性搜索略多于女性(如图5 所示)。
图5 人群属性:A 为年龄分布;B 为性别分布
(4)在2021 年5 月1 日—2021年5 月31 日这一个月的时间区间内,搜索上述两个关键词的用户,主要来源领域前三名是影视娱乐、教育培训、通信这三个行业,行业内对“数字化”与“数字化转型”的搜索区别不大,搜索来源的TOP10 行业差异不大,表明各行业内对两个关键词的搜索并无显著区别,各行业间的搜索行为无显著区别。
三、中国数字化进程的若干判断
1.数字化在数字化进程的不同时期具有不同内涵
通过对Google、百度等搜索引擎数据检索,数字化概念早在互联网诞生初期即已提起,最初是作为一种信息化的前置技术而被广泛注意,即信息时代的数据保存、数据处理、数据传播依靠传统的模拟技术实现越来越受限,急需采用一种编码技术,才能有效解决大量内容在运算处理、保存、传播以及呈现等各个环节的实现难题。这种通过编码技术将模拟内容转换并最终呈现的技术促进社会技术整体变革,就是最初的数字化,其高潮大约出现在2004 年前,可以将其界定为“编码数字化阶段”。
数字化是为信息时代的到来而准备的前置技术,即只有早期的数字化得以实现,才能促成信息化目标的实现。但是随着信息化的深入发展,特别是在信息化过程中,发现一些重要的信息化应用问题,如搜索匹配、语音识别、语义识别等拟合性问题,最终并非在仿生学等直觉领域获得突破,而是通过隐含马尔可夫模型(Hidden Markov Model)、布尔代数、图论、矩阵运算等数学方法完美高效地得到解决,这些都提示并进一步加强了人们对数字化的新认识。在这一阶段,编码技术驱动社会技术整体变革的成熟使得社会对数字化命题的关注持续降低,与此同时业界对数学工具解决产业难题的探索和突破在不断蓄积,使早期制定的信息化目标不断趋于完善。这一阶段为2004 年到2018 年间,而这一信息化完善的过程也促成了业界对数字化的再思考与再认识,“应用及理念数字化”阶段在这一过程中孕育成熟。
随着信息技术的不断发展,特别是信息技术催生的数字网络时代为社会带来的繁荣与便捷,让人们不再将信息技术作为一种生活的补充。特别是Z 时代“数字原住民”逐步进入社会主流,大众开始将社会的数字形态视作一种常态而非补充,全面拥抱并融入数字生活越来越成为社会主流。信息化开始被视作一个陈旧口号,当前广泛提及的“数字化”概念意味着对当下生活的认同与发展,即当前的“数字化”是曾经“信息化”高度实现的未来图景。这些阶段的起始时间本身就是模糊的,但是以大数据所反映的大规模共识形成来界定,这一阶段萌芽于2009 年,从2018 年开始,可以将其界定为以高水平、大规模“应用数字化”促成的新阶段。这个阶段不仅是信息产业层面高度转向数字化,也不仅因为数字化是实现智能化的基础,而是数字化本身就是一种目的,即数字化是数字化转型的直接和最终目的,而非一般所认为作为智能化的必经过程这一目的。这从社会生活的各个方面开始全面数字化转变可以体现:票据、证照、许可等关系凭证,函件、公文、通知等信息形态,游戏、电影、音乐等消费内容,资金、货币、财富等价值载体,网文、短视频、软件程序等生产标的,虚拟支付、平台撮合、仿真研发等业务流程……社会生态的全要素正在接连实现数字化,数字化并不必然实现智能化,但智能化一定需要数字化作为基础。除了智能化,数字化也会成为培育其他新特性的基础,这一阶段或许叫作“生态数字化”阶段更为合适。
2.公共政策在数字化进程中具有实质性的积极作用
通过中国知网检索中国政府文件,包含“数字化转型”的政府文件最早出现在2009 年。这一年共计产生17 份政府文件,其中中央及部委文件3 份,地方文件14 份;中央及部委原创性文件3 份、地方原创性文件5 份,地方转发转办性文件9 份;中央原创性文件3 份分别来自国务院1 份、国家新闻出版署(时名国家新闻出版总署)2 份,地方原创性文件5 份分别为福建、成都、广东、浙江、河北各1 份。
该年国务院出台了《电子信息产业调整和振兴规划》,并被8 个省市转发转办;国家新闻出版署分别出台了《进一步加快新闻出版业向数字化转型》和《关于促进我国音像业健康有序发展的若干意见》两份文件,其中后者被广东省转发转办。
中央部委中最先明确提出数字化转型的是国家新闻出版署,其最先提出的加快新闻出版业向数字化转型的相关文件以及具体的实施意见,解释了知网学术研究中发现的数字化转型与出版类关键词21.25%的高共现占比现象,说明政策关注对学界研究存在实质意义上的引领作用。
2021 年3 月中旬,经全国人大会议审议通过,《中华人民共和国国民经济和社会发展第十四个五年规划和2035 年远景目标纲要》全文发布,并以一个专篇的形式,提出了“加快数字化发展,建设数字中国”的建设纲要。根据百度指数显示,2000 年3月15 日到3 月21 日期间,百度“数字化转型”的搜索指数达到1509 的历史峰值,显示公共政策对社会关注具有显著影响。
此后至今,通过百度搜索引擎检索数据反映全国对数字化转型的关注度一直维持在较高水平。按地域来看,广东、北京、浙江等地对数字化转型的关注在全国持续处于前列,体现出这些省份在数字化进程中,对公共政策的响应具有更高的内源动力。
3.数字化转型是数字化进程全新图景的重要节点
社会生活中的复杂现象归根到底可以归并为人员流动、物品流动、信息流动这几种基本运动形态,其中又有很大一部分物品流动与部分人员流动的目的是传递信息,因此现实生活中的很大一部分内容是为了应对信息的运动,包括在重大公共卫生中的社会治理、数字化作为“未来教育发展的关键路径”,帮助“积极推动优势金融领域数字支付国际化,畅通人民币国际流通渠道”等。在此基础上提出的信息化,即是理解社会生活中几种基本运动形态,并用科技创新的手段加以应对的过程。
计算机系统是以信息化、网络化、智能化等为代表的现代生活概念得以实现的基础工具,无论是计算机系统的硬件还是软件,都更加擅长于处理结构化数据,即将客观的具象性世界予以抽象化、描述性问题予以逻辑化,最终将一个丰富多元的真实世界按不同方法归并为各类数据集,成为各类结构化数字,供计算机系统处理使用。数字化是这一处理过程中不可规避的重要环节。
与此同时,由于计算机系统的使用使得大规模的数值获取与计算变得高效且简单易行,传统社会中用于辅助决策的数理统计工具开始不断应用于当代社会的更多行业与不同行业的更大纵深,特别是通过计算机系统与经典数理统计方法结合而使得大型数据获取、加工与分析处理得以实现,并进而快速发展为一种被命名为“大数据技术”的崭新方法。很多过去高度依赖于资历和技巧的各级各类复杂决策,都可以通过大数据技术而轻易取代,并且可以做得更快更好更精准。在大数据技术的冲击下,社会开始重新审视既往决策过程,以期通过引入以大数据技术为代表的计算机系统数字技术实现组织的转型或流程再造,并进而提升组织效能。
基于上述数字化是当前计算机系统的基础,以及数字技术可以更好地改造生产过程,普遍认识到数字化对于社会发展具有至关重要的基础性意义,全社会开始倾向于让计算机系统接管更多的人类社会职能。这一进程天然和自动化技术结合在了一起,并促进了自动化技术向数字化方向发展,推动传统传感器向具有数字能力的数字传感器发展,并在传感器通信技术中催生了物联网。数字传感器、物联网、大数据技术以及云技术(云存储、云计算)的结合,使全社会有了无处不在的感知和无所不能的思考,在层出不穷的数字应用面前,尤其是以数学计算为基础的神经网络技术趋向成熟,智能化得以快速发展。
2008 年的全球金融危机对世界各国经济造成了较大影响,我国开始意识到传统的外延性发展模式需要做出适当调整,基于中国知网政府文件检索,“数字化转型”最初于2009年在政府文件中得以体现,旨在推进相关行业利用数字技术,实现产业全流程或部分流程的数字化变革,以期降低成本提高效率实现升级。随着中国人均国民总收入临近1 万美元(2019 年中国国民总收入达到983751.2 亿元,GNI 首次突破1 万美元),中国经济开始出现失速现象,与此同时扩张型财政政策的边际效益逐步走低,经济发展的结构性瓶颈越发突出,在这种“新常态”下,产业转型升级等供给侧结构性改革成为重要选择,“互联网+”即作为实现产业转型的可能方式被广泛推动。
随着对“互联网+”以及产业转型升级的深入理解,认识到需要转型的范围不仅是产业界与供给侧等局部领域,方式也不仅是信息化、网络化、智能化、“互联网+”等显性应用,而是在全社会领域推进以全面数字化为标志的数字思维、数字共享、数字协同、数字生产、数字研发、数字孪生、数字治理等社会生态数字化。
在数字化全新图景下,大力推进数字化转型成为实现全新图景的迫切需求。
四、结论
基于初步研究,数字化进程是以编码数字化为技术起点,以应用及理念数字化为共识基础,以生态数字化为发展目标的人类社会新进程。在这一进程中曾先后树立了数字化(早期)、信息化、网络化、智能化、数字化(当前)发展目标。虽然随着这一进程不断向前推进,越是临近当前,其发展方向越显得发散而模糊,但是纵观该数字化的发展历程,可以清晰看到该进程是以技术驱动业务应用和理念共识交互前进的过程,整个数字化的过程,几乎就是技术、应用、共识三者交相引领的发展过程。
数字化转型是数字化进程的一个中间节点,是数字化进程从量变进入质变的过程。数字化进程是广义数字化技术对生活领域从广度到深度的全面改造过程,即技术推进社会实现生态层面变革的宏伟进程,数字化转型是社会对该认识的认同,并对这一认同进行的确立和强调,是共识引领发展的新阶段。
数字化转型从形式上是指在数字相关技术支撑下,以信息化建设为代表手段,实现自动化、智能化等场景目标,并在此过程中,发展新型经济、实现新型业务、进行新型管理的一个变革过程。通过大数据视域下对数字化历程观察,数字化转型从目的上是基于前期数字化进程成果,凝聚社会对数字化进程共识,全面应用广义数字技术,推动以新数字、新理念、新组织、新经济、新治理等系列变革,实现以“生态数字化”为图景的新型社会的构建过程。