基于Logistic-熵的大数据产业生态系统演化路径研究
2023-02-13翟丽丽刘晓珊杨彩霞
翟丽丽,刘晓珊,杨彩霞
(哈尔滨理工大学 经济与管理学院,黑龙江 哈尔滨150040)
0 引言
随着云计算、移动互联网、物联网、人工智能等新一代信息技术的不断升级和普及应用,人类社会快速进入大数据时代。中共十八届五中全会首次提出国家大数据战略,推动我国从数据大国向数据强国转变。“十四五”规划强调加快推动数字产业化,推进产业数字化转型,营造良好的数字生态。大数据的潜力不可估量,率先建立起完整大数据产业生态系统的国家将在产业发展中占据先机。因此,构建完备的大数据产业生态系统对建设数据强国、提高国家竞争力具有重要意义。对于大数据产业生态系统演化路径的研究有助于及时、准确判断系统所处状态阶段,明确大数据产业生态系统发展方向,为企业转型升级提供方向指引和政策建议,保证大数据产业生态系统的可持续健康发展。
在大数据产业生态系统演化过程中,受主体间关系变化的影响,系统中不同特征的主体种群共生发展[1],种群生长规律符合生物学中的Logistic生长函数模型[2]。目前学者们多利用Logistic模型对企业功能特征种群间[3]、数据主题种群间[4]等不同分类的种群进行主体间关系研究,给出不同特性种群的演化路径。同时,数据资源作为重要生产要素,是系统发展的核心资源,因而还要考虑资源流动对系统演化的影响。Logistic模型无法体现资源的影响作用,而熵模型可用于分析资源变化对系统发展演变的影响[5-7]从而优化系统资源配置[8]。
在大数据产业生态系统中,不同数据资源特征的种群内与种群间都伴随着资源交流,种群主体间关系和资源交流变化共同决定系统演化路径。因此,将Logistic模型与熵模型相结合能全面揭示大数据产业生态系统中不同特性的核心种群相互促进和资源流动的演化规律,进而研究大数据产业生态系统演化路径。研究结论可为国家、行业、企业等不同层面实施大数据发展战略提供重要理论支持。
1 文献综述
目前对大数据产业生态系统的研究主要集中在系统构建与发展方面。关于大数据产业生态系统的构建,Gorodetsky等[9]、Cui等[10]认为,大数据与工业生产制造、物流相结合能形成基于自组织特性的大数据产业生态系统;周钟等[11]通过剖析大数据从研发到应用涉及的主体与资源要素,构建大数据产业应用生态系统。关于大数据产业生态系统发展水平的评估,赵海东等[12]结合大数据产业特征,基于创新驱动视角构建发展水平评价指标体系,并指出应从政策、文化、人才和市场等方面进行优化。在大数据产业生态系统未来发展方面,Castro等[13]认为,新颖的数据来源、大数据分析能力的提高和主体要素协作有助于实现可持续发展目标;胡登峰[14]提出通过加强数据资源管理、优化资源结构等推动系统升级。由此可见,关于大数据产业生态系统的研究沿着系统构建—发展水平—发展趋势的过程演进。
对于产业生态系统演化路径的研究,大多数文献从系统主体关系或特征出发,如Tolstykh等[15]从主体共生模式和产业循环方面对系统升级进行研究;程胜[16]根据主体竞合关系研究产业集群的演化稳定性;范太胜[17]基于对系统内主体间竞争关系的研究,给出从局部到整体系统稳定的演化路径;Yang等[18]基于路径演化理论,从产业路径依赖特性出发,提出产业发展路径创造机制。在演化研究方法上,从系统主体出发,Logistic模型是较常用的方法,如孙丽文等[19]从主体间竞合关系出发,利用Logistic模型构建系统竞合演化机制;孙冰[20]利用Logistic模型分析不同功能特性种群的不同演化路径;Meng等[21]利用logistic模型对主体生态位进行研究,并提出不同主体间协同演化的优化策略。从系统资源出发,曾子明等[22]基于熵理论视角,从系统内外部信息交流传递变化研究舆情演化与风险控制;Moldavanov[23]利用熵模型研究系统内部与环境交流过程中能量变化对演化的影响;翟凯[24]指出,系统需要从外界不断引入负熵抵消系统正熵从而朝更好的方向发展;陈丹[25]认为,开放的体系进行内外信息置换会产生熵变,并影响系统演化结果。
综上可知,Logistic模型被广泛用于研究主体间关系变化、种群演化规律等问题,在产业演化发展研究中具有很强的实用性。数据资源、大数据技术等是大数据产业生态系统的重要资源要素,系统间与系统主体间的资源、技术交流与交换等会对系统演化路径产生重要影响,而熵模型多被用于探讨系统熵流变化如何影响状态改变并最终导致系统演化。上述两种模型分别从种群主体间关系演化和资源交流程度变化角度描述系统演化规律,而生态系统种群主体关系演化过程中伴随着资源的交流变化,两个过程相结合才能更准确反映系统演化状态。因此,本文将Logistic模型与熵模型相结合,从大数据产业生态系统种群特征出发,基于系统主体关系以及主体间、系统间的资源交换等研究大数据产业生态系统演化路径。
2 大数据产业生态系统结构及特性
2.1 大数据产业生态系统界定
目前大数据产业还没有形成统一定义,学者们和政府管理部门从不同角度对其进行了界定。学界较多认为大数据产业是与大数据有关的数据资源收集、分析、存储、组织管理及价值提炼应用等经济活动的集合。本文基于产业管理视角,采用工业和信息化部《大数据产业发展规划 (2016—2020年) 》对大数据产业的界定:以数据生产、采集、存储、加工、分析、服务为主的相关经济活动,包括数据资源建设,大数据软硬件产品开发、销售和租赁活动以及相关信息技术服务。
关于产业生态系统的研究,学者们主要结合生态系统思想围绕产业集群展开[26],如Frosch & Gallopoulos[27]最早提出产业生态系统概念,指出产业生态系统是一种类似自然生态系统的循环体系,运用新的生产方式减少对环境的危害从而保持产业持续健康发展;刘则渊等[28]认为构建产业生态系统是为了在整体系统的物质能量交换过程中把握产业活动对环境与资源的影响。由此,本文认为大数据产业生态系统是由以大数据相关企业及为产业运作提供各类资源的中介机构所组成,具有能量和信息流动等特定规律且与环境协调发展,涉及数据全生命周期(数据生产、采集、存储、加工、分析和服务等)的复杂系统。
2.2 大数据产业生态系统结构及种群划分
基于生态系统理论,将大数据产业生态系统分为生物部分与非生物部分。其中,生物部分是大数据产业相关企业、中介机构等系统主体要素,非生物部分则是社会文化、市场等环境与物质能量。
大数据产业是数字经济的重要驱动力,目前对大数据产业还未形成明确统一的分类标准,各界根据不同需要提出不同划分方法,如二分法、三分法、五分法、六大类等,但这些分类都缺少官方权威支撑。目前与大数据产业密切相关的官方权威行业分类标准是《数字经济及其核心产业统计分类(2021)》(国家统计局令第33号)。这一分类标准从数字经济活动角度进行划分,相对比较宽泛,未对大数据产业进行明晰界定,难以与企业类型直接对应,但可根据研究目标,参考这一标准对大数据产业进行细分。《数字经济及其核心产业统计分类(2021)》将数字经济核心产业划分为数字产品制造业、数字产品服务业、数字技术应用业、数字要素驱动业和数字效率提升业五大类。前四大类属于数字产业化部分,是数字经济核心产业,第五大类为产业数字化部分,是数字技术与实体经济的融合。中国信息通信研究院发布的《大数据白皮书(2021)》指出,基础设施、数据服务、融合应用是大数据产业的三大组成部分,三者相互交融,形成完整的大数据产业内部生态,其中基础设施和数据服务构成数字产业化部分,融合应用构成产业数字化部分。此外,政府及各类服务机构的功能是为大数据产业提供发展服务,同时大数据产业发展也受到社会、市场等环境影响,这些服务机构和环境与大数据产业一起构成完整的大数据产业生态系统。依据上述分析,本文将大数据产业生态种群划分为3类:基础种群、核心种群和辅助种群。基础种群包括信息产品制造企业、信息产品服务企业和信息技术服务企业,是大数据产业运行的基础。核心种群包括数字原生企业和数字化转型的传统企业(简称转型企业),进一步将数字原生企业按照数据资源来源划分为数据生产型企业和数据服务型企业。其中,数据生产型企业业务侧重对自身产生的业务数据进行处理再利用,数据服务型企业业务则侧重对收集的数据资源进行分析挖掘并给出分析结果与解决方案。转型企业种群是指通过与基础种群企业和数字原生企业种群合作,或通过引进、运用大数据技术等进行转型升级的传统企业。辅助种群由政府、高校、金融机构等实体组成。
如图1所示,在大数据产业生态系统中,主体协同发展,种群间合作共生,与政策、市场等环境相互作用,实现系统内物质能量等的循环流动。
图1 大数据产业生态系统Fig.1 Big data industry ecosystem
有“中国数谷”称号的贵阳,作为全球超大型数据中心的密集地带,已形成大数据产业生态系统,其核心种群包括阿里巴巴、腾讯等数据生产型企业,数据宝、华泰智远等数据服务型企业,航天电器、海信、奇瑞万达等转型企业,企业间进行资源共享、技术交流与业务合作。同时,贵阳大数据产业生态系统拥有良好的基础设施,系统基础种群包括白山云、中国电信、中国移动等企业,建设数据中心标准机架100万架、服务器400万台等。此外,国家大力支持贵阳大数据产业生态化发展,提供一系列优惠支持政策,系统内拥有贵州大学、华为大学、大数据战略重点实验室、贵阳大数据交易所等辅助种群主体。除拥有良好的政策环境、数据资源环境、技术环境外,贵阳大数据产业生态系统还拥有地质结构稳定、能源充足等良好的生态环境与企业运作环境。
2.3 大数据产业生态系统自组织特性分析
社会对于先进技术、智慧城市的需求以及满足需求的能力形成大数据产业生态系统的发展动力,同时市场、社会文化等环境也成为限制其发展的因素。在动力与约束共同作用下,大数据产业生态系统不断演化,呈现出自组织特性。
(1)开放性。大数据产业生态系统是一个开放系统,社会成员间不断进行数据交互[29],数据的存在与交流形式使得大数据产业生态系统必然是开放的。
(2)非线性复杂系统。大数据产业生态系统组成要素的多样性决定其是一个非线性复杂系统,技术、数据资源等不同导致主体要素存在差异,这些主体要素形成不一致的高低位势结构从而产生势能差,在此起彼伏的位势涨落间不断促进系统动态演化。
(3)远离平衡态。这一特性推进系统状态由无序向有序转化。大数据产业生态系统的非平衡性主要表现在大数据相关企业发展不平衡、数据资源流动不平衡、企业数字化发展不平衡3个方面。
(4)随机涨落性。大数据产业生态系统内的随机涨落能够保障系统完成演化,数据的复杂性、不可预测性等因素造成主体要素状态出现偏差,这些偏差即形成涨落,使系统远离非平衡态,跃迁到新的稳定、有序状态。
在大数据产业生态系统中,数据与技术的复杂性使系统状态发生不可预测的变化,而熵是描述系统功能状态的,在系统远离平衡态时,正熵增加,而系统的自组织特性通过增加系统负熵抵消正熵的消极影响[30],使系统朝着良性方向演化。
大数据产业生态系统产生正熵的主要原因包括:第一,数据资源管理与使用混乱。信息技术时代产生的海量数据缺乏统一的存储、管理和使用等标准规范,造成数据资源使用混乱和资源浪费。第二,系统内主体间竞争过于激烈,产业结构不协调。数据作为核心要素,拥有高质量数据的企业具有绝对优势,同时也会引起主体间竞争。第三,系统内企业主体的数字化发展不平衡。系统中转型企业种群数字化发展程度较低,企业的资源结构、生产效率差异[31]导致数据要素分布不均。系统产生负熵的主要原因:一是系统内进行数据资源交流与大数据技术学习共享,这是负熵产生的主要原因。二是政府政策支持和基础设施完备,国家大力推动大数据产业发展,投入大量资金、人力,全面加强基础设施建设,鼓励企业数字化转型。三是系统内辅助种群多样、健全,各类科研院所、金融机构等能为大数据产业发展提供极大助力[32],增加系统朝有序化方向发展的力量。
3 基于Logistic-熵的演化状态分析
大数据产业生态系统是以核心种群为中心,并与基础种群和环境相互作用演化发展的,核心种群内部各种群之间的关系变化是整个系统的关键核心变化关系。因此,应用Logistic-熵模型重点阐述核心种群中数据生产型企业种群、数据服务型企业种群和转型企业种群3类主体间竞合关系以及资源、技术交流关系。
3.1 大数据产业生态系统Logistic-熵模型
由上述分析可知,大数据产业生态系统的自组织特性是其演化发展的前提,系统非线性产生的主体位势差、远离平衡态产生的发展动力、随机涨落性产生的远离非平衡态动力等都推动系统演化发展,但系统内主体间竞争、资源与环境限制等抵抗因素都会改变系统的综合状态。Logistic模型能够揭示不同种群特征的企业主体间关系对种群发展的影响,熵模型能阐述不同资源流动情况下的系统状态变化。
基于大数据产业生态系统的自组织特性,本文将描述主体间竞合关系的Logistic模型与体现系统资源、技术交流的熵模型结合起来,从而更完整地刻画大数据产业生态系统的演化路径。Logistic模型是解释自组织系统主体间关系变化的标准模型,其方程形式如下:
(1)
其中,对于大数据产业生态系统,x为其综合发展状态,以系统的经济效益体现;r为无限制状况下系统的最大发展速率,即在没有市场容纳量限制下系统经济效益x的增长率;M为技术水平限制下系统最高发展程度可获取的经济效益。
对于大数据产业生态系统而言,无时无刻不在进行数据资源与技术的流转以及资金、能量流动,都是影响系统负熵的因素,称为负熵流。在系统中,存在正熵(I)、负熵(E)、熵变(dS)、正熵增(dSi)和负熵流(dSe),则有:
dS=dSi+dSe
(2)
由于系统正熵是自发产生的,不可能为负值,总有dSi>0。如果dSe<0且|dSe|>dSi,则dS=dSi+dSe<0,这表明随着负熵流增加,系统会由原来的状态朝着更加有序的状态发展。
在大数据产业生态系统中,熵状态参量S=f(T,Q,V),其中T为时间,Q为系统数据资源、技术和能量等,V为数据资源、技术和能量在流动、交换或共享等生产活动中产生的相应经济价值。在系统中,数据、技术等要素的价值最终都要通过经济效益直观体现,因此本文以经济价值V表示系统内的熵,则大数据产业生态系统的熵为系统在某状态下拥有的数据资源、技术等与其经济价值之比。
(3)
为更直观反映系统熵的变化,用一个时间段系统的初末态表示。
(4)
系统中数据资源、大数据技术等流转以及主体间竞合关系变化都会对系统主体经济效益产生直接影响,因而将资源、技术等对应的经济价值用主体最终产生的经济效益表示。根据Logistic模型的运算规则,为方便分析,假设大数据产业生态系统中每一个具有相同数据资源特征的种群至少有两个企业X、Y相互独立,在t时期两家企业的实际经济效益分别为RX(t)、RY(t);在技术水平一定的情况下,两家企业的经济效益最大值分别为KX、KY,并且假设其为常数;rX、rY分别表示理想环境下效益产出水平的最大变化率。因此,在相互独立的状态下,企业X、Y的经济效益Logistic方程为:
(5)
(6)
其中,根据现实经济含义,rX、rY>0,KX、KY>0。
根据上述特性分析,利用Logistic模型对大数据产业生态系统的主体间演化进行分析,再结合熵模型综合考虑数据资源、技术等。对于大数据产业生态系统而言,数据资源与大数据技术是产业的核心要素,对种群内企业的经济效益只考虑数据资源、大数据技术等流转产生的经济价值。令Qi为系统某一变化过程中产生负熵所利用的数据资源、大数据技术,N代表末态,O代表初态,RO为系统内主体的初始经济效益,则RO=RXO+RYO,RN为系统内主体在一段时间后的经济效益,则RN=RXN+RYN。将Logistic模型代入熵差公式,则大数据产业生态系统内的熵差公式为:
(7)
系统负熵流大小是决定系统能否朝有序化发展的关键,通过对系统主体数据资源、技术交流变化及竞合状态进行分析,确定大数据产业生态系统的最佳演化状态。
3.2 正熵差时系统的无序状态
当ΔE(s)>0时,系统内正熵大于负熵,此时系统结构紊乱,系统与外界的资源交流、物质交换受到抑制,发展状态不稳定,意味着系统朝着消极的方向演化。此时系统内有两种情况:首先,从大数据产业生态系统整体看,Qi<0表示系统内外部缺乏资源交流。这一情形多发生于系统发展初期,此时系统内部企业急于发展自身业务,企业间数据流通较少,由于缺乏统一的数据标准,数据使用与管理混乱。同时,由于发展初期技术不成熟,业务承载范围小,使得大数据产业生态系统与其它产业生态系统间业务合作较少,系统创新程度低。其次,从大数据产业生态系统内主体种群(企业系统)视角看,一方面,RN=RO,Qi<0或0
(8)
(9)
当σA>1且σB>1时,企业间竞争激烈,企业不存在共生平衡点,只要任何一家企业占据数据资源优势,另一家企业就会因失去核心竞争力而退出市场。此时,ΔE(s)>0,系统末态熵远大于初态熵,种群内资源减少、矛盾激化,导致系统结构紊乱,处于不稳定发展状态。
可见,当正熵差时,大数据产业生态系统演化处于混乱无序状态。系统内主体间资源交流大幅减少、竞争加剧,甚至出现资源垄断现象,导致内部结构混乱、资金效益低下,系统无法持续发展演化。此时,如果系统通过从外界获取数据资源、新技术等调整内部状态,抵消正熵带来的消极影响,当Qi≥0且QN≥QO时,系统将向零熵差状态转变。
3.3 零熵差时系统的整体动态平衡状态
当ΔE(s)=0时,系统内正熵等于负熵,此时大数据产业生态系统整体处于动态平衡状态,系统能够充分利用从外界获取的资源抵消正熵的消极影响。对于企业系统来说,存在两种情况,一方面,Qi=0且QN≥QO,表示企业没有从外界获取新的数据资源,自身业务产生的数据资源在内部得到利用。此时,企业处于业务发展初始阶段,通过业务产生或收集的数据、技术等实现资源的循环再利用。另一方面,Qi>0,QN>QO且QN>Qi,此时RN=RO,表示一段时期内企业与外界进行资源交流共享,同时企业自身也取得技术或业务突破,但业务总盈利为零。也即,企业系统内产生大量数据资源流转,拿出少部分资源与外界进行交流共享,但企业总体经济效益未能即时提升,需要一定时间进行成果转化。
当零熵差时,大数据产业生态系统演化处于整体动态平衡状态。系统主体产生的数据资源供主体自身业务所用,主体间缺乏资源交流。但这一状态极易发生改变,当平衡状态发生变化时,系统演化方向也将改变。当系统停止与外界进行资源交流时,系统将朝正熵差状态发展,但会持续增加与外界的联系合作,加强资源共享与交流,当Qi>1时,系统将向负熵差状态发展。
3.4 负熵差时系统的健康稳定状态
当ΔE(s)<0时,系统内正熵小于负熵,大数据产业生态系统整体结构稳定,系统内充分进行数据共享与技术交流,有序度提高,意味着系统朝健康稳定的方向演化。对于企业系统来说,存在两种情况:一方面,QN(1-Qi)
图2 企业A、B平衡条件Fig.2 Balance conditions between enterprises A and B
(2)数据生产型企业种群。种群内企业主体业务范围广,业务产生大量数据资源并利用大数据技术对其进一步分析,为消费者提供针对性服务。这类企业规模大、内部结构复杂,为提升市场份额,企业向应用服务方向发展,大力支持技术与应用创新。由于大中型企业拥有更多顾客和更优质的数据资源,促使种群内不同企业间开展业务合作,产生数据资源流转,最后呈现出以大型企业为核心,中小型企业通过与大型企业合作进行业务联系的现象。此时,在数据生产型企业种群中抽象出企业C、D,令X=C、Y=D,企业C、D的经济效益Logistic方程为:
(10)
(11)
(3)转型企业种群。转型企业与数字原生企业进行多方面合作,利用大数据技术对传统企业生产运作进行数字化升级,对业务进行数字化存储与利用,对原有复杂组织结构进行优化调整。随着政府政策支持和企业数字化转型需求增加,呈现合作多样化、稳定性提升、合作范围扩大等利好趋势。此时,从转型企业种群中抽象出企业G,从数字原生企业种群中抽象出企业H,令X=G、Y=H,则ωG(ωG>0)表示数字原生企业H对转型企业G的合作促进作用,企业H同理。此时,企业G、H的经济效益Logistic方程为:
(12)
(13)
当负熵差时,大数据产业生态系统演化处于健康稳定状态,系统内不同企业种群都能取得较高的经济收益,主体间和种群间竞争适度、合作紧密并充分进行数据资源与技术交流共享,系统朝着多样化、智能化等方向可持续发展。因此,负熵差是系统演化的最佳状态,大数据产业生态系统演化路径要以达到这一状态为目标。
4 大数据产业生态系统演化路径
由于大数据产业生态系统是复杂系统,其演化过程通过种群子系统演化最终实现系统种群集成演化。因此,演化路径需要从不同核心种群演化路径和系统种群集成演化路径两方面分别表述,对不同核心种群演化路径辅以企业案例进行详细阐释。
4.1 数据生产型企业演化路径:业务数据集聚—多渠道数据拓展—数据智能化应用
对于数据生产型企业种群,当熵差ΔE(s)>0时,数据生产型企业处于业务发展初期阶段,企业通过自身业务获取的数据资源较多,但由于业务分散,企业无法处理这些业务带来的庞大数据量,与其它种群企业合作较少,种群内部状态混乱。此时,企业需要:①加强大数据相关技术学习,扩充技术人才队伍、学习先进大数据技术是支撑企业运作发展的核心力量;②开展业务数据聚合分析,更全面高效地分析企业运行状态,提高业务能力;③建立企业合作关系网络,拓宽数据来源渠道并提升业务层次。通过上述举措增大系统Qi,当Qi≥0且QN≥QO时,种群系统内从外界获取的可利用资源增加,企业合作关系网络得以建立,系统向ΔE(s)=0状态转变。
以阿里巴巴集团为例,公司积累了数以亿计的用户与大量合作企业,其业务产生了庞大的数据量,属于数据生产型企业。在发展初期,由于技术限制,数据存储与利用不足,系统处于熵差ΔE(s)>0的状态。为突破困境,阿里巴巴不断进行人才招聘、先进数据技术学习,利用阿里云平台对业务数据进行汇聚分析,对用户进行精准推送,企业系统整体Qi≥0,企业开始快速发展。
当熵差ΔE(s)=0时,种群系统处于平衡状态,由于资源缺乏与技术限制,数据生产型企业发展进入停滞期,企业的技术仅能处理当前业务产生的数据资源。此时,企业需要:①技术创新突破。通过技术创新,以更强大的数据处理能力、更高级的智能决策推动企业发展;②数据智能应用突破。基于数据智能平台的搭建应用,对数据进行实时响应与智能交互,促进资源流动,提升企业数据获取与使用能力。当系统Qi>1时,系统内出现新的数据资源或技术突破,业务发展迅速,系统向熵差ΔE(s)<0状态转变。
此时,阿里巴巴业务经过迅速发展,由于技术瓶颈、用户高层次需求的出现,业务增速放缓。为突破技术瓶颈,阿里巴巴设立达摩院,通过吸收顶级人才与先进技术,研发出图片数据拆解与比对技术并应用于业务场景,实现数据智能应用,企业系统Qi增大,进入快速发展阶段。
当熵差ΔE(s)<0时,数据生产型企业进入快速发展阶段。此时,种群系统内部建立合作网络,业务实现多元化发展,通过与数据服务型企业进行资源、技术交流,与转型企业加强业务合作,促进数据融合升级。同时,通过建设数据智能平台优化企业组织结构,加强对数据资产的管理与应用,实现数据智能分析。
随着业务不断发展与扩张,数据资源获取与处理显得尤为重要。阿里巴巴与多家企业合作,如与数据服务型企业新华三集团合作建设新一代阿里数据中心,以数据推动交易服务升级,实现数据循环优化。
在数据生产型企业种群中,绝大部分数据资源来源于企业各类业务,多业务平台的数据聚合分析能全面把握企业总体业务情况从而选取最佳业务拓展方向;以用户、智能产品等为中心,通过线上线下等多种渠道进行数据拓展;通过数据智能化应用提升用户对企业的信任与依赖,推动企业业务发展。最终形成业务数据集聚—多渠道数据拓展—数据智能化应用的数据生产型企业种群演化路径。
4.2 数据服务型企业演化路径:数据云聚合—高质量数据融合—数据资产化建设
对于数据服务型企业种群系统,当熵差ΔE(s)>0时,企业处于发展初期阶段,企业间对数据资源的争夺激烈,阻碍种群系统与外界资源交流,系统内数据资源分配不均甚至产生数据资源垄断现象。此时,政府需要实施反垄断政策,维持良好的市场环境;制定企业发展优惠政策,支持新生企业加入,增加主体多样性。同时,企业需要实施数据云聚合,提升自有数据资源占比,通过云平台的建设,大量、高效进行数据聚合处理。在政府与企业共同调节下,系统负熵流增加,当Qi≥0且QN≥QO时,系统可利用数据资源增加,资源的收集、存储能力大幅提升,企业自有数据资源占比高于业务供给的数据资源,系统向ΔE(s)=0状态转变。
以新华三集团为例,公司利用大数据技术提供数据优化方案等服务,属于数据服务型企业,在发展初期,企业为扩大市场份额,与同行业企业进行资源竞争。为提升企业竞争力,企业设计了业界首款云化集群路由器,将数据汇聚云端,系统整体Qi≥0,企业开始快速发展。
当熵差ΔE(s)=0时,数据服务型企业处于业务发展停滞期,系统内数据资源被循环利用,但由于缺少更高层次的数据资源与技术支撑,系统创新性不足。此时,企业需要:①加强合作交流,保证资源的多样性并通过技术提升进行创新突破;②促进高质量数据融合,对来源相近、特征相似的数据进行融合升级;③推动数据资源资产化,将数据资源内化为企业数据资产。当Qi>1时,系统主体合作网络建设完备,具有更高层次的数据资源或创新性技术开发,数据资源内化形成一定规模的数据资产,系统负熵流增加,系统向ΔE(s)<0状态转变。
随着市场上同功能产品增多,新华三集团业务发展放缓。为打破业务停滞的局面,2018年公司提出融合平台战略,加快数据融合,并将数据资源管理提升为数据资产管理,系统Qi>1,企业进入业务快速发展阶段。
当熵差ΔE(s)<0时,数据服务型企业系统结构稳定,处于业务快速拓展阶段。此时,通过与数据生产型企业种群进行技术合作与资源共享,与转型企业种群合作获取更多元化的数据资源并对其进行集聚、融合处理,使之成为企业数据资产。
这一阶段,新华三集团业务快速发展,推出智能数字平台等产品,成立智能事业群,发布智能战略,并与阿里巴巴、中国铁路工程集团等合作,为其提供智能设备与服务,获得大量数据资源并形成业务数据资产。
在大数据产业生态系统演进过程中,数据服务型企业以大数据云存储处理中心建立为基础,进行多渠道数据聚合,推动具有相似特征的高质量数据融合,为业务对象提供更高层次的决策意见,并将数据资源建设成为企业数据资产,形成数据云聚合—高质量数据融合—数据资产化的数据服务型企业种群演化路径。
4.3 转型企业演化路径:业务信息网络化—流程再造数字化—服务应用智能化
对于转型企业种群,当熵差ΔE(s)>0时,转型企业处于业务信息网络化变革阶段,业务处理方式单一、效率较低,与其它种群企业缺乏技术合作与资源交流。此时,政府需要通过政策支持、举办数字化培训等引导企业转型。转型企业需要进行信息化变革,通过引进信息技术设备、加快信息系统的推广与应用等。同时,增加与其它种群的合作交流,促进数据资源共享交流。当Qi≥0且QN≥QO时,转型企业种群与其它企业种群间建立合作关系,通过业务带动企业信息化变革,促使业务数据由碎片化转向集中化,朝数字化方向快速发展,系统向ΔE(s)=0状态转变。
以中国铁路工程集团(简称中国中铁)为例,中国中铁是集多项业务于一体的综合型建设集团,也是转型企业的典型代表。中国中铁经历基建行业的高速发展,行业产能趋于饱和,于2015年成立管理与技术研究院,向数字化转型发展,通过信息化系统的应用等将传统基建业务信息化,促进业务数据聚合、流通,使系统整体Qi≥0。
当熵差ΔE(s)=0时,转型企业处于转型发展停滞阶段,存在两种可能:一是企业自身进行数字化改革升级,但仅满足企业原有业务需求;二是与数字原生企业建立数字化转型合作联系,但整体业务交付与数据共享程度不高。此时,企业需要持续进行组织架构调整与业务数字化流程再造。同时,通过技术合作,利用云平台对企业数据资源进行聚合处理,提升数据资源利用率与决策效率,实现业务突破。当Qi>1时,企业持续进行数字化业务流程再造,实现业务数据在云端的实时调用与操作,整体实现数字化管理,系统向ΔE(s)<0状态转变。
随着中国中铁的业务体量增大和全球化布局加快,数据资源不断丰富,但技术停滞无法支持业务扩展与快速响应,导致资源利用率低。为提升业务效率,中国中铁与新华三集团合作建设“中铁云”,对业务流程进行数字化再造,向数据资源云化管理迈进。同时,与阿里巴巴合作,利用大数据等技术促进高铁网与互联网融合,提升数据资源利用率,企业系统Qi>1,“数字中铁”向“智慧中铁”发展。
当熵差ΔE(s)<0时,转型企业向服务应用智能化快速发展,并与其它种群企业进行充分的技术交流、数据共享,通过设立信息部门促进各系统融合升级,向企业智能决策管理方向发展。此时,转型企业的数字化程度最高。
2021年,中国中铁建成启用世界上单体最大的智能化盾构装备产业园,由数字化向智能化快速发展。中国中铁利用大数据智能控制等技术打造智能生产车间,由“制造”向“智造”转变。
转型企业信息技术设备的引进、信息部门的设立等是企业转型发展的前提;数字化流程再造与业务重组使转型企业由信息化向数字化演进;大数据云存储处理中心建立、业务数据融合和数据智能化应用使转型企业再由数字化向数智化演进。企业系统整体实现融合发展,最终形成业务信息网络化—流程再造数字化—服务应用智能化的演化路径。
4.4 大数据产业生态系统种群集成演化路径:大数据云存储处理中心建立—数据融合扩展—数智化应用
由上述分析可知,不同核心种群存在不同演化路径,种群主体间相互联系、协调发展,朝着负熵差状态演化。不同演化路径在每一阶段都影响着系统整体状态,核心种群演化路径的集成以及基础种群、辅助种群与环境的演变共同形成大数据产业生态系统的整体演化路径,即种群集成演化路径。
当熵差ΔE(s)>0时,Qi<0、RN≤RO,大数据产业生态系统处于发展初期阶段,各种群系统都处于主体结构混乱、资源交流共享程度低的状态。核心种群主体间资源交流匮乏,数据收集处理能力弱,发展不稳定,基础种群主体创新性不足,技术与设备落后导致基础设施建设不完善,且辅助种群主体多样性不足。
此时,大数据产业生态系统经济效益低下,政府需投入大量资源对系统进行调控,市场、技术等环境较差。为促进主体间资源交流,应对庞大数据量的存储处理,大数据云存储处理中心的建立成为系统整体演化的第一步,种群间通过大数据云存储处理中心直接对聚合的数据进行共享交流。同时,以需求驱动基础种群进行技术学习,提升产品制造、服务应用等能力。当Qi≥0且QN≥QO时,大数据云存储处理中心的建立使数据资源利用率大幅提升,大数据交易所等辅助种群主体增加,系统资源、政策等环境转好,系统内负熵流大幅增加,系统状态向熵差ΔE(s)=0转变。
当熵差ΔE(s)=0时,大数据产业生态系统处于快速发展的停滞阶段。由于数据与技术发展停滞、资源交流网络固定,各种群系统达到平衡状态,系统整体缺乏活力与动力。
此时政府鼓励新生企业加入,随着主体增加,数据来源渠道与种类相应增加,各种群通过数据融合扩展促进多渠道平台数据的集聚,增加系统负熵流。大数据交易所、中介服务组织等积极加入,增强系统稳定性,市场等环境逐渐优化。当Qi>1时,系统内数据源增加,应用层次提升,主体增多,辅助种群功能完备,系统状态向熵差ΔE(s)<0转变。
当熵差ΔE(s)<0时,大数据产业生态系统处于智能化持续发展阶段。系统内形成良好的数据资源交流等渠道,系统数字智能化水平提升,实现数据资源的智能处理与分析。系统内核心种群主体结构稳定、合作交流紧密。基础种群企业的产品、技术成熟,基础设施不断完善。辅助种群主体多样化发展,系统经济效益持续提升。此时,系统负熵流不断增加,系统朝着健康良好的方向可持续演化。
大数据产业生态系统达到元素多样、主体交流紧密的可持续发展状态,是整体创新性强、智能科技化程度高且结构稳定的经济循环大系统。如图3所示,大数据产业生态系统形成大数据云存储处理中心建立—数据融合扩展—数智化应用的演化路径。
根据调研企业观研天下发布的数据,我国大数据产业融合应用发展迅速,互联网企业线下业务的数字化转型占大数据产业行业应用的45%;大数据产业的融合应用不断为系统增加数据资源流动,大数据产业规模逐年扩大,2022年有望超过1.4万亿元,年均复合增长率超过30%。可见,我国大数据产业生态系统的可利用数据资源将持续增加,即Qi>1且RN≫RO。因此,当前我国大数据产业生态系统总体处于熵差ΔE(s)<0的状态,系统沿着大数据云存储处理中心建设方向发展。为提升数据质量,需要进一步通过数据融合扩展提升数据功能层级。此外,随着科技进步和人们生活需求升级,系统将进入数据智能化应用发展阶段。但由于市场的限制和经济发展的动荡性,同时穿插着熵差为零的发展停滞期。在两种状态交错发展的情况下,需要不断学习新技术,发展大数据产业融合应用,扩充大数据人才资源,保持与系统外界的资源交流,这是系统发展的重要推动力与负熵的重要来源。同时,需要通过增加核心种群与辅助种群主体提升系统韧性,通过政策调控稳定市场环境。
5 结论与政策建议
5.1 结论
本文通过分析大数据产业生态系统的组成要素及结构模型,剖析系统特性,并结合Logistic模型与熵模型,研究大数据产业生态系统中不同数据特征种群的演化路径,进而研究大数据产业生态系统整体演化路径。得出如下主要结论:首先,依据生态学理论,结合大数据产业与产业生态系统,对大数据产业生态系统进行界定,并构建系统结构模型。其次,根据数据来源不同,将大数据产业生态系统中主体划分为数字原生企业和转型企业,其中数字原生企业细分为数据生产型企业和数据服务型企业。最后,利用Logistic-熵模型对不同特征种群进行演化状态分析,得到系统演化路径要以达到负熵差状态为目标。在此基础上,得出不同企业种群和系统集成演化路径:数据生产型企业业务数据集聚—多渠道数据拓展—数据智能化应用演化路径、数据服务型企业数据云聚合—高质量数据融合—数据资产化演化路径、转型企业业务信息网络化—流程再造数字化—服务应用智能化演化路径以及大数据产业生态系统大数据云存储处理中心建立—数据融合扩展—数智化应用种群集成演化路径。
图3 大数据产业生态系统演化路径Fig.3 Evolution path of big data industry ecosystem
5.2 政策建议
通过上文分析,大数据产业生态系统在负熵差时达到最佳演化状态,为增加负熵流抵消正熵的消极影响,提出如下政策建议:
首先,制定关于数据资源等核心资源要素的反垄断政策。通过出台反垄断政策维护数据资源公平竞争的市场秩序,激发企业技术创新活力,避免因企业过度竞争导致的系统混乱状态。
其次,对于数据生产型企业,政府牵头联合企业建立业务数据共享平台,制定企业核心隐私数据保护法规,促进多平台业务的数据聚合与安全共享,帮助处于正熵差状态的企业向负熵差状态发展;组织技术交流座谈,制定技术创新补贴与奖励政策,帮助企业突破零熵差状态;加强基础设施建设,带动辅助种群发展,助力完善数据智能应用场景,推动企业向负熵差状态发展。
再次,对于数据服务型企业,政府要制定统一的数据规范标准,提升数据处理效率与管理能力;开放企业对社会生产生活的非涉密碎片数据收集权限,为企业提供丰富的数据资源,增加负熵流;制定数据资产化标准,推动企业数据资产建设,促进数据资源吸纳,向负熵差状态发展。
最后,对于转型企业,政府通过确定重点示范企业,以点带面,推动传统企业向转型企业发展;制定转型企业帮扶政策,划分片区,建立片区内高数字化企业对转型企业的帮扶联盟,给予参与帮扶的高数字化企业优惠政策,促进企业间业务合作。