基于熵权-灰色关联法的大数据与制造业融合研究
——以京津冀地区为例
2022-12-15蔡志强朱紫娟
蔡志强 朱紫娟
(天津商业大学 经济学院,天津 300134)
一、引言
21世纪以来,以新一代信息技术的创新发展与各行业加快融合应用为标志,人类社会步入第四次工业革命时代。为此,世界各国都加快制定其工业生产率提升计划:2007年, 我国提出“大力推进信息化与工业化融合”的工业发展战略计划;2011年,德国提出“工业4.0”概念,美国提出“工业互联网”战略;2013 年 9 月,我国工信部发布《信息化和工业化深度融合专项行动计划(2013-2018年)》。这些计划的核心都在于利用第三次工业革命下的互联网广泛渗透国民经济各行业的优势,以实现制造业数字化、网络化、智能化为目标,充分挖掘工业生产过程中的数据信息价值,推进互联网、物联网、云计算、大数据等新一代信息技术在工业更细行业、更宽领域、更深层次以及更进一步集成的应用。然而,从国内外经济发展的现实情况来看,制造业在我国国民经济中处于支柱地位,且我国是世界上第一制造大国,但同时我国面临发达国家“再工业化”进程中高端制造业回流以及其他发展中国家劳动力成本优势下的中低端制造业流失的“双重挤压”。针对在世界制造业中我国制造业“大而不强”的境况,2015年5月,国务院发布《中国制造2025规划》,提出实施工业大数据创新应用试点,推进发展个性化定制、网络化协同等制造新模式。2015年9月,国务院发布《促进大数据发展行动纲要》,系统部署大数据发展工作,明确提出大数据在工业领域的应用任务。2016年12月,京津冀大数据综合试验区正式成立,旨在统筹发挥京津冀三地在大数据领域的基础设施、技术、市场等资源方面优势,推动京津冀地区建设成为国家大数据产业创新中心、改革综合试验区、应用先行区和全球大数据产业创新高地。由此可见,京津冀地区拥有大数据产业协同创新发展的重要政策支持与资源支撑。2020年4月,《工业和信息化部关于工业大数据发展的指导意见》提出要激发工业数据资源要素潜力,培育大数据服务龙头企业,深化工业大数据在制造业各业务环节的应用。
2020年,在党中央提出构建“以国内大循环为主体、国内国际双循环相互促进”的新发展格局背景下,推进大数据与制造业深度融合是适应日益升级的消费需求、进行制造业供给侧结构性改革、推动制造业转型升级的重要抓手。可见,我国迫切需要抓住以大数据为代表的新一代信息技术革命的战略机遇期,推进大数据与制造业全面深度融合发展,逐步迈入制造业强国行列。京津冀大数据与制造业融合发展的机制和路径探索的研究,有助于利用大数据产业协同优势充分激发大数据产业应用潜能,进而推动京津冀三地形成大数据与制造业协同发展的良性业态,进一步发挥大数据与制造业融合示范带动作用,充实京津冀协同发展战略实施方案,助力落实疏解北京非首都功能、天津现代制造业立市发展规划等多重目标的实现,最终推动京津冀经济高质量发展。
物联网、(服)务联网和人际关系网的集成有助于制造业大数据的形成,基于制造业大数据的知识网是智慧制造系统的驱动力和重要连接纽带,从而形成“物-数据-信息-知识-群体智慧-服务-物”的智慧集成制造循环[1]。与基于准确模型和精妙算法的传统数字化制造模式不同,大数据驱动下的智能工厂形成“关联分析-模型建立-调控决策”的运行模式,即:首先,清洗和处理海量数据,挖掘制造数据内部规律;其次,建立车间生产数据与车间性能数据的关系模型;最后,调控制造关系模型的关键参数以达到制造产品交货期、产品性能的预期设定等目标[2]。在“工业4.0”背景下,制造业提质增效迫切需要产品全生命周期智能化解决方案。制造企业内外部数据融合下开发的系统性技术平台,通过知识发现与知识服务进一步提供智能制造、主动预防性维护、能耗管理、供应链信息互联等复杂业务解决方案[3]。消费端的大数据挖掘能够及时向短生命周期产品制造端提供消费者对产品的软硬件偏好信息,推动服务型制造的生产模式创新。长生命周期产品具有制造流程繁多、复杂、自动化程度高的特点,数据管理贯穿设计制造和维护的产品全生命周期,其制造过程就是信息处理和加工过程[4],数据处理能力是决定制造效率和质量从而缩短产品生命周期的关键要素。在工业物联网基础上的大规模定制生产中,网络技术是基本支持,数据采集、存储、传输和分析系统是关键支撑[5]。全网全流程数据的采集、多层次的分析方案和构建算法模型库的服务推动网络化协同制造和智能制造的制造模式变革[6]。大数据与制造业融合机制这一问题从研究内容看,已经涉及具体的融合方式与路径,但是具有内容维度单一、观点零散分布、不具有逻辑完整性和结论统一性的特点,缺乏对融合机制的系统性阐述与分析。从研究视角看,侧重于物理技术融合机制研究,经济学角度的融合机制和效应分析仍有很大研究空间;侧重于微观制造企业运作的切入视角,中观行业层面的融合机理有待系统阐述和完善,立足于地区层面的具体发展路径分析较少。而本研究根据融合机理选取量化指标,选取京津冀大数据综合试验区进行地区融合的比较优势研究,全面分析大数据与制造业融合机理,从而获得大数据与制造业跨地域融合发展路径经验,进而提升大数据与制造业跨地域融合效应。
二、大数据与制造业融合机制界定
总结现有大数据与制造业融合机制的研究,以大数据全生命周期的形态与制造业融合的不同价值表现为逻辑链条,依托大数据与制造业融合的理论基础,以大数据与制造业融合的可行性路径为切入点,本文提出大数据与制造业具有要素、技术与业务融合三个维度,三个维度在融合总机制架构中呈现递进关系,最终助力产业升级。
(一)大数据与制造业融合的“三维度”机制
1.大数据要素与制造业传统要素融合机制
根据创新经济学相关理论,新生产要素的确立通常是技术革命的产物。当多个相互关联的通用目的性技术(General Purpose Technology)都出现激进式创新时,就会形成新的技术体系,引发技术革命。2010年前后,以互联网、区块链、云计算、物联网、人工智能等为代表的新一代信息技术的研究取得较大进展并开启大规模商业化应用的进程,推动了新一轮科技革命和产业变革的加速演进。电子信息制造业提供大数据存储的软硬件基础,物联网提供大数据采集来源,互联网提供大数据传输通道,云计算和区块链提供大数据存储和处理技术,人工智能提供大数据智能处理运算。由此,作为物理对象在网络空间映射的大数据具有依托于电子存储介质的低生产成本、易复制的低交易成本以及共享下广泛消费应用的特点,这一特点符合关键生产要素的特性[7],使得大数据成为经济社会发展的重要资源,特别是在制造业中,大数据要素作为企业决策的依据以及信息、知识交流的基础和重要载体,甚至成为核心生产要素。
大数据要素贯穿于制造业生产全流程,与制造业融合包含由浅至深的三个层次。基础层次是大数据要素直接融入制造业生产过程,表现为制造工厂的数字设备实时产生和传递的生产运行数据是进行安全监测和质量把控建模分析的原始数据来源,作为产品需求方的消费者数据与制造业研发设计环节融合引导制造业改进产品方向。在此基础上,第二层次表现为大数据要素赋能传统要素质量提升,智能生产系统传递的数据信息为工人提供加工指令、赋能劳动力和生产设备对个性化需求精准执行。最高层次是大数据促进要素资源优化配置,表现为制造业产业链上的生产要素的数字化形式使其成为产业链上下游同一类别生产要素和不同类别生产要素融合的载体,进而带动资金流、人才流、创新流在产业链上的优化配置[8],提高产业链各生产要素的使用效率。由此可见,大数据要素通过直接加入到生产过程、赋能传统制造业生产要素和促进要素资源优化配置三条路径与制造业传统要素融合。在融合机制中,互联网基础设施、电子信息设备、数据要素流量是关键融合要素,本文选取互联网宽带接入用户和移动互联网接入流量量化表征要素融合机制。
2.大数据技术与制造业技术融合机制
根据技术演化理论,技术革新下的共性技术创新和使用是技术融合的基础。大数据技术是一种通用目的性技术,对输入其技术的部门具有普遍的技术改进潜力并能与其应用部门进行互补式和互动式创新。制造业技术贯穿价值链分工的产品研发环节、生产制造环节、营销和售后服务环节,对信息搜集、处理和分析具有很高要求。大数据技术与制造业融合,初期阶段表现为在制造业生产制造环节引进大数据技术创新而非自主创新,通过增加技术要素投入提高生产环节的价值链附加值,从而提升产业竞争力。在后期,由于大数据技术具有渗透性,企业为了增强竞争力,未来将进一步推动大数据技术在产业链上游产品研发设计和下游产品营销等方面的渗透和应用,推动制造业技术全产业链的自主研发创新。例如,大数据技术在赋能制造业的劳动力要素和生产设备基础上,推动大规模个性化定制技术创新;大数据技术在机器学习算法辅助下进行3D打印的缺陷检查技术创新;大数据技术通过完善知识库模型,促进制造业知识管理技术创新[9]。可见,大数据技术通过与制造业价值链各环节技术融合以及协同创新推动制造业转型升级。本文以大数据专利申请量、信息技术服务收入以及软件产品收入量化表征大数据技术与制造业融合机制。
3.大数据产业与制造业业务融合机制
根据比较优势理论,比较优势催生了降低成本下的产业分工。根据科斯定理,市场交易成本的大小与组织内部交易规模成正比,组织内部交易成本与组织内部交易规模成反比。一方面,大数据产业提供的信息资源共享使得制造企业交易过程中的事前调研、事中交付、事后监督的交易成本大大降低,从而促进组织内部交易规模的扩大。另一方面,随着产业分工深化,市场交易费用也不断提高。当市场交易费用高于组织内交易费用时,驱动产业间分工的内部化,表现为关联性产业的技术边界模糊化、产品和市场出现融合[10]。大数据产业独立性和专业化程度的不断提高,促使大数据要素和技术能够以更低成本、更高适配度与制造业生产环节的需求相对接,充分发挥大数据要素、制造业数字化传统要素在制造业生产活动中各自的比较优势,推动大数据产业分工在制造业的内部化,最终产生大数据与制造业融合下的服务型制造、网络化协同制造、绿色制造等制造业新模式和新业态。本文从大数据产业应用的成熟领域——电子商务中选取电子商务采购额和电子商务销售额量化表征大数据产业与制造业业务融合机制。
(二)大数据与制造业融合总机制架构
大数据与制造业融合总机制包含三个维度机制,三个机制内部又具有关联关系。大数据要素融合机制是融合的基础,大数据技术融合机制是融合的重要支撑,大数据业务融合机制是融合价值发挥的重要媒介,具体关系如图1所示。
图1 大数据与制造业融合总机制架构
下文分析立足于大数据与制造业融合的三个维度,以京津冀为例,运用京津冀经济社会发展数据实证分析京津冀大数据与制造业融合机制下的资源配置、利用和价值发挥现状,从而提出相关优化建议。
三、模型构建与实现
(一)模型设计与变量说明
1.模型选择
融合是指两个事物相互交融、合为一体的过程和状态。目前对于要素和技术与实体经济融合,相关研究多采取回归分析法对要素和技术对实体经济的影响程度进行量化分析,业务(产业)融合研究一般采取投入产出分析法、灰色关联分析法等进行分析[11]。回归分析法能够量化自变量对因变量的影响程度,但是难以控制其他未考虑变量的情形,投入产出分析法依赖于产业内部细分部门的统计计量。随着大数据与实体经济发展日益复杂,融合过程也包含众多不确定性。结合机制分析可知,大数据与制造业融合是一个包含多影响因素的复杂灰色系统,同时灰色关联分析法适用于样本数据量较少和缺乏规律性的情况。灰色关联分析法的主要核心思想是,对不同数值序列随时间变化的相似程度通过度量判断各序列联系的紧密程度,从而进行两个系统融合度分析,同时对不同系统要素之间融合度进行排序,进而发现融合度更高的系统要素指标,采取针对性措施促进系统优化发展[12]。系统总体灰色关联度的计量由多个要素(指标)的融合度加权确定,为了增强赋权的客观性,较多研究选取熵权法进行赋权,并通过实证验证“熵权-灰色关联法”与“投入产出法”得出结论具有一致性[13],能优化传统灰色关联度分析结论[14]。
2.变量选取
灰色关联系统将大数据和制造业看作两个系统,系统由要素组成,两个系统融合体现为系统中的要素相互竞争、合作从而增强整体发展协同度的过程[15]。李远刚(2021)[16]从固定宽带覆盖率和电子信息制造业等大数据基础设施、大数据专利和大数据人才等大数据生产能力、大数据与实体经济融合应用程度、大数据社会服务价值等角度,构造大数据子系统的量化指标,实证分析其与实体经济子系统融合度。结合以上大数据与制造业融合机制分析,本文大数据系统要素包括大数据基础、大数据技术以及大数据应用三个维度共8个指标,制造业系统要素选取衡量制造业综合发展水平维度的一个综合指标,如表1所示。
表1 大数据与制造业关联系数测度指标
根据大数据的定义,大数据是一种依托于特定物理介质存储在网络空间的社会物理空间的映射,是数据被动采集、主动上传和自动传输下的结果[17],而维基百科的定义为:“大数据是在传统软件下,数据捕获、管理和处理时间超过可容忍时间的数据集”。因此,可以推断移动互联网用户、移动互联网使用以及固定宽带接入是大数据要素产生的基础条件,代表大数据的基础设施发展水平,本文分别用移动电话年末用户(X1)、移动互联网接入流量(X2)、互联网宽带接入用户(X3)量化表示。大数据技术包含大数据采集、存储、传输、处理、可视化展示以及应用,是大数据与制造业融合的关键结合点,大数据专利申请量(X5)体现大数据应用技术发明的活跃度,信息技术服务收入(X4)和软件产品收入(X6)分别体现大数据服务和产品的价值创造能力,以此量化大数据技术的发展水平。电子商务作为传统商业的线上化模式与物流业发展紧密联系、相辅相成,是贯穿生产制造行业全流程的重要流通部门[12],同时,其作为互联网发展以来的新兴产业,是国民经济中数字化经营普及最快和最广泛的部门,电子商务采购额(X6)和电子商务销售额(X7)是体现国民经济数字化发展程度的先行指标,直接体现大数据的业务应用发展水平。由于大数据与制造企业的要素、技术和业务融合是融合机制的着力点,提质增效是大数据与制造业融合的动力和最终目标,借鉴已有制造业耦合研究多以工业产值作为制造业研究代表变量[18],考虑到现有数据可得性和变量代表制造业范畴的精准性,因此制造业数据选取规模以上制造企业经济效益指标,由于主营业务收入是制造企业经营状况的综合体现,因此,制造业变量选取制造业主营业务收入。
2012年以来,我国大数据技术逐渐得到重视并发展较快,且2014年以来我国才进行移动互联网接入流量的完整统计,因此,根据实际数据的可获得性,本文选取2014-2020年京津冀三地互联网和大数据的相关指标数据,通过中国国家统计局官方网站检索数据库查询大数据专利数据。李文娟等(2015)[19]分析发现IPC分类下大数据专利申请主要分布在G06F(电数字数据处理)和H04L(数字信息传输),吕明元和苗效东等(2020)[20]借鉴其分析成果研究了大数据对产业结构升级的影响。本文结合大数据专利技术的界定[21],立足于大数据技术与制造业技术融合的着眼点,认为大数据技术包含数据生命周期全流程,进一步扩展了大数据技术的分类号,以北京市为例,专利检索式为:申请号=(CN+) AND 申请日=20120101:20220101 AND 发明名称=(大数据) AND IPC分类号=(G06D G06E G06F G06G G06J G06K G06M G06N G06Q G06T G11B G11C G16 H04L H04K) AND 申请人地址=(北京市)。大数据的其他指标数据来源于《中国统计年鉴》(2015-2021)。制造业数据来源于2015-2021年出版的《北京统计年鉴》《天津统计年鉴》和《河北统计年鉴》。
(二)京津冀地区大数据与制造业融合的实证分析
1.基于熵权法的指标权重确定
熵权法计算步骤如下:
由于大数据各指标的量纲不同,需要进行数值标准化处理,从而能够进行不同指标的联合运算。此处选取的评价指标均为正向指标,因此,将每个指标进行以下归一化处理。
(1)
第二步,计算信息熵Hi。
(2)
β=1/lnn
(3)
(4)
当fik为0时,lnfik在数学计算上没有意义,根据熵权法的一般处理方法,此种情况下定义fik·lnfik=0。
(5)
该熵权法与传统熵权法不同之处在于,当Hi→1时,改进熵权法避免出现熵值差异很小而熵权差异过大的情况[22],同时经实证检验,改进熵权法下的灰色关联法与传统灰色关联分析相比,计算结果能突出较高和较低的关联系数,从而能够发现具有重要影响程度的指标[23]。
根据北京市、天津市、河北省三地大数据系统要素的8个指标的实际值,运用式(1)至式(5),求出京津冀三地大数据系统要素指标熵权值,如表2所示。
表2 京津冀大数据系统要素指标熵权值
2. 大数据系统要素与制造业的灰色关联系数计算
计算步骤如下:
第一步,标准化处理由参考序列和比较序列数值共同组成的数列,具体步骤见式(1),有:
(6)
第二步,对标准化后的数列,计算每个比较数列和对应参考数列数值的绝对差,有:
|Xi-X0|=xik-x0k
(7)
第三步,计算比较数列第i个评价指标与参考数列的关联数值,有:
ξik=
(8)
第四步,求各指标的灰色关联系数,有:
(9)
其中,n为选取的样本数据的年份总数,此处赋予每一年关联系数相同的权重,从而得出该指标的综合关联系数。
根据京津冀三地相应数据,运用式(6)至式(9),计算得出三地大数据系统要素指标与制造业的灰色关联系数,如表3所示。
表3 京津冀大数据系统要素指标与制造业关联系数
3. 基于熵权-灰色关联法的大数据与制造业关联系数计算
结合表1的大数据子系统分类、表2的各指标熵权值以及表3的关联系数,可以得出大数据子系统及总系统与制造业的关联系数,如表4所示。
表4 大数据子系统及总系统与制造业的关联系数
(三)结果分析
1. 京津冀大数据指标与制造业融合分析
北京市大数据指标与制造业关联系数如图2所示,天津市大数据指标与制造业关联系数如图3所示,河北省大数据指标与制造业关联系数如图4所示。
图2 北京市大数据指标与制造业关联系数
图3 天津市大数据指标与制造业关联系数
图4 河北省大数据指标与制造业关联系数
通过图2可以看出,总体上,北京市大数据指标与制造业关联系数位于0.6-0.9的较高融合度区间。其中,与其他指标相比,北京市电子商务销售额(X7)和软件产品收入(X6)与制造业主营业务收入关联系数处于最高的前2位,移动电话年末用户(X1)与制造业主营业务收入关联系数最低。这体现了北京市电子商务销售和软件产品与制造业融合度较高,表明北京市电子商务销售和软件产品与制造业的业务收入价值实现具有很高同步性。因此,北京市大数据与制造业融合的优势路径是大数据产业与制造业的技术和业务融合路径,具体为:位于制造业上游制造环节的软件产品提供解决问题的技术方案服务和位于制造业下游销售环节的电子商务促进制造业价值实现与效益增加,这发挥了北京市第三产业规模大、水平高的突出优势。另一方面,北京市移动电话用户与制造业主营业务收入关联系数较低,这体现了移动电话用户快速增长所带来的大规模数据量仍然有较大的开发利用空间。
通过图3可以看出,总体上,天津市大数据指标与制造业关联系数位于0.5-0.65的较低融合度区间。对各指标关联系数进行比较发现,天津市电子商务销售额(X7)和移动互联网接入流量(X2)处于较明显的融合度优势地位,这体现了天津市大数据与制造业融合的优势路径为大数据要素和大数据业务与制造业融合路径,具体为:用户端移动互联网数据与制造业业务增长具有较高同步开发利用度,销售端电子商务增强了制造业价值发挥下的下游销售渠道作用。大数据专利申请量(X5)和软件产品收入(X6)处于0.5以下、接近0.5的不显著融合水平,这表明天津市大数据专利和软件产品与制造业主营业务未能取得协调同步发展的地位,难以发挥大数据技术的创新资源优势。
通过图4可以看出,总体上,河北省大数据指标与制造业关联系数位于0.5-0.64的较低融合度区间,与天津市相似,但区别在于河北省各指标的关联系数的差异较小。其中,具有较高关联系数优势的指标为电子商务采购额(X8),表明河北省电子商务采购与制造业具有协调发展优势;其次,具有较高关联系数优势的指标是大数据专利申请量(X5)与电子商务销售额(X7)。因此,河北省的优势融合路径为大数据技术和大数据业务与制造业融合的路径,具体为:电子商务采购端和销售端通过提高制造业物料及产品供应效率实现与制造业业务增长的共赢发展,大数据专利技术与制造业技术发展需求相适应,从而与主营业务收入协调发展。另一方面,河北省移动互联网接入流量(X2)与制造业主营业务收入关联系数最低,表明河北省丰富的移动数据资源有待与制造业生产相结合从而被开发利用。
2.京津冀大数据各指标与制造业融合比较分析
将京津冀大数据指标与制造业关联系数进行对比分析,见图5。
图5 京津冀大数据指标与制造业关联系数
总体来看,北京市具有最高的大数据指标与制造业融合度,天津市和河北省大数据各指标与制造业融合度接近。分指标来看,京津冀在电子商务销售额(X7)和电子商务采购额(X8)指标上都具有明显的融合度优势,这与三地互联网在生活端的应用更为成熟相关。在移动电话年末用户(X1)指标上,三地该指标与制造业的融合度都处于较低地位,表明在移动电话用户增长速度有限条件下,该指标与制造业主营业务收入增长的协同度较低。与之相对照,在互联网宽带接入用户(X3)指标上,三地该指标与制造业的融合度都处于中等地位,表明互联网宽带对制造业主营业务增长仍然具有较大的促进作用。此外,从比较优势来看,其他指标融合优势可以互补。对于移动互联网接入流量(X2)指标,天津市较河北省具有突出的融合优势,体现了天津市移动互联网数据资源能较好地利用现状;对于信息技术服务收入(X4)指标,天津市较河北省具有微弱的融合优势地位,体现了天津市信息技术服务与制造业有较好地对接应用机制;对于大数据专利申请量(X5)指标,河北省较天津市具有突出的融合比较优势地位,表明河北省的技术开发利用针对性更强;对于软件产品收入(X6)指标,河北省较天津市具有微弱的融合优势地位,表明河北省软件产品与制造业有较好的协同契合度。
3. 京津冀大数据子系统与制造业融合比较分析
京津冀大数据子系统与制造业关联系数,如图6所示。
图6 京津冀大数据子系统与制造业关联系数
分子系统来看,京津冀三地大数据基础设施层和技术支撑层具有接近的较高融合水平。其中,分地区来看,北京市在技术支撑层具有突出的较高关联系数。将天津市与河北省对比来看,天津市的基础设施层关联系数较高,河北省的技术支撑层关联系数较高。京津冀三地业务应用层的综合关联系数较低,这与前文分析的指标关联系数都较高不同,原因在于业务应用层指标熵权较低,而基础设施层和技术支撑层指标具有更高权重,表明业务应用层指标含有更少信息,基础设施层和技术支撑层包含更多与制造业融合的重要信息,指标关联系数同等提升幅度下,基础设施层和技术支撑层指标对大数据与制造业总体融合度提升具有更大作用。因而,整体来看,业务应用层与制造业的系统融合度和其他子系统相比处于劣势地位。
四、结论和建议
(一)研究结论
根据灰色系统理论,关联系数越大表明两个系统发展的关联程度越紧密,大数据与制造业融合即表现为融为一体、紧密相关,因此,关联系数越大即表示两个系统融合度越高[24]。由以上计算和分析结果发现,就当前京津冀地区的大数据与制造业的系统融合度而言,北京市总关联系数为0.7683,处于较高融合度水平;天津市总关联系数为0.5473,河北省总关联系数为0.5477,天津市和河北省都处于融合的初步阶段。
分省市比较来看,在系统融合层面,北京市在基础设施层和技术支撑层均具有较高融合度比较优势,这是因为北京市较早进行装备制造业信息化、智能化改造,丰富的科技创新资源产生集聚效应,促进了大数据资源和技术与“高精尖”产业的融合,提高了制造业绩效。在天津市和河北省,大数据三大子系统与制造业融合度均接近。同河北省相比较,天津市在基础设施层具有微弱融合度优势,这是因为天津市充分利用大数据基础设施建设这一契机,实现了大数据与制造业的协同发展。在京津冀协同发展规划下,天津市以京津冀大数据综合试验区建设为背景,重点建设面向大数据处理的超级计算与云计算融合的一体化基础设施,以国家超级计算天津中心为基础打造京津冀大数据协同处理中心,主动承接北京市外溢的部分技术研发功能,充分利用基础设施优势积极发展天津市支柱产业——先进制造业。河北省在技术支撑层较天津市而言具有微弱融合度优势,这表明京津冀协同发展规划实施以来,河北省充分利用大数据技术促进汽车制造业和钢铁产业的绿色化、高端化发展,提高了其主营业务收入,同步改善了生态环境。在指标融合层面,同本省市其他大数据指标与制造业融合的关联系数相比较,北京市移动电话年末用户、天津市软件产品收入、河北省移动互联网接入流量这几个大数据指标与制造业融合的关联系数较低。同时,在各省市之间进行相对比较时,这一结论仍然成立。这意味着北京市较大规模的个人消费者数据资源的潜在价值尚未被制造业充分开发利用,天津市软件产品应用于制造业业务的价值有待进一步提升,河北省个人消费端的数据资源量与制造业绩效提升不同步。
将总关联系数分解为大数据子系统与制造业关联系数之和,从子系统融合优势来看,三地大数据业务应用层子系统与制造业关联系数均不及基础设施层和技术支撑层的关联系数,这表明由于总系统融合涉及大数据与制造业的多维度融合,基础设施层和技术支撑层对整体融合度提升的效用更大,京津冀制定大数据基础设施建设和大数据技术发展战略能更有效地提升大数据总系统与制造业系统的融合度。分大数据指标来看,京津冀在大数据业务应用层的电子商务销售和电子商务采购与制造业均达到0.56以上的初级融合水平,并且均高于三地大部分其他大数据指标,这是因为随着互联网的发展,我国大数据在生活消费端得以迅速应用,但大数据与制造业生产端尚处于初步融合阶段。
(二)促进京津冀大数据与制造业融合的路径建议
第一,以大数据基础设施和大数据技术为支撑,保持大数据业务应用的优势地位,促进大数据与制造业融合发展。大数据基础设施层中电子产品的开发为大数据与制造业融合提供了数据产生、储存的重要物质载体,网络设施的进步为大数据与制造业融合提供了数据传输保障。大数据技术支撑层的信息技术服务和大数据专利申请量以及软件产品的开发为大数据与制造业融合提供了技术支持。根据实证研究结果,天津市和河北省大数据基础设施层的指标关联系数处于0.5-0.6的初步融合阶段,北京市的大数据基础设施层指标与其他指标相比也不具有明显比较优势,技术支撑层处于中等融合度水平。大数据系统要素的基础设施层与技术支撑层对大数据与制造业融合具有更高的权重地位,因此,结合京津冀一体化协同发展进程中的基础设施建设,加强京津冀大数据基础设施层和技术支撑层建设对于提高大数据与制造业融合具有更强的推动作用。另一方面,天津市和河北省业务应用层指标关联系数处于0.56-0.64区间具有较明显优势的融合地位,应当继续发挥大数据应用层对制造业发展的较强稳定性带动作用,畅通大数据应用部门与制造业生产部门的上下游协作通道,同时,结合北京市疏解非首都功能从而引进北京市优质电子商务资源。
第二,发挥京津冀三地的优势互补作用。京津冀三地在地理空间上具有邻近的区位优势,同时一直以来都处于京津冀协同发展的规划范围内,从而具有较便利的要素资源流动和协调利用机制。从比较优势来看,北京市应当充分发挥电子商务销售与制造业的高系统融合度优势,天津市和河北省应当加强与北京市的优质电子商务资源对接与经验交流学习;天津市应当充分利用移动互联网接入流量与制造业融合度较高的比较优势,在移动电话用户增量有限的情况下充分发挥移动互联网流量增量与制造业业务发展的协同优势;河北省应充分发挥大数据专利技术发展与制造业业务增长的协同效应,通过接收北京市大量转移的制造企业,提高大数据专利技术应用于制造业的转化效益。