国有企业大数据演进的路径、问题与对策
2018-01-15曾剑秋
张 静, 曾剑秋
(1.北京邮电大学 自动化学院,北京 100876; 2.北京邮电大学 经济管理学院,北京 100876)
技术与经济社会的交汇融合引发了数据迅猛增长,数据已成为国家基础性战略资源,大数据正日益对全球生产、流通、分配、消费活动以及经济运行机制、社会生活方式和国家治理能力产生重要影响[1]。2015年8月,国务院通过《关于促进大数据发展的行动纲要》,将大数据发展提升到国家战略的高度,提出了我国大数据发展的顶层设计。行动纲要的提出,意味着我国信息化已进入新的发展阶段,过去纵向条块和局部的信息化系统已经无法充分发挥信息化对经济社会发展的支撑和引领作用,迫切需要打破部门割据和行业壁垒,促进互联互通、数据开放、信息共享和业务协同,切实以数据流引领技术流、物质流、资金流、人才流,强化统筹衔接和条块结合,实现跨部门、跨区域、跨层级、跨系统的数据交换与共享,构建全流程、全覆盖、全模式、全响应的信息化管理与服务体系。
信息技术的发展不仅影响着政治、经济、文化、社会、军事等领域,同时也对企业的生产经营方式产生了深远影响,企业资产管理的重点开始从实体资产管理逐步向实体资产与数据资产并重转变。2016年,中国国有及国有控股企业总营收占GDP比重达61.7%,国有企业资产总额达131.7万亿*数据来自于国家统计局2017年2月28日发布的《中华人民共和国2016年国民经济和社会发展统计公报》以及财政部2017年1月26日发布的《2016年1-12月全国国有及国有控股企业经济运行情况》;国有及国有控股企业包括中央管理企业、中央部门和单位所属企业以及36个省(自治区、直辖市、计划单列市)的地方国有及国有控股企业,不含国有金融类企业。。国有企业作为我国国民经济发展的中坚力量,覆盖了“关系国家安全和国民经济命脉的重要行业和关键领域”[2],承担着保障国计民生的基本使命。因此,国有企业在大数据管理上具有两面性,一方面要参与市场竞争、追求绩效最大化,另一方面要向国家上缴利润,履行和承担基本的社会责任[3]。国有企业在生产经营过程中产生和积累的大量数据不仅是促进企业发展的核心财富,也是推动社会发展的重要生产要素。摸清国有企业数据资源和大数据管理的现状,探索数据资产管理的有效管理和保护方式,对实现国有资产保值增值,促进国有企业的国际竞争力具有重要意义。
本文以国有企业数据资产作为研究对象,着重研究国有企业存量数据资源的利用、释放和盘活,数据开放和交易过程中的产权变动、定价、交易方式的相关问题,以及可开放、可交易的数据量与预期等问题,在此基础上,提出国有企业大数据管理的建议与对策,为国家数据产业的发展提供一定参考。
一、国有企业大数据管理的演进路径
伴随信息化发展过程,数据管理的发展可以划分为四个阶段:第一阶段,数据分散管理阶段,数据来源于分散系统中,互通共享、数据精度都比较落后,无法有效实现数据整合与价值利用;第二阶段,数据集中阶段,数据存储于若干集中信息系统中,数据标准基本统一,数据应用水平有明显提升;第三阶段,数据集成整合阶段,通过系统集成实现数据有效整合,数据价值发掘能力大幅提高;第四阶段,数据共享与分析应用阶段,数据互通共享,分析应用有效支持业务决策。每一阶段的发展,伴随着企业数据开放度的提升,数据共享程度和精度进一步提升,应用价值也不断升级。
目前,国有企业特别是央企信息化建设已经实现了从“十一五”时期的“大规模建设”向“十二五”时期“建设与应用并重、着力深化应用”阶段的转变,超过半数中央企业信息化水平达到A级*《中央企业信息化水平评价暂行办法》(国资发[2008]113号)将中央企业年度信息化水平划分为A、B、C、D、E五个级别,作为国资委指导和推进中央企业信息化、建立绩效考核和激励约束机制的重要依据。A级表示:企业信息化已经进入多行业、多地区、多业务全面集成与协同,信息化可以有效改造和提升企业价值链,提高创新竞争能力,企业信息化已经全面融入企业的管理、生产、运营活动。企业信息化基本达到国际先进水平。,处于国内领先水平,有些方面达到国际先进水平;其他企业信息化水平处于国内同行业先进水平。
从可获取的国有企业的数据资料看,目前各企业积累的数据量较大,且增长较为迅速。主要国有企业信息系统内积累的数据量为TB级及以上,50%以上的国有企业年均数据增长量达到TB级及以上。从数据的形成过程看,国有企业的数据主要来源于企业各项业务活动运作所产生的生产经营流程数据、财务数据、技术软件、合同协议、客户资料等。目前多数企业已处在统一建设全局性信息系统阶段,数据存储于若干集中信息系统中,数据管理逐步集中,数据标准基本统一,数据应用水平有明显提升;部分企业在持续提升和集成应用阶段,通过系统集成实现了数据有效整合,数据价值发掘能力大幅提高;个别企业发展到共享服务阶段,企业内部数据互通共享,分析应用有效支持业务决策。从初级阶段向高级阶段发展,企业数据数量、质量、开放度、共享程度、应用价值都大幅增加和提升。
二、国有企业数据管理存在的问题
(一)企业信息化向系统集成升级,但大数据平台支撑能力有待加强
各企业信息系统内积累了大量数据,增长较为迅速。80%的国有企业建有公司级的数据中心,使得数据资产管理成为可能,如表1所示。企业的信息系统正在从非集成、共享程度低、数据缺失的形态向数据集成过度。由于在信息化建设标准[4]、数据定义[5]、业务标准[6]、跨流程衔接[7-8]、专业精细化管理[9]和数据质量管理[10]等方面存在不足,制约了业数据融合与分析挖掘工作的开展。大多数企业的大数据平台建设还处于试点研究阶段,业务数据单一,支撑的分析方法较为传统,外部数据接入机制尚未建立,对大规模、跨专业、多类型数据的深度挖掘及可视化展示的手段和工具相对缺乏,在一定程度上也制约了大数据的发展。
表1 国有企业大数据管理状况统计
项目名称建设情况数据量存量数据增量数据PB级15%TB级90%PB级3%TB级40%数据管理数据中心80%数据标准62%数据库监控、备份和恢复机制92%数据治理专项40%数据质量控制50%数据使用外部数据获取需求管理71%内部数据使用需求管理64%内部数据共享70%内外部数据交换32%数据价值评估10%数据安全数据安全标准与安全控制措施89%数据访问视图与访问权限监控75%数据安全审计63%
(二)企业信息化发展不均衡成为大数据应用的主要障碍
1.信息系统集中度、集成度不够
在企业层面,目前国内传统企业信息化发展很不均衡,大多数企业仍处于由分散建设向集中建设的过渡阶段,处于集成应用阶段的企业还仅是少数,导致大数据应用的水平良莠不齐,大数据应用能力需要提升。部分信息化水平高的企业正在加快建设覆盖全集团各部门和各成员企业的大集中系统,信息系统从各部门、各成员企业局部单独应用,逐步向跨部门、跨企业集成应用的阶段发展,强化各项管理业务之间、关联协作企业之间的沟通与协同。这部分企业在大数据应用方面就具备了很好的基础。而分散建设信息系统的企业,由于各系统数据标准不统一、统计口径不一致,很多数据甚至相互矛盾,数据质量很难保证,给大数据应用造成很大困难。
2.集中统一的数据中心和云计算平台建设刚刚起步
仅有少部分大型国有企业建成应用了具有云计算能力的集团级数据中心。集团级数据中心和云计算平台集中运行统一的信息系统,数据存储在数据中心,提供了数据聚集的手段和场所,可以方便地将数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析。而目前大部分企业没有建立统一的数据中心,各类信息系统都分布在数量众多的小机房中,数据集中整合的难度和成本都显著增加,同时少数企业虽然已经搭建云计算平台,但应用范围很小,仅仅局限于IaaS层面,对PaaS和SaaS的应用较少,资源池规模不够,信息系统的云化程度较低,无形中为下一步大数据资源聚合和分析应用带来不小的阻力和障碍。
3.物联网系统建设与国外差距较大
在企业大数据特别是工业大数据应用中,对于生产数据的实时分析、优化是普遍的应用需求[11]。大数据价值发掘的基础是对海量异构数据的全面、及时、准确获取[12]。物联网系统对生产作业现场数据实时采集、远程传输和标准化存储,可以极大提升数据质量,从而在源头上保证数据价值发掘的效率、效果[13]。目前国外先进企业的物联网系统普遍比较完善,基本实现了全面感知,并与信息系统进行了集成,国内企业在这一方面存在10年左右的差距,成为制约大数据发展的主要因素。
4.数据深入分析能力不足
目前大部分企业管理决策还是传统的人工统计测算、经验分析,真正基于系统、数据和模型的精准分析仍然较少,还未形成“用数据说话、用数据决策、用数据管理、用数据创新”的工作机制。企业建立完善数据分析模型的能力,利用大数据智能分析技术的能力还远远不足。熟练掌握大数据关键技术应用的信息技术人才已属于稀缺人才,而能为企业资源配置优化、生产平稳高效运行、市场营销策略制定及挖潜增效、风险防控等提供多维度分析支持的业务人才(又称数据科学家)更是缺乏,远远不能满足大数据应用的需要。
(三)企业数据共享不够,商业模式有待完善
目前国有企业对大数据应用的尝试,主要落实在企业的生产和经营服务,提升生产效率,通过精准分析与预测、精确营销和精细服务为企业提升服务和管理决策效率与水平提供支撑。企业级大数据的商业模式创新主要出现在数据的存储、计算、分析和可视化等已相对成熟的环节[14-16],而更深层次的关系挖掘[17]、沉淀价值利用、数据社交[18]和跨界连接等商业模式尚未成熟,业务研究和数据营销之间的匹配度较差,缺乏类似国际上Gartner、HIS等数据咨询公司,企业级大数据价值有待发掘,商业模式有待确认。
(四)行业数据价值高、作用大,但数据沟通、获取渠道仍不顺畅
我国大部分行业产业链各环节之间的数据相对封闭,难以有效流动,整体数据的交互活动小而散,缺乏可以落地的协调与合作模式,且数据格式并不统一,数据交换的效率低下;信息数据的采集与加工粗糙,数据质量较低。生产经营数据作为企业机密,在政策法律不支持以及缺少互惠交换机制的情况下,无法进行上下游以及同行之间的反馈。这些问题导致企业在关键性数据的获取上存在着黑市交易、关系授受等问题,为数据的管理和有序流动带来极大的安全隐患。
(五)政府数据开放需求迫切,但随之而来的信息安全威胁问题也日益凸显
企业对政府在气象、采购、供应商质量、教育、交通、医疗、电子政务等领域数据资源的开放均表现出迫切需求,政府公开数据将有效推动企业大数据应用。随着数据开放程度的不断提高,安全问题将变得越来越严峻,个人、企业乃至国家的隐私数据泄露的现象屡见不鲜。面对大数据市场的开发,如果安全管理不当或技术层面的防护措施不到位造成数据资源丢失和损坏,将会造成严重后果。
(六)开放与隐私的平衡关系,成为数据开放的难点
在产业链层面,我国在大数据产业链高端环节缺少成熟的产品和服务,面向海量数据的存储和计算服务较多,而前端环节数据采集和预处理,后端环节数据挖掘分析和可视化,及大数据整体解决方案等产品和服务匮乏。大数据的价值在于关联,如何在推动数据全面开放、应用和共享的同时有效地保护公民、企业隐私,逐步加强隐私立法,把握数据开放的“度”,是各国政府在推动信息公开时都会面对的问题。随着数据挖掘技术的发展和应用领域的扩展,个人可识别信息(PII,Personally identifiable information)的界定越来越困难[19],以往并非PII的数据也可能通过不同渠道关联数据的拼接成为PII,使得数据产权和隐私保护更为困难。用户信息保护和权属的法律问题在数据时代又变成一个新的问题。
三、国有企业大数据管理建议
(一)持续推进信息化向更高阶段跨越,为数据产业发展奠定基础
信息化是应用计算机硬件、软件和通信技术及其搭建的网络,实现数据的采集、传输、存储和分析应用的过程。数据分析应用水平取决于信息化发展水平。国际知名咨询公司、国内外相关专家研究以及信息化领先实践都表明:大型企业数据管理一般要经历分散建设、集中建设、集成建设和共享服务四个阶段。实践证明,集中建设的信息化投资收益率(ROI)相当于分散建设的2倍,在大集中信息系统基础上的集成建设,使信息系统数量进一步减少、数据进一步汇集,信息化应用成效会进一步提升;进入共享服务和数据分析应用阶段,数据的价值将得到充分利用,效益更加显著。
传统企业应下功夫制定系统支持主营业务的统一规划,按照对应支持经营管理、生产管理、办公管理和辅助决策的架构进行规划,形成企业网络化经营的总体解决方案,实现对业务全覆盖,将生产经营管理全面搬到网上运行。坚持按照规划推进信息化从分散到集中、从集中到集成、从集成到共享,不断迈向更高发展阶段,提升是数据价值创造能力,从而为数据产业发展奠定坚实基础。
(二)不断加强信息化集成建设和应用,提升数据聚集和分析利用能力
实践表明,数据应用价值的提升主要依赖于以下三个基础能力:一是全面获取数据的能力,包括从专业系统、生产系统、管理系统中直接获取数据、从各类传感器采集数据、从互联网络、智能终端等实时收集数据等;二是高效处理数据的能力,包括先进的数据建模分析工具、可扩展的并行计算能力和灵活的数据交互展示平台,以及建立在业务模型上的优化算法等;三是综合研究数据的能力,相关行业专家、业务人员与技术人员共同参与,尤其是数据科学家、数据分析师等专业人才,通过不断丰富业务分析与优化工具、行业模型、方法论,持续拓展数据应用空间,发掘数据应用价值。
为提升数据利用能力,传统企业应持续加强信息系统应用集成,提高数据的开放性,扩展数据价值共享的范围和深度;持续加强信息化与自动化集成,不断拓展物联网、移动应用范围和深度,丰富和拓宽数据获取的渠道和范围;持续加强软硬件资源集成,深化云计算平台应用,提供可高效调配、灵活扩展的计算能力和存储服务,加强数据中心整合,推动数据物理集中和高效聚集。
(三)加大信息化投入力度,为提升数据价值提供有效保障
与发达国家相比,我国信息化投资强度偏低,由其产生的数据价值尚有很大提升空间。国际通行确定信息化投资强度的方法是:依据上一年企业销售总额的百分比来确定下一年的信息化投资强度[20],一般是1%—3%。目前,我国国有企业信息化投入强度达不到销售额的0.3%,低于发达国家的三分之一,致使信息化进程和大数据应用相对落后,数据价值提升的能力大大弱化。
建议传统企业参照国际同行业标准,采用按营业收入比例确定信息化投入额度机制。优化审批流程,确保按规划持续投入信息化建设资金和运维费用。同时,建议国家出台相关政策,允许企业的信息化投入享受类似科技创新投入的企业所得税抵扣政策,鼓励企业加大信息化投资力度,从而拓展大数据应用范围和深度。
(四)基于开源技术,利用大数据理念,搭建企业大数据应用平台
目前国内企业对于大数据关键技术的研发和应用能力还较弱。为充分发挥大数据价值,企业应基于开源成熟的大数据技术,结合大数据分布、共享等理念,建立综合、高效的大数据应用平台,实现跨地域、跨部门、跨学科的内外部专家团队密切合作,形成科学的数据价值发掘研究模式,为业务科学决策和企业管理创新提供更好支撑。
(五)加快推动政府数据从选择性有限开放走向大规模依法开放
各国政府都非常重视大数据产业生态建立和环境优化,不断地通过建设基础设施,制定法律法规、政策体系和数据标准,加强数据安全和隐私保护等方法完善大数据生态环境,进而提升国家对数据资源的掌控能力和核心竞争力。2012年,美国政府宣布了“大数据研究与开发计划”,探讨如何利用大量数据来解决政府面临的重大问题[21]。英国政府则通过本地服务数据集成为当地民众提供服务,例如,道路救援、残疾人送餐服务等[22]。
因此,需要探索制定数据资源开放指导意见和配套标准规范,明确界定数据开放的边界、范围、原则和安全性等,在对政府部门数据进行梳理和开放风险评估的基础上,制定实施政府数据开放计划,确立数据开放的机制、重点开放领域和实施步骤,推动公共数据资源适度、合理的跨部门分享和向社会开放。建设国家开放数据门户网站,逐步向公众和社会开放政府数据资源。引导各级政府和公共服务机构开放数据资源,加强政府与第三方机构协作,进一步推动数据资源的开发和共享。积极发挥市场的主导作用,通过数据资源的开放利用,促进大数据技术和产业创新发展。加快推进大数据顶层设计,建立协调决策机制,强化总体布局和统筹协调,建立产、学、研、用科研创新体系,形成完整的国产信息技术产业链和生态链。
(六)建立行业自身的数据体系,实现全产业链数据收集、统计、集成、发布和共享
从各行业特点看,我国部分国有企业在国际上相关领域中虽然生产增量靠前,但是话语权较低,关键在于缺乏一套完整的体系和数据,难以通过科学合理的公开数据实现对市场的影响。很多国家很早就开始关注行业级数据共享问题,通过标准研制与实施,打通上下游信息流,凭借数据采集加工能力,向前进入生产环节、向后延伸至消费环节,建立起贯穿行业全领域的数据体系,并以其为基础形成较为完整的行业供应链。数据体系的建立可以为行业发展决策、行业预警以及中小企业发展提供支撑,同时也可以提升国际影响力。因此,从上游到下游对数据进行收集、统计、集成、发布和共享,形成全产业链数据标准和体系,对于政策的决策、行业的发展、企业的生产经营都具有重要作用。
四、结语
中国的国有企业覆盖涉及国计民生的重要行业,在其经营发展过程中积累并正在产生大量服务民生的公共数据,提升国有企业大数据管理水平将为推动数据产业发展,科学利用数据提高政府的公共服务能力提供了有力支撑。本文认为,国有企业大数据的管理遵循“分散——集中——集成——共享”的阶段发展过程,目前主要国有企业普遍处于数据集中到数据集成的阶段,企业数据分析和利用的基础正在建成,大数据的价值凸显尚需时日。因此,政府在发展大数据上需要加大企业信息化建设的投入比例,提升企业数据聚集和分析利用能力,建设企业大数据平台和行业数据体系,逐步推进数据的大规模开放和共享。
[1] 中华人民共和国国务院. 促进大数据发展行动纲要[EB/OL].(2015-09-06)[2015-08-31]. http://www.miit.gov.cn/n1146290/n1146392/c3882451/content.html.
[2] 李中义. 国有经济的功能定位与战略调整——兼评“国进民退”[J]. 财经问题研究, 2014(2):17-22.
[3] 王文成,王诗舟.中国国有企业社会责任与企业绩效相关性研究[J]. 中国软科学,2014(8):131-137.
[4] 李芳芳. 信息化标准体系建设发展趋势分析及经验借鉴[J]. 国土资源信息化,2012(6):3-6.
[5] 李天柱,王圣慧,马佳. 基于概念置换的大数据定义研究[J].2015(12):173-177.
[6] 蔡正杰,刘云,景慎旗等. 医院数据集成平台与业务系统对接的标准流程探讨[J].2016(10):80-83.
[7] 姜春宇,孟苗苗. 大数据基准测试流程与测试工具[J]. 信息通信技术, 2014 (6):43-46.
[8] 刘洪伟,刘智慧,朱慧等. 大数据环境下跨组织间协同优化决策的隐私保护算法[J]. 广东工业大学学报,2014(3):21-26.
[9] 吴文忠. 浅谈大数据与银行精细化管理[J]. 企业改革与管理,2016(23):35.
[10] 王宏志. 大数据质量管理:问题与研究进展[J]. 科技导报,2014(34):78-84.
[11] 刘强,秦泗钊. 过程工业大数据建模研究展望[J]. 自动化学报, 2016 (2):161-171.
[12] O’Donovan P., Leahy K., Bruton K., et al. An Industrial Big Data Pipeline for Data-driven Analytics Maintenance Applications in Large-scale Smart Manufacturing Facilities[J]. Journal of Big Data, 2015(1):1-26.
[13] Mourtzis D., Vlachou E., Milas N. Industrial Big Data as a Result of IoT Adoption in Manufacturin[J]. Procedia CIRP, 2016(55): 290-295.
[14] 荆浩. 大数据时代商业模式创新研究[J]. 科技进步与对策, 2014(7):15-19.
[15] Mcafee A., Brynjolfsson B. Big data: the management revolution[J]. Harvard Business Review, 2012(10): 60.
[16] 刘丹, 曹建彤, 王璐. 基于大数据的商业模式创新研究——以国家电网为例[J].当代经济管理, 2014(6):20-26.
[17] Priya R, Sheshasaayee A. Mining Association Rules from Large Data Bases - A Review[J]. International Journal of Advances in Engineering & Technology, 2014(4):1306.
[18] 车凯龙, 铁茜. 国内外社交网络(SNS)大数据应用比较研究——以Facebook和腾讯为例[J]. 图书馆学研究, 2014, (18):18-23.
[19] Alfedaghi S, Alazmi AAR. Experimentation with Personal Identifiable Information [J]. Intelligent Information Management, 2012(4):123-133.
[20] Santos BLD. Information Technology Investments: Characteristics, Choices, Market Risk and Value[J]. Information Systems Frontiers, 2003(3):289-301.
[21] Kalil T. Big Data is a Big Deal[EB/OL]. (2012-03-29) [2013-01-20]. http://www.whitehouse. gov/blog/2012/03/29/big-data-big-deal.Kalil.
[22] Stergiou C., Psannis K.E. Recent Advances Delivered by Mobile Cloud Computing and Internet of Τhings for Big Data Applications: A Survey[J]. International Journal of Network Management, 2017(3):1-12.