政策肃清产业顽疾大数据步入快车道
2017-06-19韦顺
本刊记者 韦顺
政策肃清产业顽疾大数据步入快车道
本刊记者 韦顺
大数据如今已不是什么新鲜事情,其本质是将单个可能没有价值的数据收集起来,通过对多个数据的获取、整合和分析,挖掘出新的信息,这个也是大数据的价值所在。我们现在每天电脑处理的数据已经超过10年前整个互联网的处理量,互联网底层沉淀了大量的数据源,这些数据加以整合,无论是对政府监管、对产业趋势判断、对企业风险以及战略制定都有极高的利用价值。
随着近些年中游大数据处理工具逐渐成型并走向成熟,大数据过去三年由概念逐步走向产业应用阶段,未来两年将进入稳步爬升恢复阶段。今年产业政策不断出台,制约大数据发展的顽疾已被肃清,可以预见2017年大数据产业规模将继续保持高增长。
大数据规模增长强劲
全球第一家IT研究咨询公司GARTNER被认为是IT行业最权威的数据发布者。2016年该公司发布了一张中国信息通信技术成熟度曲线图,截止2016年7月中国大数据产业的期望值已经下降至泡沫破灭期的底部区域,这意味着大数据已经脱离了概念炒作周期,处于技术落地并加速向平台发展的趋势当中。2014年GARTNER也曾发布同样的曲线图,不同的是,彼时大数据产业刚刚过去期望膨胀期的最高点,而且预期的产业走向成熟期的时间是5-10年,但2016年的图显示产业距离生产成熟期的时间已经缩短到不足两年,换言之,2018年前后大数据产业将走进成熟期。
大数据的产业趋势同样得到国内官方数据的支撑,根据工信部电信部门的大数据报告,2014年国内大数据规模仅为84亿元,但到了2015年该数值提升至115.9亿元,同比增长38%,2016年国内大数据产业规模进一步扩容,达到168亿元,同比增速提升至45%,整个产业过去三年规模扩张已经翻倍。该部门还预计到2020年大数据年均增速将保持30%以上。
如果从微观的角度看,大数据规模的持续扩大是存在内生逻辑的。大数据产业链可简单分为上游的数据源,中游的底层软件和数据分析工具,下游的大数据应用,其中中游工具是产业链价值变现的核心。处理软件市场原来是由Hadoop统治,不过现在是Spark与Hadoop齐头并进,与Hadoop相比,Spark可将输出结果保存在内存中,解决了内存分析数据成本高昂的问题,同时Spark运行速度更快,编程更加容易,从而可更好适应冗繁的数据挖掘分析项目。工欲善其事、必先利其器,过去10年处理软件成型并走向成熟是产业快速成长的关键点,包括亚马逊、Cloudera、BAT都在加速Spark人才的培训。工具的普及也使产业链的价值向上下游跃进,如三大电信运营商、华为纷纷将大数据纳入战略规划中;国内三大互联网巨头陆续开放自己的大数据平台;大数据在工业、公安系统、旅游、农业以及政府行政部门等领域运用。
表:部分大数据概念股一览
政策密集出台
大数据从2013年开始被炒作,随后三年逐步回落至低谷,主要原因在于国内的大数据面临多个问题,其中最为关键的是数据源开放问题,尤其是政府部门的数据源。
大数据的开发完全依赖于数据源,数据源是最基础的资源,有了这个基础大数据才能不断的创作新的价值。正如美国人所言,这个和油田一样,可以源源不断挖掘出新的财富,而且越挖越有价值。目前大数据80%的业务量来源于政府,但多年来各地、各部门各自为政,数据源获取难度较大,使得大数据业务难以开展。不过进入2017年,随着多项政策落地,这一问题已经解决。
首先,今年1月份工信部就发布了《大数据产业规划(2016-2020年)》,规划提出了7项重点任务,目标到2020年,大数据相关产品和服务业务收入突破1万亿元,年复合增速将达到30%。《规划》同时还提出,未来将培育10家核心龙头、500家应用企业、建设10-15个大数据综合实验区等。该规划出台提高了行业进入门槛,对基础设施建设布局有了新的规划,对有技术沉淀以及行业布局的核心龙头是利好。
其次,国务院近日印发了《政务信息系统整合共享实施方案》,方案提出到今年底,基本完成国务院内部政务信息系统整合清理工作,到2018年上半年,实现国务院各部门以及国务院与地方政府信息系统互联互通。这是继去年《政务信息资源共享管理暂行办法》之后又一重磅文件。
再者,近期工信部表示,我国将建设过过一体化的国家大数据中心,推动公共数据开放和基础数据资源跨部门、跨区域共享、提供数据应用效率和使用价值,同时加强安全监管,严厉打击非法泄露和出卖个人数据行为,维护网络数据安全。
上述三项政策正好解决了大数据在数据源开放、信息共享、应用领域等方面的问题,因此市场判断行业可能会迎来新的发展契机。
个股方面,可关注东方国信、初灵信息两家公司,其中重点留意东方国信。公司是大数据行业龙头,原来是给联通、电信以及铁通做BI业务的,近几年逐步向金融、工业、农业、旅游、医疗等其他行业大数据布局,目前是国内大数据产业链布局最完善的企业。剔除掉过去过去几年并购承诺的业绩增量,公司依靠在电信的大数据业务,也能实现稳健增长。目前公司估值仅有34倍,若今年能保持30%以上的增速,预期PE可降到25倍左右,估值明显低估。
当然公司也不是没有弊端,数据源是一个大问题。公司的数据源目前主要依靠外部公司提供,公司只是提供数据加工所需的技术和模型。硅谷大数据独角兽Palantir因为拥有强大的数据库,估值已经达到200亿美金,东信的业务如果能向上游数据源延伸,发展成为平台型企业,估值上千亿元也不是没有可能的事。
需要注意的是,当前大数据也存在瓶颈。大数据的根基在IT系统,但目前企业所用的IT系统是建立在IOE+Cisco模型基础上的,这样的模型不适合大数据发展,因为企业会面临更高的成本与技术难题。现在产业提出去IOE化理论,但又面临国家安全问题,突破这个瓶颈可能需要一次IT产业技术变革,难度很大。