中国数据产业发展面临的问题和挑战
2019-06-09茶洪旺付伟郑婷婷
茶洪旺 付伟 郑婷婷
中国数据产业还处于起步阶段,在快速发展的同时,仍然面临五个方面的问题和挑战。
部分重要数据规则尚未建立
数据权属是运用市场手段配置数据资源和提高数据使用效率的基础,也是当前制约数据收集、交易和利用等关键环节发展的核心问题。数据权属不清,一方面导致数据拥有方不愿或不敢把数据拿出来交易和共享,另一方面基于原始的用户数据,在去除个人身份属性之后的数据产权的归属问题不明确,直接制约了数据交易和流动的发展步伐,也严重掣肘了数据产业的发展。《促进大数据发展行动纲要》明确提出要加快法规制度建设,研究推动数据资源权益相关立法工作。但是,目前数据立法工作进展非常缓慢,不利于产业持续健康发展。
由于既缺乏政府监管层面对数据利用规则的原则性规定,也缺少行业组织针对特殊领域的数据交易、处理、共享、利用方面的规则和指引,企业普遍不愿与外界共享数据、交易数据,数据相关的业务模式和商业模式创新方面仍然会面临一系列问题。与之对应的是,数据领域非常容易成为灰色地带,地下数据交易非常猖獗,部分企业和个人单纯追求经济利益铤而走险,大量收集和滥用个人数据,甚至是敏感数据,或供自己利用牟利,或进行出售贩卖牟利,完全不顾及个人隐私保护和数据所有者的权益保护等问题。
我国数据保护相关的法律法规仍不健全,政府信息资源开放共享制度仍然缺位,适应数据产业发展的个人信息保护、数据资产保护等制度体系尚未建立。部分厂商尚未意识到数据的重要性,缺乏保护数据资源的意识,而技术能力的不足也使得相关厂商无法真正有效地广泛存储、利用和保护属于自己的数据。同时,对侵犯数据隐私和安全的相关行为处罚不足,包括携程、支付宝、天涯网、12306等众多互联网企业发生了多起重大的数据泄露事件,但是对涉事企业的处罚力度过轻。
核心技术研发投入不足
目前,我国数据产业在结构上仍以数据应用层为主,企业仍以中小企业为主,鲜有营业收入超过10亿元的平台型生态企业。参与工信部2018年大数据优秀产品和应用解决方案征集活动的企业中,大数据业务收入低于1000万元的达205家,占比超40%,仅8家企业大数据业务收入超过10亿元,而146家大数据业务收入占比超过90%的企业中,研发投入共计14.76亿元,占全部企业研发投入的比重仅为1.99%。
此外,中国数据产业生态建设方面也面临挑战。首先,缺乏掌握核心技术的企业。本土数据企业技术积累薄弱,在底层架构和核心算法方面不具备优势。其次,数据产业链构建不完整。数据产业的发展需要从底层芯片到基础软件再到应用分析软件等信息产业全产业链的支撑,目前国内无论是新型计算平台、分布式计算架构,还是大数据处理、分析和呈现方面与国外均存在较大差距,难以满足各行各业数据应用需求。最后,缺乏主导生态建设的企业。我国关键数据技术的创新和开源生态建设方面还处于跟随状态,相关企业主要基于已有的开源平台进行优化和构建适合自身业务需求的数据平台,缺乏构建产业生态的技术实力和资金支持。
数据产业创新要素投入不足
数据产业是典型的知识密集型、资本密集型的新兴产业,人才、资本等创新要素投入是驱动产业发展的核心动力。数据产业面临创新要素投入不足,要素投入带来的市场绩效水平不高的问题。
数据产业发展需要大量的复合型人才,但目前国内数据人才队伍不足,远不能满足发展需要,尤其是缺乏既熟悉行业业务需求,又掌握大数据技术与管理的综合型人才。
虽然全社会融资和投资规模都非常可观,总的资本要素相对充足,但是流入数据产业领域的资本总量仍然较少,主要以风险投资机构、大中型企业、公开市场发行股份等为主。此外,中国数据产业投融资主要集中在数据应用层,投资回报周期较长的数据资源层和投资风险较大的数据技术层获得较大数额的投资仍然非常困难。一方面,由于我国的数据技术原始创新能力不足,数据企业之间的竞争处于相互垄断数据资源,利用价格战争夺数据应用市场阶段,但是受制于企业成本不断增加,提供的数据应用服务效果差强人意,使得大量的创新要素投入并没有产生应有的市场绩效。另一方面,数据资源规模和数据技术应用深度尚未达到明显提升企业市场绩效的拐点,因此还显示出绩效水平低于投入成本。应该看到各类创新资源要素的投入所产生的市场效益还未显现。
地方政府存在急于求成心态
一些地方政府急于求成的心态比较严重,“囫囵吞枣”出政策、上项目。通过对比发现,各省市区和地级市层面的政策规划和措施同质化非常严重,没有充分考虑地方产业实际,也没有考虑区域资源禀赋及周边环境等因素,部分文件只是换个名称而已。通过近几年的宣传报道和炒作,数据作为重要产业已是共识。在政绩和舆论的双重压力下,快速出台各类数据产业的促进政策文件是政府优先考虑的方式之一。以数据交易所为例,自2015年贵阳大数据交易所成立以来,短期内政府主导的数据交易所如雨后春笋般涌现出来,上海数据交易中心、华东江苏大数据交易平台、安徽淮南数海大数据交易平台、浙江大数据交易中心、哈尔滨数据交易中心、钱塘江大数据交易中心、北京大数据交易支撑平台、陕西省大数据交易所等纷纷成立。更有甚者,仅武汉就有三个数据交易所,即武汉长江数据交易所、东湖大数据交易中心、华中数据交易所。
实际上,流动是数据的天然属性,数据流动的自由度越高,越有助于数据产业和数字经济发展。地方政府采取分裂割據的方式新建数据交易所,必然会对数据自由流动造成阻碍,最终影响数据产业的发展。
数据产业风险防控能力不足
数据安全问题始终是国家关注的重点,安全问题不解决数据产业就难以获得快速发展。总体来看,中国数据产业面临四个方面的安全问题。
一是数据安全保障滞后于发展步伐,全方位覆盖国家数据安全、数据跨境流动管理、企业数据资产管理、数据权益归属、数据流通交易、个人信息保护等方面的数据安全保障体系尚不健全。
二是数据基础设施频受攻击,数据丢失及泄露风险加大。Hadoop、Spark等开源架构在设计之初并未充分考虑安全和隐私保护的需求,其安全机制往往偏简单和粗放。随着数据应用走向深入,触及的行业和领域越来越广,大数据基础设施在安全技术和标准等方面的不足已经逐渐凸显出来。
三是新型网络威胁层出不穷,黑客和窃密活动十分猖獗。国家互联网应急中心的数据显示,2017年我国监测获得的木马或僵尸程序控制服务器IP地址总数为97300个,其中境外木马或僵尸程序控制服务器IP地址数量为49957个,占比51.3%,仿冒我国境内网站的钓鱼页面49493个,涉及IP地址25048个,其中85.4%位于境外。
可以预见,未来生产生活中大量应用的信息系统和互联网基础设施仍可能出现更多严重的漏洞,数据平台和应用面临巨大的风险。
四是数据资源使用需求强烈,开放共享与安全保护矛盾凸显。开放和共享是发展数据产业的必然要求,然而脱离安全保护的开放和共享是不现实和危险的。当数据应用涉及到多方数据的开放和共享时,安全问题就复杂化了,特别是当其中还涉及到用户隐私数据和国计民生数据时。如何平衡开放共享的需求和安全保护的需求,这既是一个技术问题也是一个政策问题。