APP下载

基于区块链技术的运营商大数据治理框架构建研究

2021-03-10张晴晴程新洲张涛成晨韩玉辉

信息通信技术与政策 2021年2期
关键词:运营商框架区块

张晴晴 程新洲 张涛 成晨 韩玉辉

(中国联合网络通信有限公司研究院,北京100048)

0 引言

随着数据存储设备和能力的不断提升,各企业数据规模呈指数级增长,数据共享机制和挖掘分析技术持续提升,各大企业纷纷布局数据要素市场,加快数据资产价值转化步伐。尽管大数据企业都能意识到数据资产的价值,但是缺乏对数据存储和使用的质量管控,忽略数据质量对分析应用、流通交易等方面的影响。因数据质量问题导致项目终止和失败的案例激增,并且劣质数据经过数据共享和传播对企业和社会的负面影响程度被放大。当前大数据处于高速发展阶段,隐私保护制度尚未健全,用户隐私泄露问题时有发生。隐私保护环节的缺失会影响数据的完整性和可靠性。运营商作为通信网络提供商,其业务系统复杂多样,承载全网业务侧和网络侧的海量生产数据,包括大量用户隐私信息,面临巨大的用户隐私泄露风险。

运营商大数据具有规模大、来源广、准确度高等特点,作为基础通信数据赋能多行业数字化发展,用户隐私保护力度及数据质量水平要求更高,运营商大数据治理成为国内外研究重点讨论的话题。大数据治理主要是协调各部门制定大数据优化、隐私保护与货币化策略,解决海量数据存储、处理效率、数据可靠性和安全性等问题,目标是实现数据资产的价值转化,为企业创造价值[1]。因此,运营商应积极探索通信数据治理方法,确保通信网络数据的完整性和安全性,满足智能分析及数据共享需求,充分发挥大数据价值。区块链技术是一种去中心化的新技术,具有防篡改、共治性等特点,能够满足运营商大数据开放共享与隐私安全的双重要求,本文提出基于区块链技术的运营商数据治理分析框架,形成“数据存储—数据保护—数据共享”的治理闭环,加快运营商数据要素市场化进程。

1 数据治理研究现状

1.1 基于大数据技术的治理框架

目前,数据治理技术不断发展,学者们从不同角度出发提出不同的治理框架,但数据治理的最终目标均是有效改善数据质量,提高数据共享和价值创造能力。

郑大庆、黄丽华、张成洪等[2]梳理大数据治理概念的相关讨论,提出多维概念体系,认为大数据治理的目标是数据的风险管控和价值实现,治理的核心要素是决策机制、激励与约束机制、监督机制的设计。吴信东等[3]认为数据治理技术主要包括数据规范、数据清洗、数据交换和数据集成4种,并在此基础上将数据治理过程划分为数据接入、治理和服务3个核心模块。

由于不同领域数据有显著差异,不同领域的数据治理分析框架同样是重点探讨和关注的话题。张宁、袁勤俭[4]梳理后发现商业、金融、教育、医疗等领域均有数据治理框架及技术的应用探讨。寇金锋、张云勇、陶冶等[5]总结电信数据的特点及数据安全方面的需求,提出数据全生命周期的数据安全管理体系,并从技术、管理、人才等方面提出建议。Cheng X[6]、Zhang Y和 Cheng X[7]、倪晓熔和顾欣[8]及张嗣宏[9]均从不同角度出发提出运营商智慧中台的设计原则和基础架构,提供对内对外数据共享,赋能新型业务。

1.2 区块链技术的治理体系探索

区块链技术作为一种去中心化的分布式数据存储技术,在数据隐私保护和流通共享方面有巨大的应用前景。区块链与数据治理技术的融合创新成为业界和学术界共同关注的话题。

宋俊典、戴炳荣、蒋丽雯等[10]提出基于区块链的数据治理协同模型,高效安全地管理数据标准问题,提高标准客观性和维护效率。张桐[11]提出区块链独特的数据结构和防篡改特性在数据存储、维护和隐私保护方面能够提供新的技术支持。夏俊杰、孙晔等[12]提出基于区块链的数据治理底层平台,实现数据资产的权属确定和交易流通,应对数据安全和共享效率低等问题。孟小峰和刘立新[13]认为解决大数据规范性及提高价值实现过程中的透明性是数据治理应该重点讨论的问题,并且探讨区块链技术在解决数据治理关键问题的可行性。戚学祥[14],及吕小刚、王彩云和程立丽[15]均对区块链技术克服政府数据治理困难提出新的思路和对策。李健思、邢立莹、庞帅等[16]提出区块链、安全沙盒等技术集成的数据中台系统,并以公众健康数据的治理为例进行详细说明。

综合以上分析发现,当前仍处于区块链技术与行业结合发展的初期,尽管区块链技术独特优势能够应用于数据治理过程中,但具体的分析框架尚不清晰。尤其是电信行业,区块链技术如何为运营商数据治理体系提供技术基础,深度参与运营商数据价值创造过程的相关研究尚不充分。

2 区块链融入运营商数据治理的必要性

2.1 运营商大数据特点与传统数据治理方法的不足

运营商数据包括用户基本信息及消费账单、用户通话及上网行为数据等,与其他行业数据相比,运营商数据具有独特的优势及不足[17]。

(1)数据准确,隐私保护要求高。运营商搭建全国通信网络,电信用户遍布全国各地,覆盖面极广,用户量巨大。同时,用户基于手机号入网实现通信,手机号是实名制认证通过的有效号码,受到严格的管控和保护。

(2)数据规模大,存储要求高。用户的通信和上网行为均会在通信网络中详细保存下来,海量的实时用户数据要求大量数据存储设备及高效的数据存储及处理能力。

(3)数据来源广,共享难度高。遍布全国的基站网络使得运营商有众多的数据采集渠道,尽管在数据采集方面制定统一的采集规范,但在数据深度解析和加工处理过程中仍缺乏统一管理,导致各接口采集的话单难以充分满足各部门的实际需求。

传统运营商大数据治理框架多基于IBM[18],围绕战略一致等三大目标对数据质量、数据生命周期、数据存储架构、数据安全及合规等方面进行系统治理。具体实施过程中,运营商多搭建大数据平台进行数据的系统治理和合规管理[19]。

尽管基于大数据技术的运营商数据治理发展较早,但该治理思路在当前数据环境下仍有许多不足。第一,传统数据治理框架多基于元数据和数据仓库方式存储和管理[20],运营商数据的指数增长、异构数据融合的需求增多、现有存储设备的新增和管理维护成本激增[21]均给企业带来巨大压力,该存储方式难以满足当前数据存储和管理需求,并且一旦发生技术故障,数据丢失的风险高;第二,在传统数据治理框架下,数据安全及隐私保护依赖安全策略标准和隐私保护政策的制定、发布和实施[22],标准及制度更新周期长,过分依赖制度执行和监督人员,人为因素干扰多,数据隐私泄露问题层出不穷;第三,数据共享模式不健全,传统数据治理框架下数据共享多基于API接口等技术提供标准化服务[23],但该模式存在诸多安全漏洞,难以实现数据路径追溯和防篡改。因此,运营商迫切需要一种新的大数据治理体系。

2.2 区块链技术的特点及在数据治理中的运用

区块链技术作为一种去中心化的分布式账本技术,具有显著的去中心化、共治性及防篡改的特点,能够有效解决传统大数据治理方法中的不足。

图1 基于区块链技术的运营商大数据治理框架

2.2.1 区块链技术能够有效提高数据存储和容灾能力

充分利用密码学、分布式存储等技术构建区块链,数据区块的账户节点之间通过数据传播机制、共识机制实现数据区块的共治,构成一个无中心的区块链系统,每一区块均有数据的完整信息备份,即使某个节点发生技术故障,仍能确保数据的完整性。考虑到运营商布局全国的通信网络和硬件设备,采用IPFS等存储机制能够利用更多异地的存储设备,形成全国的分布式存储系统,有效解决存储容量不足的问题。

2.2.2 区块链技术能够满足运营商对数据安全及隐私保护的需求

首先,区块链中的每一节点均维护当前链上存储内容的完整副本,每一份数据上链均需要有权限的所有节点完成共识认证才能实现,各节点之间是互相监督和合作的平等关系,能够有效降低系统风险。其次,众多节点基于共识机制在去中心化的区块链系统内部形成集体信任,实现区块链的共同治理和运营。共识认证流程越多,区块链系统的去中心化程度越高,系统内各节点的信任度越高。

2.2.3 区块链技术通过时间戳、数字签名和加密算法弥补数据共享漏洞

每一区块包含当前时间戳、数字签名和前一区块的哈希值,三重保障保证区块的唯一性。只有过半数的节点同步更改区块副本才能实现,区块的修改成本很高,因此这种防篡改特性能够保障区块内容的准确性。智能合约机制的定制化实现能够针对运营商数据共享输出提供灵活的模式,相对传统API技术可移植性更强。

3 基于区块链技术的运营商数据治理框架构建

在数字经济浪潮之下,运营商手握海量数据资源,不断探索全新数字化转型之路。在合法合规的前提下,实现数据资源的价值创造成为运营商的发展战略。区块链技术防篡改、去中心化的特性能够有效满足运营商对数据安全、存储能力的要求,为运营商数据共享交易提供必要条件,有效推动数据要素价值转化。

基于区块链技术的大数据治理方法能够为运营商数字化转型带来新思考。如图1所示,本文以“战略一致”“风险可控&合规”及“价值创造”为数据治理目标,自顶向下设计基于区块链技术的运营商大数据治理框架。

框架从“目标—计划—实施”3个维度分别讨论,为运营商大数据治理提供新思路。战略一致、风险可控合规及价值创造为运营商大数据治理提供整体的预期方向和完成目标。围绕治理目标进行实施计划的讨论和安排,以区块链技术为基础构建数据标准库链和处理流程规范链,共治共建实现数据及处理流程的统一。以数据规范为蓝本,结合区块链技术与数据生命周期理论搭建数据综合模块,实现数据存储到安全共享。

3.1 数据治理目标

IBM[18]及吴信东等[3]提出大数据治理的目标包括战略一致、风险可控合规及价值创造三大方面。其中,战略一致主要要求数据治理分析的目标与企业整体战略一致;风险可控合规主要要求在数据治理过程中遵守法规和规范,合理控制治理风险,最终实现数据价值转化;价值创造是数据治理最核心的目标,即实现数据资产的价值转化,为企业创造价值。该治理目标同样适用基于区块链技术构建的大数据治理框架,并且区块链技术的引入为运营商数据共享和用户隐私安全提供更科学的技术支撑。

3.2 数据规范模块

数据规范模块围绕战略一致目标进行实施计划的讨论和统一,充分利用区块链共识机制及智能合约等技术,将标准规范制定过程及数据标准库上链,实现各种数据的命名、定义、类型及计算方法的统一,实现多源数据分类、压缩、加密等处理流程的统一。

目前,主流的数据规范方法是元数据及数据字典,发布统一数据标准实现数据的一致性[1]。但数据标准的撰写、修订、发布、征求意见等处理流程周期长,时效性差,难以满足数据使用者的个性化需求,难以及时反映运营商及市场的最新动态。

区块链技术能够实现所有节点的共同治理和维护,过半数节点通过修改完成标准更新,类似于投票机制,统一意见直接形成结果,所有修订过程及成果上链,针对处理流程和数据标准分别进行智能合约和底层区块设计,分别形成两条辅链,为数据处理模块提供有效支撑,主链和辅链的配合极大降低实现难度。

3.3 数据综合模块

3.3.1 数据源模块

数据源模块主要是运营商内部各省分公司、各部门以及外部的行业数据,包括已存储在本地数据库中的结构化数据,用户实时生成的流式数据以及外部行业分析数据等,多源异构的海量数据均可以整合和存储在区块链系统内,为价值创造提供数据之源。

3.3.2 数据接入模块

数据接入模块是关键步骤,实现多源异构海量数据的采集和处理。基于可编程的智能合约定制不同结构的数据源接入方案,基于流程规范链中约定的处理机制对不同类型的数据进行清洗、分类、压缩,与标准库链上的标准库进行匹配,最终形成可融合的标准化数据。通过非对称加密机制对标准化数据进行加密,确保隐私数据的安全。同时,认证中心对加密的标准化数据颁发授权证书(Certificate Authority,CA),进一步提高数据的安全性。

3.3.3 数据存储模块

数据存储模块是针对标准化数据设计基于区块链技术的存储方案,提高海量数据的查询和使用效率。星际文件系统(Inter Planetary File System,IPFS)是众多节点网状分布式存储网络,系统将同一份文件进行哈希计算得到唯一地址,具有存储访问速度快、更安全更开放等特点,并且能够与区块链技术完美结合。考虑到运营商数据量巨大,存储方案可以设计为IPFS阶段存储标准化数据,仅数据的主索引ID上链,该方案能够有效应对运营商数据规模大、存储能力要求高的问题。

3.3.4 数据集成模块

数据集成模块是在去中心化的分布式存储数据之后,为应对特定数据应用准备数据的模块。利用可定制的智能合约机制设计数据提取集成方法,为数据安全共享提供数据资源。

3.3.5 数据共享模块

高效安全的通信网络和可靠的共享机制为数据价值转换提供技术保障。区块链系统的对等网络(Peer To Peer,P2P)通信机制为数据共享提供高可靠性的支撑。P2P网络中的各节点既是客户端也是服务器,需要承担区块数据验证、传播、新增以及网络路由的功能,通过广播方式共享发布信息,为节点之间的数据共享和交易提供高效安全的通信网络。可编程化的智能合约为数据共享提供明确的共享机制。

3.3.6 数据安全服务模块

数据安全服务以数字授权证书和共识机制等为基础,从加密防护和提高篡改成本两个角度提供安全服务。一方面,仅拥有数字授权证书的节点可使用经非对称加密后的隐私数据。同时,区块链技术底层使用的超级账本框架支持认证中心提供CA颁发和权限分配,实现个性化权限配置。另一方面,共识机制的配置极大提高区块数据篡改的成本,为数据完整性和准确性提供技术支持。

4 结束语

目前,区块链技术处于与行业场景结合的初步阶段,仍有较大探索空间。本文基于区块链技术特点构建运营商大数据治理框架,有效解决运营商数据存储难度大、质量要求高及安全共享实现难的问题,优化数据质量,在保护数据隐私的同时实现数据高效共享,充分放大运营商大数据的优势。区块链数据治理分析框架的提出为运营商顺应数字经济潮流,完善通信数据交易环境提供新的思路和方向,加快数据资产价值转化进程。

猜你喜欢

运营商框架区块
框架
区块链:一个改变未来的幽灵
广义框架的不相交性
区块链:主要角色和衍生应用
区块链+媒体业的N种可能
读懂区块链
取消“漫游费”只能等运营商“良心发现”?
关于原点对称的不规则Gabor框架的构造
第一章 在腐败火上烤的三大运营商
三大运营商换帅不是一个简单的巧合