数据交换:管理者的下一门必修课
2021-05-06何塞·帕拉-莫亚诺卡尔·施梅德斯亚历克斯·桑迪·彭特兰
何塞·帕拉-莫亚诺 卡尔·施梅德斯 亚历克斯·桑迪·彭特兰
企业依赖数据进行生产和销售已不是什么新鲜事儿。2018年,全球市值前6位中有4家公司(亚马逊、谷歌、脸书和阿里巴巴)的商业模式是建立在利用数据优化广告的基础上。然而,数据与资本、劳动力等传统生产要素相比,有很大的不同。企业管理者要充分挖掘数据的价值创造能力,就必须熟悉数据的独特属性,以及数据交換应该如何利用好这些属性,做到趋利避害。
与资本和劳动力这两大生产要素不同,目前并没有一个透明的数据全球化市场,数据从个人到组织的流动,以及在不同组织之间的流动都没有保障。因此,企业与平台有两种选择:要么只利用个人(企业客户或用户)在组织系统里产生的数据,要么从其他数据集合商处购买数据。后者的交易行为缺乏透明度,个人无法参与,难以对交易过程施加影响,更谈不上直接从中受益。
由于数据具有不可替代的特点,个人很难把自己的数据直接卖给组织。潜在买家在购买之前要有评估原始数据价值的能力,这一评估办法在技术上虽有可能性,但实际上非常复杂,且成本高昂。而且,大多数组织只对许多人的数据感兴趣,因为各类数据只有达到一定数量级后才可以揭示有价值的规律,所以个人在买卖数据时是没有什么讨价还价能力的。此外,在当事人不知情、不许可的情况下,将未经整合或匿名处理的个人数据提供给第三方是违法的,因此购买数据的过程困难重重,通常需要分阶段谈判。
数据交换中心通常由基金会、私营企业或用户联合体管理和控制。它们对数据提供方主动分享的数据进行组织、整合和匿名化处理,并允许第三方在此基础上运行算法,以此创造价值。第三方支付的使用费最终将分配给数据提供者,或者如果交换中心是个人联合体组成的,那么该联合体可能会选择以提供增值服务来代替付费。
既然企业可以从数据交换中心购买分析报告,那么它们即便手上没有直接的数据,也不影响它们从中创造价值。对于有些企业而言,数据可以自产自用,于是自己便成了数据生产商。这样一来,它们就不再是单纯的数据交换中心的用户,而是可以从中获得收入。例如,畜牧养殖企业可以提供健康牲口和患病牲口的照片,保险公司、制药企业可以用这些数据训练影像识别工具,侦测动物疾病。
对于已经掌握并分析客户或用户数据的企业,拥抱还是回避数据交换中心是个特别重要的决定。企业管理者应当从更广的领域来仔细思考数据交换对于企业战略与经济趋势的影响,谋定而后动。
何塞·帕拉-莫亚诺 卡尔·施梅德斯 亚历克斯·桑迪·彭特兰
企业依赖数据从事生产和营销已不是什么新鲜事儿。其实在2018年,全球市值前6位中有4家公司的商业模式是建立在利用数据优化广告的基础上,它们就是亚马逊(Amazon)、谷歌(Google)、脸书(Facebook)和阿里巴巴。然而,数据与资本、劳动力等传统生产要素相比,有很大的不同。例如,要实现规模化,企业尤其是那些在广告及其他收入模型中要用到算法的公司,需要掌握大量客户的数据。由于数据庞大,其中不免涉及个人隐私,甚至是国家安全,而其他生产要素则不存在这个问题。数据的这一特殊属性不利于它在市场上被高效、透明地交易。虽然具有数字化特征,但也只能封闭在一个个专属孤岛上,无法被有需求的组织充分加以利用,实现最大价值。
然而,这种大数据只能由各家企业独自管理的想法正逐渐被共享数据的理念所替代。我们特别感兴趣的是数据交换中心——这一共享平台上来自不同渠道的数据(即由个人或机构主动分享的数据)得到梳理和集中,第三方能够从这些数据中获得全新的洞察。而随着这些新的洞察在市场上自由、安全、保密地流动,那么基于数据的价值创造就能得到极大提升。但是如果要充分挖掘这部分潜力,管理者就必须熟悉数据的独特属性,以及数据交换应该如何利用好这些属性,做到趋利避害。
数据的独特之处
要理解共享数据的潜在价值,首先我们要弄明白数据与其他生产要素的差异。
数据是不可替代的 对一家公司而言,不同的数据单位可以有不同的用途。比如说,某家企业收到1美元投资,但到底是流通货币中的哪张钞票流入了这家企业其实无关紧要。同样,这1美元是用什么方式支付的,一张1美元现钞,还是4个25美分的硬币,或100个1美分硬币,这些都不重要。这是因为货币资本是可以互换的。但是,如果这家企业拿到了一个数量单位(比如说1兆)的数据用于开发一个特定的算法,并不是所有的数据单位(健康数据、财务数据、地理位置数据等)都能起到同样的作用。
数据使用不存在排他性 两家公司可以同时使用相同的数据。资本(一般来说,1美元在某个时间点只能投给一家公司)和劳动力(一个人只能在一个工作环境下工作1小时)则无法同时为两家公司所用。
数据的时效性很短 数据每天甚至每小时都在变化,因此数据越新,价值最大。当然并非所有数据都是越新越有价值(比方说,一个人的生日永远不变),但与身体健康、财务状况以及地理位置相关的数据则存在鲜明的时效性。其他生产要素也会随着时间推移而被废弃。但通常来说,资本的折旧需要几年时间,工人的技能落后了可以通过再培训来提升,而一般情况下数据贬值非常快,而且不可逆转。
数据大多在达到相当规模后才能产生价值少量的数据有时有用,但不足以支持分析、培训算法,或者在广大客户中推广。在绝大多数的商业场景中,只有大数据汇集起来才有显著价值。
两种以上数据用途在发生互动时能够产生更多新数据 反之,用途单一的状况下产生不了新数据。例如,亚马逊、脸书、谷歌和阿里巴巴都是利用平台用户共创数据,这些数据能够揭示用户的行为与偏好。
个人对自己的原始数据拥有各项权利 只有在数据所有人知情并同意的情况下,有关数据才可以被出售、分享或交换,否则就是违法。雇员拥有一定的同意权(比方说雇员可以拒绝为雇主从事违法犯罪活动),但这些权利相对有限。人们的资本投资是可控的,但是个人数据可以在所有者不注意的情况下被使用,因此有关数据的同意权与其他生产要素的同意权存在性质上的差异。
数据共享的现实障碍
与资本和劳动力这两大生产要素不同,目前并没有一个透明的数据全球化市场,数据从个人到组织的流动,以及在不同组织之间的流动都没有保障。因此,企业与平台有两种选择:要么只利用个人(企业客户或用户)在组织系统里产生的数据,要么从其他数据集合商处购买数据。后者的交易行为缺乏透明度,个人无法参与,难以对交易过程施加影响,更谈不上直接从中受益。谷歌公司实施了一项名为“南丁格尔”(Nightingale)的项目,从美国第二大医疗服务供应商Ascension购买了医疗保健数据,但相关患者对这一交易没有发言权,也无法直接从中获益。(目前南丁格尔项目正在接受美国卫生与公众服务部的调查)
由于数据具有不可替代的特点,个人很难把自己的数据直接卖给组织。潜在买家在购买之前要有评估原始数据价值的能力,这一评估办法在技术上虽有可能性,但实际上非常复杂,且成本高昂。而且,大多数组织只对许多人的数据感兴趣,因为各类数据只有达到一定数量级后才可以揭示有价值的规律,所以个人在买卖数据时是没有什么讨价还价能力的。此外,在当事人不知情、不许可的情况下,将未经整合或匿名处理的个人数据提供给第三方是违法的,因此购买数据的过程困难重重,通常需要分阶段谈判。
数据,特别是那些用户与在线平台通过互动共同创造出来的数据,由于交易不透明,经济效率不高。例如,数据可能无法转移到能够带来最有价值的发现的企业。再比如说,数据买卖没有标准化的交易条件,这就降低了企业资源配置的效率。相比之下,资本和勞动力可以在公开市场上自由交易,流向能带来最高回报的企业(反映在资本上就是利率,反映在劳动力上则是工资和职业发展)。
数据交换中心如何促进数据共享
数据交换中心通常由基金会、私营企业或用户联合体管理和控制。它们对数据提供方主动分享的数据进行组织、整合和匿名化处理,并允许第三方在此基础上运行算法,以此创造价值。第三方支付的使用费最终将分配给数据提供者,或者如果交换中心是个人联合体组成的,那么该联合体可能会选择以提供增值服务来代替付费。类似OPAL和X-Road的数据交换平台使用了区块链技术,从而实现了治理架构的透明化,这让数据提供者对数据分享的安全性感到放心。
如今数据交换中心在全球范围内方兴未艾,美国在这一领域首屈一指,紧随其后的是新加坡、澳大利亚和欧洲。尽管数据交换中心还是个新生事物,目前还没有所谓的领军企业或市场领袖脱颖而出,但角逐行业领先地位的企业越来越多,简单地到網上搜一下,就可以找到好几十个。
数据交换中心究竟能创造多少价值?为了更好地理解这一点,我们可以假设这样一个场景:某制药企业有了一个好创意,一支合适的团队,以及足够的资本,它要创造出一个全新的算法,用于某一病症的早期诊断。这家药企为了训练算法,需要有针对性地收集或合法购买大量数据。在数据交换中心尚未成立时,要获得所需数据困难重重。但现在,通过数据交换中心,药企可以获得患者自愿提供的病历,掌握相关数据以训练算法,同时数据交换中心也可以从药企获得一笔费用,或后者提供的医疗服务,进而将其分配给提供数据的患者。
在数据交换的新世界里,像上文提到的患者等数据所有者,可以利用自己的数据换取一笔收入,或某种增值服务。同时有了数据交换后,第三方机构(类似上文中的药企)能够创造出之前无法产生的价值。
数据的不可替代性在交换中起到了关键作用。由于第三方算法运行要用到的数据必须是匿名的、经过整合的、成体系的,由此交换中心可以知道第三方运行计算机代码用的是哪些数据,以及这套代码计算的是什么内容。
此外,数据交换中心需要整合来自不同主体的数据,因此它们可以满足各类算法对于数据多样性和规模的要求。而且在对算法做了适当审计后,数据交换中心就可以做到只为第三方提供“安全”解答,避免泄露可能侵犯数据提供者隐私的信息。比方说,制药公司可以接触到足够多的某类患者的数据,但它无法将某份病历对应到具体某位患者。这就大大简化了征求患者本人同意的过程。而且由于数据交换中心整合了许多数据所有者的利益,因此它在价格评估和价格谈判上比单个的数据所有者更有优势。
更重要的是,数据交换中心的数据价值通常更透明,第三方从数据中获得新发现后,转手销售时可以在售价上有充分体现,并可将所得收益分配给原始数据提供者。在上述事例中,有关患者的数据在用于训练算法时,他本人是知情的,而且他还知道第三方为在数据上运行算法付给数据中心多少钱。
数据交换中心的实际运作
现实中运行的数据交换中心包括DSpark、Data Republic、Ocean Protocol、Dawex和Enigma。其中Ocean Protocol采集的数据来自个人、不同行业的公司甚至还有其他数据交换中心,这对第三方非常有利,最终客户也能从中受益。举例来说,从汽车厂商处获得的驾驶数据能够帮助软件工程师开发自动驾驶车辆的车载软件。从人力资源部门获取的员工职场满意度数据可以让企业制定更好的福利政策和员工职业成长计划。数据交换中心Ocean Protocol由总部设在新加坡的一家非营利基金会打理,它目前的合作伙伴包括罗氏制药(Roche)和联合利华(Unilever)等知名跨国企业。Data Republic搜集数据、分享发现成果的方式与Ocean Protocol类似,目前它的用户中有来自澳大利亚、新西兰、美国和新加坡的银行、航空公司、政府机构等。
OPAL计划是数据交换的基本标准,OPAL的目的是在不侵犯个人数据隐私的情况下,让各种类型的数据能够得到仔细审查和深入分析,它包括以下三个步骤:
● 将算法用于数据,而不是把原始数据迁移离开存放位置,提供给第三方的答案必须是“安全”的;
● 应用的算法必须是公开的,如果专家认为算法“安全”,就可以对其深入研究;
● 新的分析技术能够让数据保持加密状态,即便是数据交换中心也看不到原始数据。
在商业应用之外,数据交换中心也开始为政府和非营利机构提供服务。最近欧洲统计局开始使用一家OPAL类型的数据交换平台,所有欧盟政府的官方数据都通过这一平台进行交换共享。目前爱沙尼亚使用的是X-Road,通过后者的技术和组织环境来实现电子医疗记录,以及税收、教育、土地权属等方面数据的安全迁移。
数据交换中心的宏观经济价值
如同训练有素的劳动力和新发现的石油储备,数据交换中心也能够在经济中发挥积极作用。但不同之处在于,劳动力和石油储备通常在一个时间段内只能被一家企业利用,数据则可以被许多企业共享。大数据已经改变了全球经济,今后通过数据交换中心进行数据共享也会产生相同的影响力。
举例来说,数据交换会让今天的垄断企业遭遇新的竞争对手。今天一家年轻的科技公司在与老牌企业竞争时面临的困难就是缺乏数据,这使得它无法开发出有用的算法。数据学者指出,“在过去30年里,每年诞生的新公司从占比13%下降到了8%,百人雇员以内的企业减少了5%”,与此同时,“营收前5%的企业的总体收入占比上升了10%”。数据交换可以扭转这一趋势,因为初创公司和中小企业可以用资本从数据交换中心购买基于数据的调查分析,这样它们会比今天更有竞争优势。
联合体改变了权力平衡
数据联合体让创造数据的个人得到回报,而且比在自己的数据平台或其他类型的数据交换中有更大的定价权。这方面的例子包括音乐人、视频制作人以及独立工作人士组成的联合体。数据交换产生的收入不属于补贴,它是个人经济活动的结果,不同的制作人和工作者把自己的数据传到数据交换中心,由后者完成数据整合,提供数据的个人因此成了“数据企业家”。数据所有者能够为自己的数据收取多少“租金”,由市场的供需平衡决定。在某些情况下,租金可以成为个人收入的重要补充。
19世纪的工人在意识到自己的劳动价值后,他们中的许多人便寻求成立工会,开展集体谈判,进行政治游说,从而站在比之前更有利的位置与资方讨价还价。如果有人通过自己的数据获得了经济回报,那么就会有更多的人产生数据意识,新的数据联合体将应运而生。
已经具有一定影响的数据联合体包括TheGoodData、European Data Union、Data Workers Union、The Data Union等,它們希望把全世界的数据所有者联合起来。如果数据所有者在一般的非联合体交换中心出售自己的数据,那么他们就等于间接披露了其他用户的数据,这会导致数据价格被压低。如果由数据联合体从中协调数据出售,那么就能够避免这种不利局面。值得注意的是,目前的信用联盟有资源(数以百万计的用户把他们的钱存在信用联盟),它们在法律上可以成为数据联合体的推动者和受益人。它们只需要在整合货币资本的同时开始整合数据。
企业和平台也可以利用数据联合体整合它们的客户和用户。通过提供高质量的应用编程接口,它们可以将数据经由一个操作简便的系统传至联合体。无论是新客户还是老客户都会将这个系统视为增值服务,企业或平台可以对此收费。这一理念也符合美国商业圆桌协会(Business Roundtable)近年来关注利益相关者的趋势。联合体模式可以看作德国社会市场经济的一个延展,后者注重工会与企业之间的紧密协作。
管理者的下一步行动
既然企业可以从数据交换中心购买分析报告,那么它们即便手上没有直接的数据,也不影响它们从中创造价值。比方说,一个化肥生产商有意为几种农作物开发化肥产品,它可以从拥有农场主数据的交换中心直接购买有关数据结论,从中了解不同农作物对不同化肥产品的反应。
对于有些企业而言,数据可以自产自用,于是自己便成了数据生产商。这样一来,它们就不再是单纯的数据交换中心的用户,而是可以从中获得收入。例如,畜牧养殖企业可以提供健康牲口和患病牲口的照片,保险公司、制药企业可以用这些数据训练影像识别工具,侦测动物疾病。
对于已经掌握并分析客户或用户数据的企业,拥抱还是回避数据交换中心是个特别重要的决定。如果企业管理层决定不和数据交换中心合作,那么他们的客户或用户可能会自己组成一个数据联合体,这样一来企业在数据交换中就没有任何话语权。而如果管理层决定主动和数据交换中心合作,那么他们对于数据交换中心的架构和运营就能施加一定影响,比如说,提出对自己有利的激励方式。
如何向自己的客户解释与数据交换中心的合作,如何对外说明企业内部形成的联合体,这也是企业管理层需要确定好的。企业应该尽早把关于数据联合体的公开立场说清楚,同时在内部指定专人对公司掌握的数据进行价值评估。
此外,企业与平台可以将参与数据交换而产生的营业收入如何分配的解决方案,主动告知自己的客户和用户。这里就存在着与竞争对手形成差异化的机会,可以提出一个新的价值主张,留住现有客户,并吸引新客户。
企业管理者应当从更广的领域来仔细思考数据交换对于企业战略与经济趋势的影响,做到谋定而后动。这项工作将帮助企业顺利过渡到数据共享时代,塑造新形势下的经济生态系统。