APP下载

云端大数据助力企业数字化转型

2020-10-20王国华

软件和集成电路 2020年9期
关键词:数据仓库画像云端

腾讯云通过云端海量存储、计算基础设施构建了弹性MapReduce,为用户快速提供了安全、低成本、高可靠、高弹性扩展、架构可持续演进的专属大数据集群。

—腾讯云大数据中心专家工程师王国华

2020年4月,腾讯研究院对企业在新冠肺炎疫情期间需要的数字化技术进行了调查,调查显示有54.8%的受访企业认为大数据技术将对数字化转型起到非常重要的作用。

大数据时代的数据有四个特点:超大规模数据量,多种数据类型,响应速度要求更快,价值密度低、价值总量大。

而企业的数字化转型会遇到三个痛点。第一个是缺乏标准化的工具帮助企业进行基础设施的搭建、算力的提升、应用场景的开发。第二个是数据孤岛,每个企业都有相当多的数据,如何将企业的内部数据和外部数据融合,为企业的业务和营销做一些相关的提升,是一个比较重要的问题。第三个是数据源的匮乏,我们需要大量的数据人才、专业工程师、专家等帮助企业做相关的架构设计、架构部署,还需要建模专家做各种各样的模型来实现数据的价值。

面对上述问题,腾讯自下而上提供了各种各样的服务支持。在底层的大数据基础设施层,我们有弹性MapReduce和神盾联邦计算平台。在大数据场景开发层有ES、流计算服务、云数据仓库、商业智能分析、云搜等服务系统,我们通过这些系统帮助企业进行场景开发。在最上层的大数据应用服务层,我们提供云图、灯塔成长平台、精准营销、企业画像、企业风控等服务。

今年我们在EMI上做了两方面的改进。第一個是降本增效,我们希望通过AMD的大型机器来做存储分离,帮助企业在成本上减少至少30%的支出。第二个是异构算力,现在很多企业希望在达到计算峰值的时候,能够利用云原生实现弹性扩缩容,减少峰值计算的成本。我们在这方面和知乎、虎牙进行了一些尝试。

弹性MapReduce是腾讯云构建于云端海量存储、计算基础设施之上的云端Hadoop框架,通过该框架用户可在十分钟内获得一个安全、低成本、高可靠、高弹性扩展、架构可持续演进的专属大数据集群。

这些年腾讯积累了很多数据,有些数据比较敏感,不能直接和腾讯内部的数据做碰撞和融合,因此我们专门开发了神盾联邦计算平台,将数据脱敏、加密之后,把这些数据提取出来和腾讯内部数据进行融合,达到企业画像的推荐和在各种各样的场景里建模的目的。

ES基于开源引擎打造,集成了安全、数据告警、SQL、机器学习等高级特性,并具有易于管理和部署等特性。

腾讯云流计算平台,是位于云端的流式数据汇聚和计算服务平台,用户只需几分钟就可轻松构建流计算应用,而无须关注基础设施的运维,并且能便捷地对接丰富的云上数据源。这个产品结合一些技术,在点击流分析、金融实时风控、物联网监控、电商精准推荐等领域都有应用。

而腾讯云数据仓库(Cloud Data Warehouse)是一款简单、高效、经济的数据仓库服务。为用户提供简单、快速、经济高效的PB级云端数据仓库解决方案,屏蔽了底层复杂的计算逻辑,让用户通过简单代码实现复杂的操作,帮助中小微企业实现高效的数仓管理和数据存储等。

此外,我们在应用场景里也进行了比较多的尝试,在这里给大家介绍一下云端大数据应用产品—企业画像的产品架构。企业画像是结合腾讯内部已有的各种各样的数据,包括企业工商数据、企业营销数据、企业判决文书数据、法院判决公告数据以及其他数据共同打造的企业360°画像系统,通过企业画像系统,我们希望能够进行企业营销、企业风控、产业分析和产业扶持,为政府、企业提供相关的SaaS化服务。

企业画像的产品优势分为四点。第一是我们有海量的企业数据,此外我们还会和很多合作伙伴进行联合,把相关数据整合到企业画像内部中。第二是深度剖析关联关系,基于腾讯内部的计算平台做企业图谱的挖掘,我们能够判断人和企业、企业和企业之间的关系以及隐藏的风险关系。第三是区域产业洞察,我们利用产业数据以及腾讯内部各行业专家经验对产业做专门的分析,并且通过区域产业分析、头部产业分析、产业链上下游分析以及产业的发展、风险的分析来为客户、政府、企业提供产业方面的指导。第四是动态跟踪企业的运营状况,我们自研了企业风控模型,包括标准化模型、企业的运营商管理模型,基于大数据、神经网络的模型等对企业动态运营状况进行监测。企业画像对产业发展风险分析、产业链分析、产业竞争格局分析、产业舆情政策这四大领域做分析,可以为企业、政府提供区域的产业规划,为企业寻找供应商和客户提供支持。

在企业画像里积累了大量的企业数据,同时为每一个企业都打上了相关的特征标签,我们希望通过这些企业标签在营销领域进行一些相关的尝试。同时,我们希望尽量通过企业的标签构建企业的模型,减少无关企业的干扰,提升客服人员的推荐效率。当前,各个银行非常关注中小微企业的风险问题,我们希望运用企业画像里的数据,结合其他合作伙伴的数据,共同打造一款适合企业场景的产品。

(根据演讲内容整理,未经本人审核)

猜你喜欢

数据仓库画像云端
基于数据仓库的数据倾斜解决方案研究
在云端永生
云端旅行
画像
画像
数据仓库系统设计与实现
在云端
莫尼卡的画像
画像背后藏着活人
数据复用在存储数据仓库中的运用