“大而全”的Teradata Vantage平台
2018-01-02王永
王永
“大数据概念的出现是在2010年末,”Teradata天睿公司大中华区解决方案总监姜欣在接受笔者的采访时表示,当时这个词一周的搜索量有九次,经过这几年的快速发展,现在已经是每天上万次的搜索量。不过从某种程度上来看,人们对于大数据的敏感度正在处于下降的趋势。
不可否认,始于90年代初期的数字化进程虽然目前在全球来看还未达到百分之百的程度,但是数据的价值已然在推动全球各行业及其周边相关产业的发展方面日益凸显。数字化依旧是未来企业的发展方向。
所以,对于客户来讲,数据犹如货币,他们希望通过深度挖掘数据潜在的价值为其带来营收。来自于第三方中立研究机构Gartner的调查显示:在数据分析领域的产业链价值,目前有2000亿美元的支出,而且还在不断的增长。这对于从事数据分析行业的Teradata是一个利好的信息,意味着未来Teradata依旧会有很大的市场空间,不过从客户的角度来看,他们有着不同的看法。
“现在企业的领导者普遍都认为,在分析领域投资了很多年,但还没有一种分析产品能够解决所有的需求,也就是没有一个技术、一个产品能够解决所有的需要。”姜欣表示,大多数的企业在周旋于这种不充足的工具、不完整的分析技术,但是单靠分析并不能真正的解决问题。每一个问题都有可能延伸出下一个问题,但往往有可能绕进下一个需要解决问题的循环后而无法真正获得业务方面的解决。Teradata希望通过站在合作伙伴的位置,倾听客户的反馈,帮助客户解决问题。
专业的服务团队
Teradata从1976年就专注于数据分析领域,做到极致、完美一直是Teradata的目标。用Teradata天睿公司大中华区总裁辛儿伦(Aaron Hsin)的话来讲,就是希望Teradata提供任何研发技术、平台、产品以及咨询服务等,可以不受任何查询规模的限制、不受任何容量大小的限制、也不受限于地方的限制等,为客户提供实时业务的成果,让客户通过Teradata的分析手段、应用,给他们的客户带来满意度的增加、成本的降低以及营收的增长等。
“对于客户的企业管理层来讲,Teradata交付可信赖的数据,帮助他们做出准确的企業增长战略。对于CIO来说,他们关心的是打造一个可拓展的生态系统,同时确保安全性和高效性,这也是我们这42年以来所有的研发一直围绕这个精髓作为我们产品继续优化的原则。”辛儿伦认为,对于客户的业务分析师来说,使他们获得更全面而及时的客户行为,还有情感的洞察力,这个现在非常流行,叫做Behavioral Analystics(行为分析),从而有效地在正确的时间、适当的方式,提供给他们客户个性化的需求。
目前Teradata在大中华地区有1000名员工,其中70%-75%员工是咨询服务团队。辛儿伦强调,Teradata非常重视团队的组建,尤其是咨询服务团队。在他看来,Teradata的咨询服务团队,累积了方方面面的数据分析领域的方法论、行业模型、业务模型和丰富的经验,这能够很好地帮助客户项目的成功。据了解,接下来Teradata还会继续加大在咨询服务人员方面的投入。
Teradata Vantage,不只是产品,更是一个体系
事实上,市场在变化,客户的痛点也在随之改变。
现如今大数据平台普遍面临着三大问题:首先是分析技术手段太过广泛。SQL、Hadoop、JAVA、到后来Phthon的相继出现,让单一的技术手段实现操作难度增加,很多客户为了适应这些不同的工具,去临时搭建数据平台。比如SaaS,一定要把数据从数据平台给捞出来,变成SaaS的格式或者R的格式,你才能去做分析。这是面临的第一大困惑,工具太零乱、太分散。
其次是,受工具和语言分散的影响,客户的数据平台也会受到牵连。各种临时数据平台的搭建让数据本身的质量受到影响。
最后是来自于客户端的影响。企业的IT架构师在规划平台时,他要去考虑将来这个架构会如何保持弹性、如何进行演进、架构会不会被颠覆,这就出现了传统IT架构与企业云架构上的冲突。
2018年10月,Teradata在全球用户大会上宣布了Teradata新一代全方位的Teradata Vantage平台,辛儿伦将其形容为浓缩Teradata几十年技术积累的“大而全的产品”。
从Teradata Vantage的整体架构来讲,主要分成四层:数据存储、分析引擎、语言、分析工具。底层是Vantage的数据存储格式,包括Teradata、AWSS3以及Azure Blob,将来也会支持更多的数据存储格式,通过高速连接组织,把不同的引擎连接起来。
值得一提的是,在Vantage整个架构架构中最为核心的组件来自于QueryGrid,它主要的任务有两个:实现不同数据存储的连接;把多种分析引擎——图分析、机器学习、增强SQL的引擎、以及未来的TensorFlow、Spark等分析引擎,进行集合。
从用户的角度来讲,他们更希望“一键安装”方式的解决方案,而不是一味的推翻重来,因为这意味着巨额的成本增加。针对这一情况,Teradata有两个建议:一是重新购买Teradata Vantage,把以前Teradata产品上面的授权折算一部分成本迁移;另一个是在现有的Teradata产品加上一个单独购置的QueryGrid,去用来连接像Hadoop,甚至是DB2、Oracle这样第三方的数据库,同样可以享有Vantage的功能。“Vantage是一个很大的参考架构,里面有Teradata的各种各样的东西,用户可以根据自己的需求,进行选择。”
所以姜欣认为,Teradata Vantage最大的优势在于可以提供一个统一、整合的分析环境——不用担心数据孤岛的问题、支持所有主流的工具和语言、可以打通所有数据类型的接口、可以随时随地进行弹性部署、统一的管理。
长期以来Teradata一直是在客户的本地数据中心提供服务,现在用户的需求正在发生变化,他们希望与云的部署相结合,不需要重复投资。“所以Teradata希望自己的产品定位是可以满足客户的各种需求需求——任何时间客户都可以部署在任何一个地点,通过Teradata也可以进行本地和混合云的灵活结合,从Teradata的平台、软件组合、地点到咨询服务,一应俱全。”辛儿伦如是说。