为什么数据质量是数字化转型成功的关键
2017-05-26JohnGallant
John+Gallant
Informatica首席执行官Anil Chakravarthy指出,控制好数据整合和完整性对于创新工作和保证企业安全非常重要。
如果您想成功实现数字化转型计划,首先要清理您的数据。这是Informatica首席执行官Anil Chakravarthy的观点,该公司的主要数据管理产品帮助企业360度全方位了解客户、供应商和其他重要资产。在IDG首席执行官系列采访的这一期中,Chakravarthy与首席内容官John Gallant就数据质量和整合问题进行了探讨——这些问题阻碍了创新和数字化转型工作。他还介绍了在公司自己数字化转型策略的推动下,这一历经25年的公司于2015年决定转向私有。
Chakravarthy在安全行业有深厚的背景,曾在赛门铁克和VeriSign担任高级职位,他还解释了为什么我们的安全重点应从周界防护转到数据层。用他的话来说,在此之前,安全仍然是“悬而未决的问题”。
CIO.com:您为客户解决了哪些问题?
Informatica首席执行官Anil Chakravarthy:Informatica提供我们所谓的企业云数据管理,这意味着我们为要进行数字化转型的公司提供数据管理产品和服务。所有人都专注于某种数字化转型工作,几乎所有的数字化转型都是由某种数据驱动的变革所推动的。
我们帮助客户打好数字化转型的数据基础。我们构建了我们所谓的智能云数据平台。智能云数据平台是内部部署和云端的混合——它帮助客户构建各种数字化转型应用程序和流程。
CIO.com:最近,我主持了一个关于数字化转型的圆桌会议,参会者有来自相关企业的首席信息官以及职能相近的同行们。讨论的主要议题是关于成为分析主导的或者数据主导的企业,而每个参会者都认识到其主要难点在于数据问题。企业必须处理好哪些问题才能真正成为分析驱动的企业?
Chakravarthy:我认为这就涉及到数字化转型的核心问题。首先,需要由首席执行官和董事会进行领导,因为这会对整个公司产生影响。这可能意味着业务模式会出现一些变化。例如,如果您留意一下通用这样的大公司正在进行的数字化转型,他们把业务模式从销售高端设备和服务计划转变为基于实时数据的新业务模式,他们将与客户共同承担风险。他们把提供高端设备作为服务。这是业务模式的转变。
我们看到的第二个重大变化是新流程。例如,无论是移动银行还是移动自助服务,企业现在都以某种形式的服务为客户提供了更多的功能。所有这些都意味着新的流程。
数字化转型的第三大变化是新用户和新应用支持。例如,在过去,分析应用程序主要用于报告或者事后分析。以您要进行季度总结为例。现在,您想对季度工作进行分析,哪些细分市场表现良好,哪些细分市场表现不佳,等等。这是事后分析,而且是以批次的方式完成的。现在,这类新用户和新流程的含义是,您需要把分析功能内置于其工作流程中。这是一个很大的变化。
数据要求是,首先,您必须能够从现有系统以及新系统中访问数据。您必须能够访问任何来源的数據——无论是在内部,云中还是Hadoop等新数据平台上。您还必须能够理解这些数据。您可能有来自多个来源的客户数据,如果您想全面了解这些数据,必须使用元数据把它们整合在一起。
最后一件大事是,做这一切时思想上要有清晰的数据治理的概念。这不能是事后的做法。在这个新环境中,必须从一开始就把数据治理建立起来。
CIO.com:和这些首席信息官们交流的时候,人们提到了数据质量、数据标准化等各种问题。您能在这些方面帮助别人吗?
Chakravarthy:首先,我们帮助人们把数据从多个来源汇总到一个通用数据存储库中,然后用于数据分析和报告,为流程提供支持。对于可用数据源的数量,从大型机时代到物联网,以及期间的所有一切,有各种各样的数据源,大量不同类型的数据库,非常多的API;在很多情况下,由于开发的时间较早,因此没有API。以不影响源系统的方式获取数据不会影响任何正在进行的操作流程,仍会在正确的时间帮助您把数据提供给正确的用户;这是我们解决的第一个问题。这是数据获取问题。
第二,现在假设您已经解决了这个问题,得到了以自己的格式表示的原始数据,这就是我们开始讨论的质量问题的第一步。在不同的数据库中可能没有相同的客户ID。您可能在一个地方有一个客户ID,而在其他不同的地方您可能根本就没有任何ID。您可能有输入,但输入可能不完整或者不正确。由于开发这些数据库和数据源时并不是建立在数据将被从这些系统中取出并重新利用的假设之上,因此有很多问题。这是我们解决的第二大问题。数据质量是一个很广的话题,使用元数据,或者可以预先制定规则的数据质量产品,或者使用机器学习等新技术来确定规则。
与数据相关的下一组问题是如何理解与某一具体业务实体相关的数据?举个例子,如果您是一家石油公司,那么您可能会关注一条石油管道,想获得来自各种系统的数据。有些可能是ERP型系统,其他可能是提供实时输入的新型物联网系统。您想要得到所有这些,并能够360度全方位地查看石油管道。它运行良好吗?符合目标吗?盈利吗?数据的业务实体视图是我们解决的第三大问题,将数据放到一种格式中,以便您可以对数据进行360度全方位的查看。最后一个问题是数据治理。这些数据来自哪里?我们有这些数据的谱系吗?这是数据的权威来源吗?数据是否安全?所有这一切都要归结于治理标准。这是我们针对数据解决的第四大问题。
CIO.com:什么样的痛点促使客户说:我必须得和Informatica的这些人谈谈?
Chakravarthy:通常,当他们要开始这些数字化转型大计划的时候。然后,他们认识到他们有的数据不正确或者不完整,或者他们无法在正确的地方获取正确的数据,在对数据进行正确的转换,使其可用时也遇到了问题。这些是他们打电话给我们希望解决的典型问题。
CIO.com:我想深入了解一下您的主要产品。让我们从客户360产品开始吧。
Chakravarthy:“客户
360”是最容易使用的产品,因为它名副其实。Nordstrom就是一个例子,这个客户至少从2008年起一直在使用该产品。当您走进Nordstrom时,其员工有一类平板电脑设备,他们想在您进入时找出您的基本信息。然后,他们在您的基本信息中加入了许多内容,以便为您提供个性化的服务。您可能是Nordstrom Rack的顾客。您可能已经呼叫了客服,您可能已经在线退回了一些产品,等等。这些数据来自许多应用程序和数据库,这就是“客户360”要做的。我们把这些数据放到一起,然后客户或者我们的一个合作伙伴在这些数据基础上开发定制应用程序。我们不开发应用程序。我们把它们放到一起形成一个基础,方便进行应用程序开发。
例如,在Nordstrom的例子中,它可能是个性化的应用程序。这个客户是我们最赚钱的客户之一。他每几个月才来一次,但一旦决定购买,就不会退货。或者,这是一个做决定很快的人,但他退了一半的货。这有助于提供个性化的服务。这些就是建立在数据之上的一类应用程序。我们在每个行业都有这样的客户。例如,在保险行业,MetLife是一个很好的例子。在他们看来您并不是客户;您只是一个保险号码。但现在他们想知道客户是谁,还有谁在家里,他们的生活发生了什么变化?他们有什么样的生活?他们结婚了吗?他们有孩子吗?他们离婚了吗?家里有亲人去世了吗?他们希望全面了解您的家庭,因为这有助于他们更好地掌握能为您提供哪些其他产品,以及如何与您建立更好的关系。这正是“客户360”产品所做的。
CIO.com:我觉得针对业务合作伙伴的“供应商360”产品做的事情完全一样。
Chakravarthy:是这样的。我们在行业中看到的最常见的是“客户360”、“供应商360”、“产品360”以及我们所谓的“资产360”,这是您的业务资产,就像我谈到的石油管道。您怎样360度全方位地了解这些?但产品本身,就是我们所说的主数据管理产品,是非常容易扩展的。其实我们现在有140个具体的数据域。
FDA是一个很好的客户实例。对于FDA而言,药物就是一个域,他们希望能够360度全方位地了解药物。我们有一些医疗保健和生命科学客户就是这样做的。他们为关键业务实体建立了360度全景视图。最常见的是客户、产品等,我们有预开发的解决方案,他们可以在其基础上进行定制。
CIO.com:您目前在云中提供什么,将来会在哪里?
Chakravarthy:我们的云战略是三重的。首先,我们坚持开发适合于云应用的云产品。我们过去的系列产品中有很多功能。我们是一家有35年历史的公司。我们采用了很多这些功能,将其置于云产品中。换句话说,我们不打算把现在内部部署的产品搬运到云端。我们拥有云数据集成产品、云应用和流程整合产品、云计算主数据管理以及我们发布的其他新产品;云数据质量和云数据安全等。这是我们云计算策略的一部分。
我们策略的第二部分是制定混合策略。我们的一些内部部署产品支持云作为数据源或者数据目标。例如,您可能会在内部使用分析数据仓库,但您希望从salesforce.com或者Workday或者您正在使用的任何其他云应用程序中提取数据。这是我们支持的非常常见的用例。实际上,例如,对于Salesforce-to-SAP整合,我们支持全球超过40%的Salesforce-to-enterprise整合。这就是一个混合的例子,数据被引入,云被用作数据源。我们还做了很多工作,其中云被用作数据目标,最常见的是Amazon Redshift、Azure SQL Server等。数据仓库在云端,我们处理来自源系统的内部数据,进行数据整合、数据质量、治理等,然后在Amazon Redshift或者Azure SQL Server中对数据进行处理,用于分析应用程序。
我们云计算的最后一个策略是确保我们自己处在云的关键生态支持系统中。其中最大的四家是Salesforce.com、Amazon、Azure和Tableau。我们也在努力,您很快就会听到其他几家的消息。我们希望本身就在生态支持系统中,这意味着,例如,在Salesforce中,我们使用在force.com上运行的应用程序,而这些应用程序嵌入在Salesforce中。作为亚马逊整个数据层的一部分,我们一直与亚马逊密切合作,我们希望在这方面成为亚马逊全包合作伙伴之一。他们邀请我们参加他们的re:Invent大会。我们在亚马逊内部提供了完整的数据管理层。我们现在也和Azure在Azure数据管理层上做同样的事情。
CIO.com:您能谈谈为什么公司转向私有,为什么这对客户有好处?他们能从中得到什么?
Chakravarthy:我们转向私有主要因为我们自己的转型,就像客户正在经历数字化转型一样。我们的转型主要是从内部许可软件公司转为企业级云公司,这意味着转型首先是围绕业务模式,从基于许可的软件公司转变为订阅软件公司。正如您所知道的,业务的增长非常迅速,转向私有更利于业务的增长,因为这在公有市场上很难做到,而这对公司的财务有影响。
从客户角度的看,转型是非常有好处的。云公司做得非常好,而且我们也在做的一件事就是从客户成功的角度來看待一切。一旦您拥有订阅业务模式,这意味着客户有可能把您关掉。如果他们有更好的解决方案,他们可以在一年或者六个月后关掉您。保持增值非常重要。A,确定客户采用了软件;B,他们对软件的使用感到满意,整合得很好,实现了他们的目标。我们公司自己的转型过程中,我们在客户成功方面付出了巨大的努力,因为这是推动订阅软件增长以及续订和公司保持成功的原因所在。
从客户的角度来看,由于我们对此非常关注,因此这种变化非常有利。对我们的客户有利的第二个原因是,即使我们转向私有,我们也保持了与公有公司同样的研发投入。我们15%的收入用于研发,我们一直保持了这种投资水平,因此,我们能够在这些新领域继续创新。
CIO.com:您一直从事的是安全市场。为什么要进入数据管理领域?
Chakravarthy:每个公司都开始转变为以技术为中心的公司,或者以数据为中心的公司。这对我们来说是很大的机遇。我看到了机遇。这是一个原因。第二个原因是我确信,要解决安全问题,最合适的层应在数据层。我长期以来从事基础架构安全工作,在这一层上,保护硬件设备,但是您对数据了解不够,您不知道什么对业务很重要。
公司在基础设施安全方面进行了大量投资,但仍不安全,有非常多的漏洞。我相信一个根本的答案,即正确的安全方法是在数据层。这是您可以控制的层面,无论是在内部还是在云中,这也是黑客关注的层面。他们不在乎是否能入侵您的硬件设备。他们想要您的数据。因此,安全的重点应转到数据层面。这就是我们一直在做的。我们一直在这方面进行投入。我们的数据安全产品在RSA会议上获得了11个奖项。而Informatica帮助我们,让我们能够一箭双雕。
CIO.com:您曾说数据安全是“一个悬而未决的问题”。我想知道您能不能再深入一些,多介绍一些关于Secure@Source的发布。
Chakravarthy:如果这个问题已经解决了,那就不会这么频繁的出现泄露事件。我自己也是董事会成员。几乎每个董事都对网络安全、数据安全有所了解。但大多数董事会成员还不清楚今后会怎样。他们接受采访,尽可能保持清醒。这是技术问题,很难。我之所以认为这是一个未解决的问题,主要是因为以前有很多投资已经投入到网络和基础设施安全领域,那时公司有明确的分界线,有明确的周界,有明确的数据中心,公司控制不了的数据量非常有限。
现在,正如您所知道的,没有周界了,大多数公司正在快速转到云端。几乎所有公司都在使用几十甚至几百个基于云的应用程序,这些应用程序都有自己的数据。我们认为,安全的第一步是您应该清楚的知道敏感数据在哪里。这个问题并不难,我对遇到的每个首席信息官都会问他们:您有多少数据库?看起来这么简单的一个问题,也得不到一个直接的答案。可以告诉我有多少路由器。可以告诉我有多少笔记本电脑。但不能告诉我有多少数据库?如果您不能告诉我有多少数据库,您怎么知道敏感数据放在哪里?这就是我所说的未解决问题的意思。
我们确信,解决问题的第一步是获取敏感数据所在位置实时、清晰的视图,以及企业里谁能够访问并控制这些数据。这是第一步,也是Secure@Source要解决的。这就是Secure@Source解决的问题。几乎就像给您张地图一样。有了这种视图后,它可以让您内部的谷歌告诉您敏感数据所在的位置,然后您应优先考虑谁拥有访问权限,如何确保其访问权限等等,然后才能查看视图。
CIO.com:您能谈一下关于帮助客户实现其大数据计划的策略吗?
Chakravarthy:我们把大数据视为既能存储数据又能处理数据的新平台。例如,Hadoop就是。我们为新的云平台提供云自有能力,我们提供与在Hadoop和NoSQL上运行的大数据功能相同的功能。换句话说,您拥有数据集成、数据质量、主数据管理、数据安全等功能,所有这些都运行在大数据技术上,例如Hadoop上的Spark。
给客户带来的真正好处是我们还提供迁移功能。换句话说,假设您使用我们的技术15年前在传统系统上开发了数据渠道或者数据供应链。假设您开发了数据,但计划将其从大型机系统中卸载,并将其转移到基于Unix的数据仓库中,并且您正在使用所有这些数据。我们将处理所有业务逻辑,自然地在大数据上运行,而无需重写所有这些逻辑。这是我们真正的优势所在,能够重用业务逻辑,能够重用客户已经拥有的产品技能,但是他们得到的基础平台是一个自然支持大数据的平台。
CIO.com:您认为谁是最主要的竞争对手?
Chakravarthy:在我们面临的竞争形势中,有三种类型的公司。有非常大的公司,数据管理是其系列产品中的产品线之一。例如像IBM这样的公司,他们有数据管理。这不一定是他们的核心重点领域,因为他们太大了,但他们在系列产品中的确有数据管理。和我们竞争的另一类公司专门提供一部分功能,或者专注于某一种平台。
例如在大数据领域,我们有像Hadoop这样的竞争公司。例如,我们与专注于某个特定生态支持系统或者一个特定平台的云计算公司相竞争,他们提供我们为该平台提供功能的部分功能。第三类公司专注于开发新的纵向应用。例如,有人可能会为生命科学行业开发整套应用程序,并把提供数据管理作为其中的一部分。这显然并不与我们端对端地100%重叠,但他们的确为他们提供的应用程序进行数据管理。
CIO.com:在与IDG新闻服务的一名记者讨论时,您曾谈到Dell Boomi是云领域最大的竞争对手。您只是把它们定位为云竞争对手?
Chakravarthy:是这样的。他们在专注于云,我们在云整合上和他们竞争。我们提供云数据管理,如云的主数据管理、数据质量、数据安全等,而他们并没有提供。但在云整合领域,我们与他们竞争。
CIO.com:最近我恰巧和Chris McNabb在Dell Boomi上讨论了同样的问题,因此,我想再多了解一些。您认为您与他们的主要区别是什么?
Chakravarthy:首先,我们是真正的混合。如果您要处理数字化转型等大问题的数据管理,那么仅有云这种方式是不够的。您需要的是真正的混合;内部部署、云、大数据平台,上述的任意组合。如果您是希望有数据管理合作伙伴的企业,那就是您所需要的。他们解决了一小部分难题。如果一个客户找到他们,他们将不得不为解决难题的其他部分而购买类似的工具,然后客户就成为系统集成商,把所有这些整合在一起。如果客户需要的是数据管理企业提供商时,这才是我们最大的区别之处。
另一个大的差异是我们在云中提供的组合功能。他们提供云整合,就像我刚刚提到的,即使在云端,只需要一个与Salesforce和Amazon一起工作的生态支持系统——您是否需要不同的工具来实现整合、数据质量和数据安全等,或者为生态支持系统提供一套综合的数据管理工具?
CIO.com:Informatica有哪些进展?
Chakravarthy:机会来临时我们感到非常興奋。我们的目标市场是首席信息官,数字化转型是他们的头等大事。我认为很多首席信息官还处在数字化转型规划阶段。我们认为首席信息官将成为首席数字官。越来越多的首席信息官们正在做的事情是运行数据中心和运行基础设施等,他们以某种形式进入云端,或者变得非常商品化,以至于不用自己去做这些事情。他们越来越重视数字化和数据,我们有能力为他们提供服务。
John Gallant是IDG US Media的首席内容官。
原文网址:
http://www.cio.com/article/3190592/leadership-management/why-data-quality-is-key-to-successful-digital-transformation.html