怎样为您的企业选择最佳自助服务的商业智能工具
2017-12-16MartinHeller
Martin+Heller
Domo vs. Power BI vs. Qlik Sense vs. QuickSight vs. Tableau:自助服务商业智能已经成为敏捷、流畅业务决策的首选工具。本文介绍怎样为您的业务选择合适的平台。
商业信息(BI)市场竞争非常激烈。历史上,Oracle和IBM这样的大企业都遇到了功能之争,试图证明由于功能而超出预算(而不是低于预算)的定价是合理的,这严重依赖于与客户密切接触进行推销。更糟糕的是,供应商希望您的IT部门与供应商自己的顾问合作,配置他们的产品,并将它们与您的每个记录系统集成起来,这往往需要额外的成本。
一旦安装并运行了传统商业智能系统后,管理人员就必须等待每周和每月的业务线报告,这意味着作出决策往往需要一个月的时间,还要加上一个月的执行时间。添加报告需要向工作堆积如山的IT部门提出申请,可能要数周甚至数月的时间进行设计和编码。
2004年自助服务商业智能的推出改变了所有这一切,我在本文中介绍并对比的五个平台充分展示了这种改变——Domo、Power BI、Qlik Sense、QuickSight和Tableau。之所以向自助服务商业智能转变,部分原因是能够在几天内而不是几个月内做出业务决策。近来,云计算和高速互联网接入成为自助服务商业智能的关键技术推动因素。
当然,传统的商业智能仍然存在——虽然有所减少。特别是财务报告要求100%的准确率,通常需要几周的时间才能生成报告。尽管一些较新的平台试图完全取代传统的商业智能系统,但报告却是一种比较特殊的应用情形,强调交互式视觉发现的自助服务商业智能产品并不能总是很好地为这类应用提供服务。
与此同时,传统的商业智能平台也在发展。有些增加了足够的自助服务、视觉发现和分析功能,以满足现有客户的需求。
自助服务商业智能平台的选取标准
在选择自助服务商业智能平台时,关键是自己进行评估,因为供应商兜售的很多功能对您的企业可能没有真正的用处。例如,如果您的公司已经拥有一个高性能的数据湖,那么您可能不愿意为了要求把所有数据导入到他们存储库的商业智能平台而修改自己的数据湖。类似地,您可能想把商业智能系统与已经在用的协作平台相集成,而不是使用专用的商业智能协作功能,因为不太可能要求员工同时使用两个协作系统。
如果您的大部分数据是在Azure上,则不会使用仅在Amazon Web Services上运行的商业智能系统,反之亦然。如果可能的话,出于性能的考虑,您希望将数据和分析合并在一起。
供应商倾向于引用对他们产品最有利的分析报告。不要相信供应商的略读摘要,也不要相信他们展示给您的图表:您应该要求阅读整个报告,其中会有警告和缺点,以及优点和特点。同时也要充分考虑到分析师报告中包含的事实:相对于不是他们客户的供应商而言,大多数大型分析公司对付款客户更感兴趣,尽管个别分析师真的是想做到公正和中立。
以下是评估自助服务商业智能平台的七个主要关注点。
数据源
您应确保商业智能平台可以读取所有数据源。其次,您應该知道这个平台在处理数据之前是否必须将数据导入到自己的存储库中,它是否能够随时处理数据查询。
如果必须导入数据,其分析速度是否足够快,能够满足导入时间要求?商业智能系统能自动更新原始数据源的数据吗?
如果在商业智能系统中数据存储需要付费,那么您应该尽可能的想好——5年内会有多少数据,将其乘以3,再想一想。储存的费用会影响你的预算吗?
另一个关键问题:商业智能系统能在数据所在的位置运行吗?如果不行,移动数据会有多困难?
数据转换
收集上来的数据总是有问题的。某一行可能会丢失字段,字段也可能包含无意义的值。某一行中的多个字段可能有相互不一致的值。文本字段可能含有拼写错误、拼写变体或者术语变体,使其不能自动组合在一起。有些字段,特别是自由格式的注释,可能很长,而且用处不大。
此外,字段可能是非参数的(文本),需要被编码为用于分析目的的数值,尽管一些商业智能系统能够在内部自动完成这一操作。字段的数值范围可能有数量级的差异,需要规范化。数值可能需要从其他数值中推断出来,例如,如果源数据中没有性别,则可能需要从名字和/或称呼中推断出性别。
商业智能系统可能要求您编写SQL SELECT语句,或者它自己执行导入操作。如果它要求您编写数据库查询,它能否帮助您选择字段并创建连接?
这些以及其他问题意味着您应该先在您的一些数据上试用商业智能系统。在查看和绘制数据时,构建一个提取/转换/加载链。看看它有多容易,或者多难。将其与其他商业智能系统进行对比。不要低估在清理分析数据上花的时间,这很容易占到总分析时间的80%。
分析能力
您需要以几种方式来分析清理后的数据。在最简单的层面上,您以各种格式绘制数据,并对历史数据和趋势进行简单的统计分析。除此之外,您还需要深入挖掘数据以了解具体的特性,并构建模型来测试您对原因的猜测。最后,您可能希望根据统计模型,甚至机器学习模型来预测未来绩效指标(销售和库存需求)。
您将遇到的一个功能难题是关于所提供的图表类型的数量。当所宣传的图表类型不适用于您的数据时,通常是毫无意义的。另一方面,一些图表类型很重要:例如,我不愿意使用没有地理显示支持的系统,因为查看位置表中的原始数据并不像在地图上看到不同颜色或者不同标识那样有视觉和直观的感觉。
对分析的支持是另一个功能难题。是的,您绝对应该能在商业智能平台上进行简单的统计操作,至少可以包括回归模型。还有就是可能是与用户的需求不匹配。
例如,为研究商业智能分析选项添加机器学习和深度学习支持,这对于管理人员和业务分析师来说可能根本用不着。再有就是数据科学家,他们通常有专门的专用工作空间来创建机器学习模型和深度神经网络,使用的工作流程通常要求比典型的商业智能用户流程有更多的统计知识和编程技能。endprint
另一方面,分析普通数据模式的自然语言支持和内置智能特性使一般用户更容易使用平台。把机器学习应用于用户体验往往是好事——即使要求业务分析师培训深度学习模型起不到什么作用。
一些商业智能平台现在使用内存数据库和并行操作来加速查询。未来,您可能会看到并行度更高的GPU数据库内置在商业智能服务中——第三方正在构建这些数据库,其发展速度非常快,令人印象深刻。
在分析过程中,您经常需要修改或者增加数据转换,例如,在财务分析中经常添加反映其他列之间差异或者比率的列(例如,债务/权益)。这样的修改有时会改变从ETL(提取、转换和加载)管道到ELT(提取、加载和转换)的导入过程。有些供应商只支持ETL或者ELT的一种,但大多数使用ETL的商业智能系统在分析步骤中都有进行额外转换的配置。
易于学习和使用
尽管面向的是管理人员和业务分析师,但自助服务商业智能系统是非常复杂的,有许多移动部件。在我试用过的商业智能平台中,用户体验和学习材料的质量差别非常大。试着让几个技能水平各异的潜在用户参与您的评估,看看他们的反应怎样。还一定要测试文档本身。最好的文档在搜索、索引、组织等方面与最差的之间存在着巨大的差异。经历了百般努力但却失败之后,我经常不得不要求销售工程师为我找一本教程。
灵活的演示
有些商业智能系统在实际选择变量时显示出相当翔实的图表。其他商业智能系统等着您去点击您想查看的图表类型。如果您知道自己想要什么,需要什么,两种方法都可以;如果不是,最好是系统能够根据您选择的变量的数量和类型,为您提供帮助。
通常,商业智能系统会区分度量指标,它们通常是数值型和维度,这可以是非参数化的。某些维度,例如城市、州和国家,可以转换为纬度和经度等度量指标。有时,您想看到维度限定的指标,例如“按产品显示我们的利润率”或者“按照商店显示我们的同比销售额”,还有的时候,您想看看受其他度量指标限定的指标,例如,“显示中西部所有商店的利润和销售额。”
一旦您看到了有意义的图表,您通常希望放大查看特定的特性,调整显示,添加注释。商业智能系统在这方面有很大的不同,所以值得做这种练习。
协作选择
您实际可以共享的内容因系统而异,还与您是否希望与完全授权用户、只读注册用户或者未注册用户共享有关。在某些情况下,只读用户可以对您提供的图表进行排序和筛选;在其他情况下,他们只能看到从您的分析中生成的幻灯片。
这种区别通常会影响您是否能够为您的整个公司或者部分特定的用户提供商业智能产品,当然还有价格因素。
成本和优点
我所说的成本并不仅仅指供应商的年度费用,还有存储您数据的成本,在本地或者在云中托管平台,以及培训您员工的费用。优点包括做决定时不需要太多的投入和时间,而且能做出更好的决定,最终提高了利润,实现了增长。
目前最好的自助服务商业智能工具
考虑到这些因素,让我们来看看5个在市场上领先的商业智能平台(按字母顺序)。
Domo
Domo是一款在线商业智能工具,它结合了大量的数据连接器、ETL系统、统一的数据存储、多种可视化功能选择、集成社交媒体,以及报告。Domo自称不仅仅是商业智能工具,因为其社交媒体工具能够带来“可操作的深度分析”,但在实际中,每一款商业智能工具要么带来有利于业务的活动,要么被扔到垃圾堆里。
Domo是非常优秀而且功能强大的商业智能系统。其突出之处是,大量的数据源和大量的图表类型,并且集成社交媒体功能也非常好(可能有些夸大)。但是,Domo比Tableau、Qlik Sense、QuickSight和Power BI更难以学习和使用,对于企业版来说,专业版每年每用户费用为1,920美元,企业版每年每用户费用为2,280美元,价格更贵。
根据您的需要,Tableau、Qlik,或者Power BI可能是比Domo更好的选择。
Power BI
微软进入自助服务商业智能领域的产品是Power BI,包括托管在Azure上的服务Web界面,和Windows桌面的Power BI桌面应用程序。它比竞爭产品要便宜得多:一个标准账户是免费的,一个专业帐户每用户每月为9.99美元,而Power BI桌面是免费的。
网站和桌面应用程序都会定期更新。Power BI桌面每月更新一次;很难确定网站什么时候更新。
对于某些数据源,Power BI提供预定义的图表、仪表板功能和报告。例如,默认的Visual Studio Online仪表板功能和报告提供了您为账户配置的项目的Git、pull申请,以及版本控制活动的简要试图。对于其他数据源,Power BI希望看到其数据的某些标记。例如,它支持Excel工作表命名的表、Excel数据模型表和Power View表。如果只在Excel工作表中有原始数据,则需要返回到它并创建一个或者多个命名表;应在导入之前确保数据类型是正确的,这也会有帮助。
对于使用Windows、Office和Azure生态支持系统的公司而言,Power BI是合理的选择。对于那些想为公司每个人都提供商业智能服务,而对成本敏感的公司来说,这也是一个不错的选择。另一方面,Power BI并没有像Qlik Sense或者Tableau那样提供更多的分析功能,对图表的控制功能也不强。。
Qlik Sense
Qlik有一个“Mode 1”,即QlikView提供的传统的商业智能产品,通过Qlik Sense已经扩展为自助服务商业智能。Qlik Sense于2014年推出,是一款基于与QlikView相同的内存关联数据索引引擎的自助服务商业智能和可视化产品。2016年,Qlik在Qlik Sense中增加了它的报告引擎,而这以前只有QlikView才支持。endprint
Qlik Sense 2.0是一款非常强大的数据发现和交互式分析工具。它可以连接到几乎所有的SQL数据库,能够很好的控制可视化功能。然而,与Tableau相比,它学起来并不容易,也不太容易使用,展现视觉效果也不如Tableau灵活。
商业智能的数据导入通常是一个混乱的过程。Qlik Sense 2.0会尝试关联不同表格中名称相同的字段,还会比较数据并提供有关类似字段的建议。这一新特性被称为智能数据加载。
Qlik Sense 2.0還引入了Qlik DataMarket,这是公共和商业可用数据的来源,分为六个类别:业务、货币、人口、社会、天气和经济。在分析私有数据时,拥有公开数据会有很大的帮助。
Qlik通常采用压缩格式将数据保存在内存中。然而,有些时候,您有太多的数据要放到可用内存中,在这种情况下,Qlik Sense可以使用“直接发现”模式,它根据需要把内存中的数据与数据库内的数据结合起来。在直接发现模式中,一些字段仅作为元数据/符号表加载到内存中,可以在表达式中使用这些字段。需要时查询驻留在数据库中的实际数据。
在使用Qlik的时候,您可以把书签保存到当前表单的当前所选状态中,可以把书签合并到故事中,并添加文本和其他注释,使故事很容易理解。如果您使用故事进行现场演示,您可以深入到任何可视化数据源中,以便能够回答问题,然后当您回答问题时再回到故事中。
Qlik提供联想绿色-白色-灰色体验,所显示的数值的颜色表示了状态(已选-可选-不可选),这能够帮助您发现相关和不相关的数据,而无需挖掘数据——这是非常好的体验。我也喜欢Qlik定义表达式的方式,但与我同样喜欢的Tableau有所不同。Qlik Sense可以很好地控制可视化的效果——比Microsoft Power BI强,但不如Tableau好。
QuickSight
Amazon QuickSight完全运行在AWS云中,能够很好的访问亚马逊的数据源,也能够公平地访问其他数据源,并以基本的价格提供基本分析和数据处理功能。对于这里讨论的其他产品,QuickSight最接近Power BI,只是没有依赖桌面产品来创建数据集——或者Power BI桌面/服务组合提供的分析功能。
与Power BI、Qlik Sense和Tableau一样,QuickSight能够连接至多种数据源,支持您准备数据集。一旦有了数据集之后,您就可以使用一个或者多个可视化功能来创建分析,将其组织到仪表板功能和故事中。您可以在公司里分享数据集、仪表板功能和故事。QuickSight使得这个过程非常简单直观,但它缺乏竞争工具所提供的一些有用的可视化功能。
一个公司的第一个用户永远是免费的,一个有四个用户的部门免费试用60天。除了试用用户之外,其他用户标准版每月费用为9美元,企业版每月费用为18美元。
第一个QuickSight用户获得1GB的SPICE(超高速并行内存优化计算引擎)存储,其他用户包括了10GB的SPICE。对于额外的SPICE内存,标准版的费用是每月25美分/GB,企业版是每月38美分/GB。企业版还添加了安全数据加密,可以连接至您公司的AWS活动目录。
SPICE是QuickSight的高性能内存数据存储库,用于可视化对象,这对于从文件导入数据时是必需的,而对于SQL数据库中的数据则是可选的。SPICE表格每个被限制为10GB。
对于一个拥有许多托管在AWS上的数据源的部门,考虑到有限的分析需求,有限的开发时间,因此,使用QuickSight似乎是显而易见的。QuickSight增加了简单的分析和可视化功能,但费用很低。
Tableau
Tableau将其产品描述为“以您的思维方式去分析”,并说这些工具利用了“人们快速发现视觉模式的自然能力,发现每天出现的机会和灵感。”这里有一定的道理,尽管您可以对许多其他商业智能工具说同样的话。
分析工作流程的视觉发现阶段是最让人感兴趣的部分,但大多数人不会把大部分时间花在这里。据我的经验,导入和调理数据很容易占用您使用商业智能产品的80%的时间。
现在,Tableau可以进行跨数据库连接,如果您想导入多个数据源,并加到数据库中,那么您可能会将大部分数据源托管在数据仓库中——如果您的公司足够大(或者足够有钱),能够拥有一个数据仓库。
然后,您可能会逐行筛选和调理您的数据。最后,您将开始创建可视化对象,比如上面的屏幕截图——尽管在进行尝试时,不得不执行额外的数据转换,这并不少见。但是,数据调理和转换很容易在Tableau中完成,当然也很容易在Excel中完成。不需要回到导入阶段来添加计算字段,或者筛选数据。
Tableau中的视觉发现功能非常强大,Tableau为方便这些功能的实现以及图表显示的精细控制而设定了标准。通过单击或者拖动感兴趣的维度(通常是离散类别或者特性)和度量指标(数值),并自己选择一个标记(显示类型,例如条形、线条和点),或者使用自动标记选择功能,使用“show me”方法来选择可视化对象,从而构建Tableau可视化对象。
为了更好地进行控制,可以把维度和度量指标拖动到特定的标记特征或者“架子”上。当知道了分析中发生了什么时,您可以和其他人分享仪表盘功能和故事。这很容易通过发布到Tableau Server或者Tableau Online上完成——不管您是在Tableau Desktop上工作,还是需要上传,或者您已经在网上进行分析了。
Tableau的定价非常有竞争力——至少与Qlik和Domo相比。个人版:每用户每月35美元;专业版:每用户每月70美元;Tableau Server:每用户每月35美元;Tableau Online(完全托管):每用户每月42美元。
然而,我必须指出,微软的Power BI提供了大约80%的Tableau的功能,而价格是其25%。当考虑到劳动力成本和对公司的利益时,这种考虑是否能站得住脚,您必须根据自己的情况做出决定。
Martin Heller是InfoWorld的特约编辑和审稿人。他曾是一名网络和Windows编程顾问,1986年至2010年间开发过数据库、软件和网站。他最近担任的职位是Alpha Software的技术和教育副总裁,以及Tubifi的董事长兼首席执行官。
原文网址:
http://www.cio.com/article/3235394/business-intelligence/how-to-select-the-best-self-service-bi-tool-for-your-business.htmlendprint