TigerGraph:基于图数据分析的“炼油厂”
2019-05-24王永
王永
Gartner研究报告显示:图数据库市场将会在2019年-2022年以每年100%的增长率增长。其中2018年图数据库市场大概是5亿美元,到2022年保守估计至少80亿美元,这是非常巨大的、快速增长的企业级市场。
“很多人听说图数据库第一反应都会联想到存储照片,” TigerGraph创始人兼CEO许昱博士做了解释。抽象角度来看,作为一种数据结构,图的核心是点和边。点代表实体,边代表把实体关联的关系,这一点和传统的关系数据库不同。关系数据库用表来做存储和计算的模型,而图数据库是用来做计算的存储和模型。总的来说,图分析就像是传统的BI分析,传统的分析基于表状的数据做分析,图分析是基于图关联的数据做分析。
“原生”与“并行”
与大多数创业公司前期开发与商业共存策略不同的是,TigerGraph前六年的时间一直在专注于开发。
“近6年的开发,练就了TigerGraph的独门武器,”在许昱看来,TigerGraph的优势体现在三个方面:第一,利用分布式技术,TigerGraph可以扩展高性能,支持万亿级的节点。第二,基于高级别的开发工具,为用户提供简洁便利的操作界面。第三,通用的工具型设计,能够适合任何行业。
目前,作为一家专业的图数据库供应商,TigerGraph已经成为市场上唯一一家提供可扩展的企业级图数据库公司。
“不到一年的时间,TigerGraph从没有任何名气到推出产品,已经有不同行业的大企业在采用我们的产品,”在许昱看来,这正是来自于TigerGraph绝对的技术优势。
事实上,在过去的大部分时间里各个行业的企业在使用图数据库都会面对这样一个难题——不能扩展到多机,也不能处理大数据,这也导致了很多市场应用只能处在研发阶段,甚至是不能上线。作为市场上目前唯一可扩展的企业级数据库公司,TigerGraph快速显露手脚。
如果说,TigerGraph的技术到底有哪些不同?又或者说,为什么只有TigerGraph是唯一可扩展的?许昱给出了两个关键词:原生与并行。
“原生的层面,是基于TigerGraph用近5年多的时间打造了一套专门针对图数据库的底层架构,没有用关系数据库做存储、计算,也没有用其他的开源工具再搭一层图的API。并行则是与传统的图数据库供应商相比,他们使用的仍然是15年前的技术,没有分布式系统以及大数据的运作。而TigerGraph是从分布式出发,结合并行处理技术,提供更加强大的性能。” 许昱如是说。
伴随着越来越多成功案例的出现——平安科技、招商银行、中国移动、中国联通、国家电网……人们对于TigerGraph的原生与并行的理念也越来越认可。TigerGraph正在从创业初期的默默无闻以完全加速的状态在市场上冲刺。
共存、做增量是主旋律
毫无疑问,近几年图数据库正在以黑马之姿席卷市场,而关于传统的关系数据库与图数据库的市场竞争问题也愈演愈烈。不过许昱认为,从现在阶段来看,两者之间还没有形成直接的竞争关系:一方面是,TigerGraph关注更多的是空白市场,做别人不能做的。另一方面是,TigerGraph主要做的是增量市场。
图数据库跟别的市场也是相邻的,传统关系数据库和复杂的业务将来可以移过来,以前是因为关系数据库不能做到实时的深层多步关联数据的查询,可扩展性不行,所以没有办法,只能转移到功能反而更低级的NoSQL去。
“我们不是说一来就替代关系数据库,我们是做它根本做不了的,做一些很有影响力的新项目。但是很多用户用了以后可能会把以前一些数据仓库,一些应用场景自己慢慢迁过来,但是这不是我们的切入点,这是用户自己用熟了我们的产品的结果。例如,以前做报告,两个星期才能生成的报告,5个小时才能生成的报告,用TigerGraph可能变成几秒、几分钟。”许昱表示。
据了解,TigerGraph最近两年一直保持着高达三倍的增长,增长的速度远远超过了市场的平均增速。
谈到TigerGraph的下一步計划,许昱做了三个总结:第一,更清晰的产品聚焦,继续技术创新。第二,在云服务里面发力,目前TigerGraph Cloud已经推出邀请版本,在美国、欧洲试用,计划在2019年年底正式发布。第三,继续在图的可视化工具方面进行创新——通过拖拽的方式,自动生成查询语言,实时反馈结果。
“不过当前对于TigerGraph来说,首要解决的依然是人才的问题。”许昱表示,人才教育是TigerGraph施展接下来计划的重要前提。为此,TigerGraph将会展开一系列的在线和离线的教育培训以及认证系统,让大家把用图分析成为本能。
写在最后
在大数据时代,人们把数据比做是新的石油,而许昱则是把TigerGraph定位于基于图数据分析的新的“炼油厂”。“TigerGraph的愿景是立志成为图数据分析的NO.1,让数据科学家、开发者以及商业用户有能力把复杂数据关联起来,并从关联的数据中获得深度的洞察力。”