甲骨文:那些与企业数据平台相关的问题
2021-05-26丁海骜
丁海骜
“今天大家都听说过中台的概念,后来又听到一个去中台的概念,我觉得中国的客户也挺辛苦的:一个概念的产生,在于你要解决什么问题,如果你要解决的是一个数据平台的问题,那么今天数据平台的核心问题不是中台或者去中台,而是你用最简单的方法,用人工智能的方法,用比较低的入门的门槛去解决这个问题。”2021年3月,甲骨文CIO研讨会期间,甲骨文公司副总裁及中国区云平台总经理吴承杨接受媒体采访时谈到了甲骨文的“敏捷的业务数据平台”,认为其是目前解决企业数据平台问题最直接手段和工具。
吴承杨介绍,甲骨文的敏捷的业务数据平台,核心部分是Oracle ADW业务数据平台。其中,ADW是Autonomous Data Warehouse的缩写,“Autonomous是无人驾驶,Data Warehouse数据仓库,无人驾驶的数据仓库。”吴承杨说,基于甲骨文自治数据库的Oracle ADW业务数据平台,不仅能够完成数据的抽取,而且可以对数据进行分析:“所以你看,利用这样一个敏捷的数据平台,最重要的一点价值,就是可以让用户所谓的数据分析、应用的门槛大大下降了。”
Oracle自治数据库是在2017年10月推出,是拉里·埃里森口中“确保99.995%的可靠性和可用性”的“世界第一款自治型数据库”。Oracle ADW业务数据平台是在此2年后,2019年10月推出,旨在基于自治数据库包括自治驾驶、自治安全和自治修复等数据库管理、维护的功能基础上,解决企业现实业务问题:其针对业务部门的企业用户,通过ADW整合企业内部的多个数据源并直接构建对数据的使用模式,从而实时数据分析和报表,帮助业务部门及时、准确地掌握业务动态,实现让数据更贴近业务,并真正服务企业业务。
2021年3月18日,Oracle ADW业务数据平台实现了最新一次的更新。新闻稿显示,在这一新版本有两个最大的两点:其一,是Oracle ADW业务数据平台为企业提供了统一的数据平台,来提取、转换、存储和管理任何来源的所有数据,用于运行部门级系统、企业级数据仓库和数据湖等各种分析负载。其二,是甲骨文将云数据仓库从产品、工具、任务组成的生态系统,由过去需要投入大量专业技术、时间和资金,以执行数据加载、数据转换、数据清洗、业务建模和机器学习的状态,转变成可供数据分析师、大众数据科学家和业务用户轻松使用的点击式、拖放式体验。
“如果你今天有一套房子要装修,你会发现装修材料是很多种的:有木门,有地板,可能有水电,还有水泥,黄沙……与之相对应,就有不同的工种,木工、泥水工、电工。我们必须有能力把所有这些人都管理起来,才能完成一次装修。”吴承杨认为,今天企业在数据管理过程中遇到的问题与装修有相同的难题:数据格式越来越多,企业就需要用各种不同的工具来处理不同类型的数据:“如果是JSON格式的数据,企业往往会用Mongo DB来处理;图形、空间的数据会用高德来处理;文本数据可能会用Document DB,分析可能会用Gauss DB来处理……为什么没有一种所谓一站式的解决问题呢?Oracle今天的理念,就是一站式解决问题:无论是什么数据类型,关系型、图形、空间、文本、AP、TP……甲骨文只用一样东西来解决,SQL。”吴承杨说,用SQL来一站式解决数据管理的问题,实际上是“把所有解决问题的难度,下降了10倍甚至更多”。
在Oracle ADW业务数据平台框架下,通过统一的平台来提取、转换、存储和管理数据,实际上完成的仅仅还是IT层面的工作,更核心的价值体现在于:如何通过通过对数据的分析和应用,将其与企业的现实业务进行更深层次的融合。
“借助新一代Oracle ADW业务数据平台,我们将能提供更简单易用、无需使用代码的工具,赋能商业分析师也能成为数据科学家、数据工程师和开发者。”甲骨文公司数据库服务器技术执行副总裁Andrew Mendelsohn通过新闻稿表示,新一代Oracle ADW业务数据平台将提供Oracle APEX应用开发及RESTful服务。其中,Oracle APEX应用开发是一款直接内置于Oracle数据库的低代码应用开发工具,而RESTful服务则可支持任何现代应用与仓库数据进行交互。正是由于这些新功能的加入,“Oracle ADW业务数据平台可基于一个统一的现代融合数据库引擎满足多模型、多负载和多租户需求,提供JSON文档、运营、分析、图形、机器学习以及区块链数据库等多种服务。”
具体来看,根据甲骨文公布的功能细节,在新版Oracle ADW业务数据平台上,至少提供了七个功能来帮助用户实现对数据价值的发掘:其一,是通过内置数据工具。业务分析人员只需通过简单的拖放操作,即可在笔记本电脑或云中实现加载和转换数据,进而由系统自动生成业务模型,快速发现数据中的异常值、离群值和隐藏模式,并了解数据相关性和更改的影响。其二,平台提供Oracle AutoML UI机器学习。AutoML使用界面可在创建机器学习模型时自动地执行耗时的步骤,从而提高数据科学家的工作效率、改善模型准确性,甚至让非专业人士也可使用机器学习。其三,Oracle Python机器学习。数据科学家和其他Python用户可使用Python在其数据仓库的数据上应用机器学习,从而充分利用Oracle ADW业务数据平台的高性能、并行功能和30多种原生的机器学习算法。其四,Oracle机器学习服务。DevOps和数据科学团队可以在Oracle ADW业务数据平台外部署和管理數据库内的原生模型、ONNX格式分类、回归模型,并能调用认知文本分析。其五,属性图支持。现在用户可在数据仓库中创建图形、使用PGQL(属性图查询语言)查询图形,并且能使用超过60种内存中图形分析算法分析图形。其六,Graph Studio用户界面。在Oracle ADW业务数据平台平台上,用户可以利用其属性图功能构建Graph Studio,从而帮助新手轻松进行图形分析,其自动化建模、集成可视化和预构建工作流等,适用于多种使用场景。其七,无缝访问数据湖。
“云数据库,首先云是云,数据库是数据库,现在把数据库放在云上,实际上最重要的是数据库变成一种服务——我认为:数据库变成一种服务是一个趋势,因为并不需要这么多人懂数据库,只要用数据库就可以了。这就像你并不需要知道电是怎么发出来的,只管按需用电,按量付费就可以了。云数据库也是一样:企业用户只要关注自己的业务,数据库的事情交给数据库的公司做,专业的人做专业的事情。”吴承杨说。