POLARDB数据库,阿里云的自信源自哪里
2018-07-22焦旭
焦旭
“你好,我是阿里云数据库团队负责人,我叫鸣嵩(曹伟)。”初次见面的印象,让笔者觉得鸣嵩并不像一个IT男,形象阳光、精神抖擞、嘴角带着一点点微笑。就在笔者还在回味《复联3》中小蜘蛛和奇异博士有关“花名”的梗时,鸣嵩让我有了新的认识。
采访过程中,鸣嵩的语速一直很快,语言简练,思维清晰,不断出现的术语和数据说明了他的专业性,喜欢列举实例。整个人总是带着一股浓郁的自信。好像,每一个阿里人都是那么的自信。
那些在一线才知道的
一位工作在云数据库一线的开发和运维人员,在云栖社区做了以下分享:
“我在4天前,手工做了一个备份,数据库比较大,3T,你们说差不多要70个小时备份,这个…有没有什么办法加快一点,我老板还着急要数据呢”
“你好,我们公司有个数据库,想迁到阿里云RDS上,对RDS的产品品质我们很满意,只是我们的数据库有10T,请问一下,支持这么大的实例么?”
“你好,我用了你们的MySQL数据库,最近几天在做活动,主库压力比较大,只读实例就延迟了,现在看过去貌似很难跟上,有什么办法么?”
这些抱怨也好,吐槽也罢,都来自云数据库用户的真实案例,总结起来,传统的云数据库由于自身架构原因,会遇到很多问题:
读写实例和只读实例各自拥有一份独立的数据,用户购买只读实例,不仅需要付出计算的成本,也需要付出存储资源的成本;新建一个只读实例需要重新拷贝数据,考虑到网络限流,速度不会很快;传统备份技术,由于涉及到拷贝数据,并上传远程存储,速度因此也受网络影响等等。
随着数据库数据量的增大,各行各业对云数据库业务的需求增加,这些问题就会不断加剧。鸣嵩说:“这些困扰大家已久的问题, PolarDB都可以从本质上解决,而不是想个trick绕过去。”
核心优势有5个
PolarDB是阿里云数据库团队过去3年间自主研发的一个企业级数据库。鸣嵩总结了其5大核心优势。
第一,兼容性。PolarDB兼容了当下最主流的、开发者最喜欢用的MySQL和PostgreSQL两种数据库生态,这意味着MySQL和PostgreSQL的老用户,在一行代码不用改的前提下,可以把业务从原来的开源数据库迁移到阿里云的企业数据库平台上。
鸣嵩说:“从第一天起,我们做任何东西,不接受99%的兼容,我们只有100%的兼容。这是不会妥协的。”
第二,性能好。对比MySQL有6倍性能提升及相对于商业数据庫实现大幅度降低成本。拿Sysbench跑Benchmark做测试,开源的原生数据库性能是每秒3.5万的TPS,PolarDB的性能可以达到22万,有6倍的提升,但是价格不变。
第三,容量大。传统的数据库会受限于物理机能的磁盘大小,数据增长后面临着要么扩容,要么定期迁移,这种方案不仅开发成本高,还会造成业务中断。PolarDB则支持单库容量扩展至上百TB以及计算引擎能力及存储能力的秒级扩展能力。
第四,技术更新换代。云数据库的发展趋势出现了一种更好的模式,Serverless按使用量付费。看起来只是计费模型的一种变化,事实上对技术本身有很大挑战。Serverless意味着弹性扩展、调度能力、资源隔离需要做得更加精细,使得能够支持这种计费模式。
鸣嵩直言:“PolarDB的目标就是从过去云计算的1.0时代走向云计算的2.0时代。数据库从经典时代走向Serverless时代。“
第五,一写多读。鸣嵩以淘宝为例,介绍道:“电商业务,读的压力要比写的压力大很多,传统的‘一主多从模式存在空间浪费和扩容时间长的弊病。”
PolarDB让“一主多从”共享统一一个数据副本,同一个实例的所有节点(包括读写节点和只读节点)都实现访问存储节点上的同一份数据,使得数据备份耗时实现秒级响应,实现了无缝扩展,不管数据量有多大,几分钟内即可实现只读副本扩容,以及数据的全量备份。
何谓国之重器
据了解,PolarDB发布以来,在公有云上已经累计了超过600家用户,涵盖金融、电商、游戏、IoT等各行各业。
在被问及为何阿里云在已经拥有关系型数据库的情况下,仍旧开发出PolarDB时,鸣嵩表示:“企业级数据库一定是国之重器。”
鸣嵩介绍道,企业级数据库,往往要求零宕机,7×24小时的可服务性,数据绝对不能丢。这是对数据库技术更苛刻的要求,同时还需要高安全性和无限扩展能力。“PolarDB的目标就是将来能在有关国计民生的行业、金融产业或者政府核心业务中用上国产自研的数据库。我认为,这是我们这一代做数据库技术人的使命。”
此外,鸣嵩还指出一种技术趋势。过去十年,大量互联网企业为了解决业务发展数据膨胀的问题,都在使用一类基于Share Nothing架构做水平扩展的数据库,演化出了很多NoSQL和NewSQL产品,但这类产品都有对使用场景的假设和限制。而ORACLE、DB2、Aurora、PolarDB这些企业级的通用数据库,都在使用Share Everything共享存储技术。鸣嵩判断,在未来的5年之内,随着云时代的到来,随着企业级云数据库的兴起,Share Everything基于共享存储架构的数据库会成为新的热点。
性能源于对硬件的诉求
为了追求性能的不断提升,技术人员对于硬件的诉求也在不断提高。鸣嵩介绍了PolarDB所采用的领先的硬件技术:包括使用3DXpoint存储介质的Optane存储、NVMe SSD和RoCE RDMA网络。同时面向新硬件架构实现软硬一体优化:从数据库、文件系统到网络通讯协议、分布式存储系统和设备驱动,实现纵贯软件栈各层次的整个IO链条的深度优化。
谈及Optane存储卡,鸣嵩毫无吝啬地给了一个赞,他表示:“3D XPoint介质比NAND颗粒提供了更好的I/O延迟和I/O QoS稳定性,因此在数据库整体QoS上我们在95%延迟的指标上提升了76%的性能。我个人认为这也是非常有工匠精神的一个介质、一个产品。如果说SSD把HDD延迟降低了一个数量级,3D XPoint又把SSD降低了一个数量级”
鸣嵩认为,Optane很可能会打破传统的Memory金字塔体系,过去的模型是CPU、内存、SSD的三角形结构,内存是很快的但是比较小,掉电会丢;SSD是很大,延迟比较高,吞吐有限,但是掉电数据不会丢。而Optane在这个体系中加入了一层Apache Pass或称之为NVDIMM(非易失性随机访问存储器)。新的体系变成了CPU、内存、NVDIMM和SSD,新加入的结构,性能和内存很接近,而且空间可以很大,掉电不会丢。
最后鸣嵩表示,Apache Pass未来很大程度上会改变数据库软件,也意味着数据库的性能可以再向上提高一个档次。