且看群英共舞 奏响数据华章
——记天津南大通用数据技术股份有限公司总经理武新
2018-09-29□刘佳
□ 刘 佳
“让世界用上中国的数据库”,是自2004年成立至今,天津南大通用数据技术股份有限公司(以下简称“南大通用”)始终牢记的使命。正是基于这份使命感,公司总经理兼首席技术官武新带领核心研发团队历经10年磨砺,以市场需求驱动核心产品的研发,在国际数据库软件群雄割据的状态下突破技术壁垒,凭借自主品牌GBase数据库系列产品走出一条独特而卓越的创新之路。
构建世界首个基于融合架构的关系与非关系模型、OLTP与OLAP融合的平台产品,是这家企业阐明优越价值的开始;凭借GBase数据库系列产品和技术,以亚太地区唯一一家独立软件公司的身份入选世界顶级咨询机构Gartner魔力象限,是它备受领域肯定的表现之一;连续5年在赛迪顾问发布的《平台软件市场研究报告》中勇夺国产数据库销售额桂冠,打破了国外数据库厂商对国内市场的长期垄断局面,是市场对由它所形成产业影响的高度评价。
数年来,南大通用始终瞄准数据库高新技术、产品的研发工作,在多地区、多行业成为了颇具影响力的代表:
世界500强企业中,中国地区的占有量为160家,其中大约平均每5家企业便有一家在使用南大通用的GBase数据库产品;
GBase客户横跨金融、电信、电力、轨道交通等行业,涉及政府社会安全、监管机构和各个类别的大中型企业。仅2017年一年,GBase数据库系列产品已在国内领域达到40%的市场占有率;
超越国际同期产品,构建起中国金融行业内最大的数据仓库——农业银行大数据平台。作为世界首例PB级数据量的双活数据库集群,其已连续、稳定运行逾1000天,总数据量超过20PB,且仍在以每年5PB的数据量持续增长;
…………
尽管在外界看来,在10年的研发之路上,南大通用所锻造的每一颗硕果都足够鲜活、富有说服力,但身为总经理、技术领头人的武新却认为还远远不够,“我们跟国际大企业、全球化公司相比,规模差距还很大,在高科技领域的社会价值认可度还不够”。正视企业发展不足,作为一家致力于数据库基础软件研究和大数据核心应用的公司,南大通用不但要成为跨进尖端软件开发领域的高新技术企业,更要成为让国人骄傲、受国际尊重的世界级企业!
时势造英雄 远见驭革新
数据对于大多数人而言并不陌生,尤其是在当今的信息化时代,个体与群体、单一机构与连锁式企业每时每刻所喷薄的数据量数以亿计。当海量数据来袭,大数据和云计算的概念被人们逐渐熟知,数据库连同数据处理技术研究也被社会寄予更高的期望。
“其实‘云计算’和‘大数据’是一个硬币的两面。云计算改变了用户对IT资源的使用模式和习惯,提升了资源的使用效率和灵活性,优化了IT的投入产出。而大数据的核心则是从海量数据中提取出潜在的价值。”从一个研发者的角度出发,武新如今对于市场需求和数据库发展潜能有着充足的认识和准备,但其实对他来讲,早年间选择并投身数据库研究,着实是一次堪称冒险的未知旅程。
2016年7月,时任科学技术部部长万钢在南大通用考察工作。
1984年毕业于中国地质大学矿物化学专业后,武新在随后的5年时间内学习法语、前往法国奥尔良大学攻读博士学位,只不过彼时,他的研究方向与计算机、数据库没有丝毫的关联。直到20世纪90年代初期,再三考虑过时代技术大趋势和自身从事研究工作的发展局限性,武新决定转投计算机行业,并用两年的时间获得了计算机专业硕士学位。也正是在不断学习的过程之中,他接触到数据库技术最核心的内容,由此便与数据库研究一生结缘。
在法国工作的10余年是武新成长最为迅速的阶段。在甲骨文(Oracle)公司,他从事过售前服务,研究了系统优化设计模型;他成为了数据库的架构师,融入高级技术团队深入探索了数据库的内部机制、技术要领。“在帮助客户解决问题的同时,我也在研究一些数据库的技术与理论。”当看到价格昂贵的软件产品备受追捧时,他不免想要一探究竟。通过几番研究,他第一次认识到分布式数据库的奥妙,发现与传统数据库存储形式不同的列存数据储存优势。武新回忆道:“那个年代的磁盘设计是短板,计算机的计算能力也严重不足,恰巧列存数据存储性能优越,对磁盘的要求也极低。”这样的发现无疑让他十分惊喜,同时也为他日后加盟南大通用走上数据库创新之路埋下了伏笔。
2004年,当时的大数据尚未如现下一般盛行于世,致力于数据库技术研究和软件开发的南大通用在滨海城市天津悄无声息地成立了。5年后,当刚刚回国想要进行技术创新、挑战难题的武新,遇到将“打造国产原创品牌数据库”视为企业信条的南大通用,分布式数据库与列存、集群的优势融合理念再一次碰撞出新的火花。武新表示,“大数据对数据库和数据处理技术带来的挑战远比云计算要大得多”,对于大型的核心应用,需要新一代的基于分布式和大规模并行计算(MPP)的数据库支撑,来解决大规模数据分析面临的系列问题。
长期以来,新型数据库软件厂商以满足市场需求为己任,而产品研发方向则更多地依靠决策层敏锐的洞察能力和果断的执行手段。倘若说清晰的局势分析能够影响企业发展规划的制定,预见性的思考与判断便直接决定了技术路线的整体走向。
一直以来国内数据库产品水平良莠不齐,技术研究受制于人。武新指出,人们都忽视了国外数据库开源并不是永久性和完全性的,“国外数据库公司没有承诺永久开源,这就代表着他们完全有随时收回开源数据库的可能性”。在他看来,开源本身是一件好事,但国内数据库厂商一旦过度依赖开源则会导致创新能动力的丧失,“拥抱开源的同时不应该忘记自主创新,尤其是原创性的研究,毕竟只有形成以创新为主导的产业发展模式才能使国内数据库行业步入全球信息化产业的一流阵营”。
面对传统数据的层层累积、新型数据的不断迭起,以武新为核心负责人的南大通用一方面遵循“高铁模式”,在科技部、工信部的帮助下,积极从IBM引进世界级数据库产品,通过引进、吸收、消化、再创新的技术路线,成功打造出一款支撑高端业务的事务型数据库产品——GBase 8t。它通过了《信息技术安全技术信息技术安全特性评估准则》,符合《事务型数据库产品安全技术要求》,得到了一系列知识产权相关认证,成为可以在各个行业核心业务系统替换Oracle的数据库产品。在技术层面,其首次突破国际厂商的垄断束缚,接受着来自电力、电信、银行、地铁、国防等行业的市场考验,累计形成了亿元以上的营销收入。
GBase InfiniData 产品正式发布
另一方面,武新一再强调:“改是改不出来世界一流数据库的。数据库架构如同基因一样,从软件角度来讲,软件的‘基因问题’不解决,一开始便注定存在量级的差距。”针对新型数据分析的发展特点和市场需求,武新所在的南大通用领导层较早地认识到分布式和大规模并行计算系统融合的重要性,早在多年前,便开展了面向大数据分析为主的产品研发,自主构建起大规模并行数据库集群——GBase 8a MPP Cluster。其拥有超高可用性、高存储密度、高效计算性能等优势,与世界同类产品相比,部分技术已达到国际领先。自2016年起,它全面覆盖金融、电信、政企、安全、军工等多行业,成为国内市场占有率第一的MPP数据库“明星”产品。
沿时代脉搏 促换道超车
自20世纪80年代商业数据库萌芽初现,以关系型数据库为主导的数据库管理系统顺应计算机发展潮流,相关技术与产品日渐趋于成熟化。
通过武新的介绍可知,半个世纪以来,包括Oracle、IBM公司在内生产的4款数据库产品备受国际青睐,一度包揽了近几十年的数据库和大数据处理核心技术。反观国内,即便数据库理论出现时间较早,但由于改革开放初期,技术研究及人员不到位,错失良机,也就未能搭上传统数据库技术步入大发展时期的快班车。因此,对于正处在跟随、追赶地位的国内数据库厂商来讲,除了需要认清“传统数据库研究的追赶、超越难以在短时间内实现”的现实以外,还必须抓紧新型数据兴起带来的前所未有的挑战与机遇。
“大数据不再局限于结构化数据,而是包括了结构化、半结构化和非结构化数据的各类数据”。过去几十年间,作为最擅长处理结构化数据的关系型数据库,迎合了各行业核心数据建立、发展的过程,有效应对数据增长带来的种种问题。
随着互联网的出现,全球化数据规模呈现指数级增长,移动、智能终端、各类传感器进一步加大了大数据的翻涌速度。武新强调,譬如日志、网页、文档、图片、语音、视频以及气象、遥感等领域的各类专业数据,代表着日常可见但关系型数据库无法有效处理的一大类数据。这意味着亟需新的技术和计算模型,对此类半结构化、非结构化数据进行特征提取,转化成结构化数据进行进一步地分析、挖掘。
作为南大通用数据库研究的领路人,基于对业内局势的明确认识,武新带领南大通用技术创新团队用10年的时间“磨刀铸剑”,既要追赶传统交易型数据库的研究步伐,又要把握新型数据库的创新脉络。以持续投入改进、技术优化为永久发展目标,他们创下了一年内单个软件产品销售收入突破1.5亿元人民币的国内纪录,实现了国际新兴技术的局部领跑,让更多的国产数据库产品进入国内外市场,融入国际化技术发展格局。
武新说,在GBase数据库系列产品中,不同的英文字母代表着其所面临的不同市场:
——GBase 8a MPP Cluster ,一款面向海量数据分析的基于列存储和MPP大规模分布式架构的新一代分布式数据库产品
作为国内自主研发达到国际一流水准的分析型MPP数据库,GBase 8a MPP Cluster与国外同类主流产品技术同步、市场同级,在大规模并行处理、列存储以及高压缩和智能索引技术的基础上,具备满足各个数据密集型行业日益增大的数据分析、数据挖掘、数据备份和即席查询等需求的能力。自2008年以来,经10年开发与市场突破,它已在国内分析型数据库市场占据主导地位,为数百家用户部署了5000+节点,总数据量超过100PB,支撑了农行核心数据仓库,国家电网全业务统一数据中心,以及移动、联通、电信在全国20多个省的大数据平台、经营分析等关键业务系统,在金融、电信、电力、政府、安全、军工等十几个行业实现规模化应用,并远销海外。
——GBase UP,将事务型数据库、MPP数据库、Hadoop等不同类型的数据组织管理技术和数据处理技术融合的统一数据平台
赴美国奥兰多参加Gartner国际研讨会
大数据融合架构平台产品,是大数据与云计算的最核心技术。在云计算进入2.0时代,基础设施、服务器硬件和分析系统等基本成熟的情况下,以数据为核心以及实现数据资源的虚拟化应用价值是数据库践行服务职责的根本。GBase UP是世界上首款商用的融合关系型模型与Hadoop开源非关系模型的大数据平台产品,在融合技术、数据跨域访问、大规模读写分离、数据生命周期管理、跨引擎优化与查询等领域获得了多项专利,巩固了南大通用的技术领跑地位。它广泛应用于电信、电力、军队、铁路、气象、金融等行业结构,被誉为我国打破国外在大数据平台技术垄断的代表性产品。
——GBase InfiniData,提供灵活软硬件配置方案的超融合架构数据库一体机
抛开采购服务器、网络设备,自主搭建及调试优化等复杂过程,一体机开启了用户群的“懒人模式”,实现了硬件和软件的融合,能够降低使用者的操作难度,节约时间和人力成本。对比国外动辄上亿的一体机产品,基于x86的超融合架构数据库一体机能够根据需求,灵活组合不同的数据库产品,帮助用户平滑地将业务过渡到新的数据库架构的同时,达到超高的性价比。
多项产品经受住来自市场的严苛考验,解决了企业核心数据安全问题之际,也为国家安全可控战略提供了有力支撑。产品表现出的高可用性和稳定性赢得合作单位的一致认可,同时也收获了社会各界的普遍肯定。在中国首席数据官联盟·中国大数据企业排行榜上,GBase数据库相关产品位居国产数据库第一名;在中国大数据产业生态大会中,南大通用入选大数据企业50强;参加第20届中国国际软件博览会,GBase 8a被评为中国软件行业数据库软件信赖产品……
看花开遍地 忆苦思甜路
在武新看来,每一项荣誉都属于团队,属于每一个不懈奋斗的南大通用人。10余年来,能与南大通用结缘,能心无旁骛地开展数据库研究工作,他感念在心:“庆幸自己不忘初心,更感谢多年来南大通用给予的平台和支持”。
2008年,武新深感国外生活过于安逸、缺乏挑战,“我觉得一辈子很长,这样舒坦地待下去好像有些不甘心”。为了响应祖国创新驱动科技发展的全面号召,为了回报国家、回报父母的心愿,他举家归国,并于次年作为核心领导者加入南大通用创新团队,一头扎进产品研发的工作之中。
位于北京市北部山区的一串窑洞,是这个不到100人的筑梦团队梦想开始的地方。用一年的时间走遍大江南北,完成充分的市场调研之后,他们将一众研发资料、机器设备搬到了窑洞内。3个月的封闭研发,军事化管理,集中的设计调试……GBase 8a MPP Cluster的产品原型便是在这里诞生。身为队伍领头人,武新坦言那段时间遇到的质疑和压力是无法言说的。他需要不断鼓舞团队士气,提升研究人员面对疑难问题的信心,还需要做好监督,逼着他们按时休息。“有些人可能半夜突然有了灵感,就悄悄地爬起来工作……”如今,武新回忆起那段艰苦的日子格外欣慰,除了顺利完成产品的研发任务,培养出多名核心数据库研究人才,团队配合能力也得到了质的提升。
从研发走向市场,让产品应用于各行各业,让世界用上中国的数据库,对南大通用而言,中国农业银行大数据平台项目尤为值得一提。
随着数据量的逐年增长,中国农业银行原有数据分析平台已无法承受越来越多的系统接入,系统加工效率也开始逐步降低。为此,围绕农行发展战略,围绕数据管理和数据服务的两个基点,按照全行大数据平台统一框架,遵循“统筹规划、顶层设计、共享复用、分步实施”的设计思路,南大通用技术团队击败业内多家企业,凭借GBase 8a MPP Cluster脱颖而出。随后,他们构建出全行企业级大数据平台,实现了数据资源统一管理,全面提升了农行数据服务能力,充分挖掘出数据价值,满足了全行客户营销、风险管控、经营管理及外部监管的需要,推动了数据治理,并全面提升了行业数据资源管理水平和数据资产综合应用能力。
在技术攻关过程中,为实现MPP数据库与Hadoop平台完美混搭、大规模集群环境的统一规划、部署、管理和监控等任务,武新率领团队成员采用GBase 8a MPP集群间同步工具识别主集群增量数据,解决了大数据场景中PB级数据备份的难题,也提升了大数据平台业务高可用性、稳定性、连续性以及整体服务能力;使用GBase 8a MPP数据库提供的透明网关机制,则化解了MPP集群间数据交互过程中的种种难题……
促进业务要用数据说话,贯彻服务要用行动证明。平台建设期间,大数据平台接入超过90个业务系统源数据,向资产负债决策支持、定价管理、资金及FTP管理等20个应用提供数据服务。与此同时,为了保障平台的适配性和稳定性,南大通用积极展开数百项包括底层架构、高可靠性、高可用性、性能等方面的优化与改进。平台投入前期,他们7X24小时现场轮流值守,一旦出现问题马上分析,不出当晚便能解决。
正是由于这份认真负责的态度,鉴于产品性能的优越价值,南大通用不但促成了国产化数据库首次进入4大行的核心业务系统,还接连拿下招商银行、中国银行等大型数据库建设项目,在金融行业为国产数据库软件发展竖起标杆。除此之外,他们的产品应用遍及国内20多个省,显著提升了电信、电网、交通、保险等政、企单位的数据库运营效率及能力,同时还远销五大洲的30余个国家和地区。
客户交流会后留影
怀初心不忘 为未来筑梦
“中国的市场其实提出了世界一流的需求标准,只要踏踏实实地满足市场需要,产品必定也能达到一流的水准……”
“做高精尖的软件系统没有任何捷径、秘诀可寻,必须保证实实在在的资金和人才投入……”
“所谓创新就是面对未知,勇气、独立思考的能力、批判的眼光缺一不可……”
由产品研发到企业管理,从产业驱动至人才培养,武新以一个过来人的身份关心着整个行业发展的大事小情。他表示,从企业生存的角度而言,盈利是推进自身进步的首要因素,因此短期效益明显的产业其实并不乏竞争力。但想要真正推动各行各业的自主创新进程,实现核心技术研究驱动产业发展,还需要更为积极的宏观调控,需要扭转企业发展的价值导向,给予涉及高风险、长周期的研究与开发工作更多的重视,更有效的社会资源和政策帮扶。
着重强调社会对知识产权、知识分子价值认可和保护的重要意义,武新以推动领域发展为己任,同时指出国内正面临资金、用户、产业不协调等问题。“如今国家经济实力提升,企业融资并不是问题,重点问题在于责任的落实”,他倡导免责而非问责,不论是否成功,希望有越来越多的声音支持有胆识的人开展局部实验,从而以局部带动整体,形成良好的创新产业联动效应。对于恶性招标、竞争,武新深恶痛绝,控诉其扼杀了创新能动力,呼吁整个行业及相关部门共同整治国内产业环境。
摄于美国纳帕山谷( Napa Valley)
谈及人才培养与企业发展规划,武新坦言自己在主持或参与国家发改委、工信部、科技部下发项目,以及校企合作项目中成长颇多,同时也利用产学研联合培养模式为社会输送了一批批优质人才。根据多年的管理经验,他指出,人才培养首要注重个人价值与岗位的匹配程度。“每个人都有独特的价值,如何进行岗位安置才能最大限度地发挥能力,这是一个难题。”
依据从业者的个人表现,武新遵照按需分配的原则进行企业岗位管理,使具备自我驱动能力、心态积极的人成为团队领军力量,进而督促团队的整体发展;使研究能力突出、工作表现优异的人担当团队中坚力量,进一步提升产品攻关效率;使恪守工作秩序、认真履行职责的人作为团队保障力量,切实做好后勤安排,为各项任务的顺利推进把好关口。组织架构方面,武新表示会将研究人员化整为零,组建数个5~6人的小团队。通过设置奖励机制,促进积极的团队竞争和队内竞争,增强了个人发展动力的同时,也为新技术的钻研和开发提供了一定的自由空间。“始终以技术创新和产品带给客户实际的使用价值为标准,我们需要不断促进研发能力,更需要让优秀的人脱颖而出。”除此之外,武新大力倡导所有人勇敢说出“不知道”,杜绝“应该、差不多、我觉得”等多种语言腐败,致力营造出严谨务实的企业文化氛围,提升企业整体发展效率。
每件产品的成熟必要经过千锤百炼,如今面对科技发展的日新月异,武新说:“未来的路还很长,我们需要持续地投入。现在的基础远比10年前要好得多,我们肯定也会越做越好。”在数据库产品国产化的政策保障下,借助市场形势带来的时代东风,基于大数据和云计算的数据库技术、产品发展需求,南大通用立志要让数据服务走进千家万户,让数据资源的使用如同用水、用电一般方便。
顺势而为,随着时间不断地积累产品、人才的同时,积极鼓励创新型人才发展,向社会传达实用可靠的信息,让世界用上中国的数据库,是以武新为代表的南大通用人筑梦未来、奏响数据华章的不变信念。