APP下载

签约清华,Cloudera改善本土大数据人才生态

2016-12-28夏添

计算机产品与流通 2016年8期
关键词:开源清华大学社区

夏添

“我们学校的大数据专业已经做了有几年了,每年的招生名额都招不满。一开始是因为我们不知道要教什么,学生不知道要学什么;现在是缺乏与技术和用人方的联系,学生不知道学了大数据专业有什么用。”

刘教授是国内某知名大学的统计学院院长,近年来,她为学校大数据专业的成立和顺利发展日夜操心,但这一寄托着重大希望的专业,发展历程却未尽如人意。

的确,诞生至今已有数年历史的大数据作为产业早已为人所熟知,然而在这一产业诞生初期就产生的问题—人才的匮乏,却至今仍未解决。一方面,随着全球对数据科学家及大数据研究人员和分析师需求的持续增长,掌握大数据相关专业技能的人才往往能够获得高于平均水平的薪酬和更全面的职业发展方向,而另一方面,对于大数据人才的持续性需求,从目前来看还并没有转化为相应人才储备库规模增大的持续发展动力。

原因么,从刘教授的例子我们就可以看出一二—产学研层面的结合工作,做起来太难了。在企业层面,对于数学、统计、计算机编程和行业知识融会贯通的高复杂性需求,让找到一个合格的大数据人才难上加难;在高校层面,尽管对大数据已经有了一个初步的了解,但在具体的技术环节,以及如何综合提升自身知识层面,以适应这一能力和素质需求均极高的新行业需求,绝大部分高校仍缺乏足够的能力。

人才的缺乏绝不仅仅是中国才有的问题。在全球范围内,大数据行业正在面临数据专业人才短缺的困境。而这也是作为Hadoop之父的Cloudera首席架构师Doug Cutting在近日的访华活动中,想要帮助中国解决的重要问题之一。就在月初,Cloudera宣布将与清华大学合作,在Cloudera CAP学术合作项目的支持下,合力打造开源社区领先建设,解决中国大数据行业人才稀缺的困境。

“Hadoop正处于蓬勃的发展期,而且这样的蓬勃至少还需要几十年。自Hadoop创立之初至今已有十年,而Cloudera成立也有八年之久、进入中国一年半了。与中国清华大学的合作,显然会加速Cloudera在中国的发展。我们很荣幸能为中国大数据人才教育做出贡献。”Doug Cutting表示。

根据IDC研究显示,大数据解决方案将在未来四年中,帮助全球企业分享大约1.6万亿美元新增收入的数据红利。在大数据产业发展中,以Hadoop为代表的开源大数据生态成为大数据和云计算的重要技术支撑,有效推动了开源社区的用户和贡献者,带动了技术进步与商业发展。

在Cloudera CAP学术合作项目的支持下,清华大学和Cloudera将联合发布BASE (Big Analytics Skill Enablement)倡议,以解决中国大数据行业的人才稀缺困境。此次合作还将推动中国研究机构与企业参与国际大数据开源社区建设,进而推动企业大数据应用开发与价值挖掘的行业繁荣。

“数据科学研究院坚持走来自开源回归开源的开放技术路线,以产业需求为拉动,将产学研用纳入到开发体系中,坚持国际合作,使源自中国的技术走向世界。”清华大学数据科学研究院管委会副主任、副院长王建民王建民介绍,“我们希望本次合作能打造国际化的开源生态,从而推动中国大数据产业的发展。”

与传统计算机科学和商业分析课程不同,通过Cloudera CAP,清华数科院将与Cloudera共同为教师与学生提供完整的免费Hadoop课程,学生不仅能从基础的Hadoop开始,也可以学到诸如Spark,Hive,Impala等在全球Hadoop社区最新的技术,这不仅为学生们提供全面的技能培训,优秀的大数据人才将为公共事业和企业带来创新,并在全球视野内获取有竞争力的优势。

此外,清华大学数科院与Cloudera的合作,还将着力推进国际大数据开源社区的相关活动在本地的融合,提高本土团队对已有项目参与度,贡献新的开源项目。双方合作的愿景是推动大数据技术在中国的大范围应用,同时将中国本土创造的技术回馈国际开源社区。

同时,Cloudera还在活动现场发布了BASE (Big Analytics Skills Enablement,大数据分析赋能)倡议——它是一个以行业为主导的生态系统,用以培训未来的数据专业人才。作为为战略性填补数据专业缺乏的鸿沟而诞生的生态系统,它将会带动整个大数据行业的参与者以及学术机构一起,为更多的人培训大数据和分析领域所需的技能,同时让经过训练的数据专家在相关领域和行业得到合适的工作机会。

猜你喜欢

开源清华大学社区
清华大学:“如盐在水”开展课程思政
校园武术“学、练、赛”一体化实践探索
五毛钱能买多少头牛
2019(第十四届)开源中国开源世界
2019开源杰出贡献奖
影像社区
影像社区
影像社区
2015影像社区
一道2009年清华大学自主招生数学试题的思考