华南理工大学科研大数据实践
2017-11-29陆以勤
中国教育网络 2017年10期
文/陆以勤
华南理工大学科研大数据实践
文/陆以勤
作为以理工见长的华南理工大学,在大数据科学和工程相关领域,包括大数据的整个生命周期的各个环节(数据采集、通信、海量处理、包括计算机能力、存储等)的研究一直非常活跃。有关大数据研究的科技基地就有:广东省大数据分析与处理工程技术研究中心、广东高校海量大数据的智能信息处理与安全工程技术研究中心、广东省人体数据科学工程技术研究中心及广州市人体数据科学重点实验室等。为了培养大数据的应用创新人才, 学校充分发挥广东省的产业优势,与多家世界知名企业建设了如“华南大数据创新人才培养基地”“信息技术与大数据创新人才培养基地”等科研和人才培养基地,还设立了“云计算与大数据”硕士专业。为了支撑大数据的科研和教学,除了通用多款统计分析工具,学校搭建大数据的分析平台、大规模数据的Hadoop系统平台,为大数据的挖掘、存储、分析提供支撑。学校科研和业务活动本身产生大量的数据,例如学校的两个附属医院、大数据交换中心及二级部门的业务数据等,经过严格的脱敏处理,经过数据主管单位的允许,可以提供给科研研究,另外,学校与多家企业合作,采集多个企业级数据源,其中包括社交网络数据(人人网、开心网和新浪微博的真实数据约在10T左右)、交通数据网(6T左右)、钢铁现货交易第三方电商平台、百度、阿里云等名机构的完整的海量数据,可在平台上展开数据信息交易、数据挖掘、数据统计与分析等应用,不断提升运用、解释、挖掘数据的能力。为了给大数据科研团队提供良好的支撑环境,学校还计划建设“科研大数据服务平台”。
(作者单位为华南理工大学)