APP下载

大数据时代的高校共享数据平台研究

2015-09-10王加年徐晴

中国教育信息化·基础教育 2015年5期
关键词:数据交换数据中心大数据

王加年 徐晴

摘 要:在教育领域中,管理和决策越来越依赖于数据和分析,如何利用大数据科学决策是高校近年来信息化建设关注的主题。文章分析了高校共享数据中心平台的理论知识和相关技术,讨论了面向服务的数据交互技术方法及共享数据中心的非技术因素。最后分析设计了面向主题域的常熟理工学院共享数据中心,并对其体系架构及关键业务系统的数据流向做了详细的分析叙述。

关键词:大数据;数据交换;数据中心

中图分类号:TP392 文献标志码:A 文章编号:1673-8454(2015)10-0010-03

大数据科学决策是高校治理体系和治理能力现代化的关键。在教育领域中,管理和决策越来越依赖于数据和分析,而非基于经验和直觉,然而,目前大多数高校的管理模式中信息化的作用尚未充分体现,尽管在长期的办学过程中积累了大量的数据,但这些宝贵的决策信息资源没有得到相应的整合和开发,更谈不上利用这些数据对学校的教学、科研、管理等各项事务进行预测和分析。随着大数据发展而带来的教育政策研究与决策“用数据说话”的趋势亦渐明显,构建共享数据中心,将这些海量、分散、异构的数据资源集成起来达到共享、融合,通过多维度、多层次、多群体、多因素数据分析并形成一定的应用模式,从中分析和挖掘潜在的价值,去解决高校事业的瓶颈问题,是将大数据应用于教育领域的重要举措。

一、大数据时代的高校共享数据平台的相关技术及理论

1.信息编码标准

信息编码标准是做好信息管理的基础,信息只有遵循一个统一的标准进行组织,才可能构成一个可流通、可共享的信息库。信息编码标准是数字化校园中不同层次的系统尤其是应用系统能够相互访问的基础。数据交互过程中,各业务系统数据信息要按照信息编码标准的数据标准进行数据清洗和过滤,处理后的数据才会存储到中心数据库。信息编码标准是学校信息化建设的必要条件;同时信息标准的水平也反映了学校信息化建设的水平和高度。

2.共享数据模型

共享数据中心主要完成学校各类跨地区、跨部门、跨系统的管理数据与信息资源的数据交互和共享,是各个业务系统数据交互的中转站,是信息资源的存储中心。由于各学校早期的信息化建设基本都是由业务部门主导,缺乏统一规划,没有统一标准。同时考虑成本以及推倒重来的建设风险等因素,一般建议采用交集数据中心模式建立共享数据中心,即:各系统间的数据交互完全通过数据中心来完成;共享数据中心只对交互系统之间需要交互的数据建模,各系统沿用原有的权限模型,需要交互的数据在相关系统中独立的存在,但所有数据有且只有唯一的维护源头。

二、大数据时代的高校共享数据平台总体设计

1.共享数据中心体系架构(图1)

(1)数据采集层

采集的数据主要包括基础数据,如人、财、物等基本信息;学校开展教与学主体事务的业务数据,如教师教学、学生选课等;体现教师学生成长与发展的过程数据等。数据采集层主要完成上述相关数据的采集工作,其中大部分数据随着其相关的业务系统日常运作过程而积累下来,还有一部分是相关管理人员手工录入,或者电子表格批量导入。

(2)数据集成层

数据通常存储在很多个不同的数据存储系统中,从所有源中提取数据并将其合并到单个一致的数据集中确实有一定的难度。数据交换工具通过转换功能对数据进行清理、标准化及转换,数据转换为兼容格式后,就可以将其物理合并到一个数据集中,并且数据在合并成功且应用转换后,通常会被加载到一个或多个目标。

数据集成层同时还负责加载数据库中的维度表和事实数据表,处理 Analysis Services 多维数据集和维度,使用 Integration Services 任务和转换来自动处理更新多维数据集和维度,使用户始终获得最新的数据。

(3)管理操作层

管理操作层的基础数据主要来自各个业务系统,有的统计指标类数据是经数据仓库加工提供。管理操作层面向教育治理者日常管理,主要包括师资队伍建设管理、师资结构分析、学业预警、教学考核等。归纳如下:

为满足日常管理,提供了以固定报表为主的综合报表统计平台。

为便于突发性和临时查询需要,提供了各大主题的综合查询平台以及基于数据仓库的灵活查询功能。

为规范对外数据报送,提供了统一的对外数据报送接口。

2.主要业务系统数据流向

共享数据中心本身不会产生数据,所有的业务数据的维护遵循数据生命周期按照“谁产生,谁维护”的原则,各自业务系统分别产生数据,所有数据只有唯一的生产源头。共享数据中心与各业务系统之间进行交互,一方面保证基础数据在各系统中的一致性,同时也对主要业务数据进行积累沉淀。

以学生数据为例,学生的人头数据以学籍系统为准,而学生的其它基础数据又在学工系统中维护完善。数据共享中心既负责从学籍系统中抽取学生人头数据推送学工系统,同时又从学工系统中抽取完整的学生基础数据存储在数据中心,图书系统、一卡通系统等业务系统从共享数据中心订阅学生相关数据。其主要业务系统数据流向如图2所示。

三、共享数据中心的非技术因素

1.数据质量管理

数据是高校有效开展信息化管理和辅助决策分析的依据,是实现高校治理现代化的重要保障,因此其质量和时效性已经越来越受到高度关注。提高数据信息的质量,加强数据管理,不仅需要在高校日常工作中充分利用现代信息技术,强化高校业务与信息技术的融合,还要依靠广大师生的配合参与,必须循序渐进,稳步推进。

(1)从源头治理,从数据录入、内部处理入手,把好数据质量“入口关”;

(2)督促问题治理,部署检查规则,实现问题数据发现、分发、治理、监督、考核闭环管理,把好数据质量“治理关”;

(3)做好规范管理,完善制度、规范流程、系统硬控制,把好数据质量“流转关”。

2.数据安全管理

大数据既意味着机遇,也蕴涵着挑战。数据安全管理问题,是高校应用大数据面临的最大风险。虽然共享数据中心模式数据管理,方便了数据分析和处理,但由于安全管理不当所造成的大数据丢失和损坏,则将引发毁灭性的灾难。在使用数据过程中应遵循以下原则:

(1)使用生产数据必须经过申请和审批,开发测试环境使用生产数据必须进行数据混淆。

(2)对生产用户进行严格的授权管理,防范非授权访问生产数据。

(3)含敏感信息的生产数据应使用专用邮箱传输等。

(4)对生产数据建立和实施严格的备份机制。

四、总结

在大数据的支撑下,高校运行过程的各种元素能够实现数字化的呈现,数据得到实时流转、存储和整合,信息按照权限充分公开。大数据能够聚焦于决策对象的微观层面,将原本模糊的现象通过数据逐步清晰的描述出来,大数据是超越个体与局部的相对静态视野,更容易发现问题所在、可能弱点和盲区的宏观动态视野并且用于各项事务的预测和决策。本文讨论了面向服务的数据交互技术方法、数据流向以及一些非技术因素,设计了面向主题域的共享式数据中心。本共享数据平台成功应用在常熟理工学院数字化校园建设项目中,通过数据交换、主题分析,为学校的科学决策提供了有力保障,推进了学校的现代化治理能力和水平。

参考文献:

[1]姬倩倩,温浩宇.公共交通大数据平台架构研究[J].电子科技,2015,(2):127-130.

[2]陈瑞.大数据时代基于共享平台的信息服务工作研究[J].科技创业月刊,2015,(1):20-22.

[3]赵巍,刘丹,王欢.高等学校共享式数据中心设计与实现[J].长春理工大学学报(自然科学版),2015,(1):132-135.

[4]陈霜叶,孟浏今,张海燕.大数据时代的教育政策证据:以证据为本理念对中国教育治理现代化与决策科学化的启示[J].全球教育展望,2014,(2):121-128.

[5]张建.教育治理体系的现代化:标准、困境及路径[J].教育发展研究,2014,(9):27-33.

[6]阎光才.高等教育治理体系与治理能力的现代化[J].苏州大学学报(教育科学版),2014,(3):1-3.

(编辑:郭桂真)

猜你喜欢

数据交换数据中心大数据
酒泉云计算大数据中心
民航绿色云数据中心PUE控制
XBRL在财务报表网络数据交换中的应用
基于云计算的交通运输数据中心实现与应用
Overlay Network技术在云计算数据中心中的应用