智慧校园架构下公共数据平台建设策略研究*
2017-09-16门威
门威
摘 要:智慧校园通常采用分层架构,自下而上依次为IaaS(基础设施即服务)、PaaS(平台即服务)和SaaS(软件应用即服务)。公共数据平台作为PaaS的重要组成部分,是各类业务数据共享和交换的媒介,是智慧校园建设的基础。公共数据平台的基础支撑能力主要体现在信息标准的执行能力、共享数据的开放能力和数据质量的治理能力等方面。公共数据平台需要从信息标准、数据管理和应用服务等多个方面进行改进,最终为智慧校园开放架构下的数据共享与管理提供支撑。
关键词:智慧校园;公共数据平台;数据治理
中图分类号:G434 文献标志码:A 文章编号:1673-8454(2017)17-0051-04
一、智慧校园整体架构
智慧校园就是利用云计算、物联网、移动互联等信息技术打造的智慧化教学环境,为师生提供综合统一的信息管理平台和一站式的信息服务[1]。智慧校园的建设遵循统一性、先进性、开放性和安全性等原则,通常采用分层的架构模型。自下而上依次为:基础设施层、公共数据平台层和应用服务层,如图1所示[2]。基础设施包括服务器集群、物联网设备和网络基础设施等;公共数据平台包括元数据库、代码库、共享库和数据交换平台等;应用服务层包括各类业务和在其基础上构建而成师生一站式信息服务平台。
公共数据平台在智慧校园架构中处于承上启下的地位,是各类业务数据共享和交换的载体。
二、智慧校园公共数据平台建设
随着智慧校园的发展,传统模式下的公共数据平台无法支撑后期开放架构下的数据共享与管理。公共数据平台建设需要从提升基础支撑能力、完善信息标准、打造数据管理平台和应用服务支撑平台几个方面开展[3]。
1.基础支撑能力提升
基础支撑能力主要包括信息标准执行能力、公共数据平台结构、共享数据的开放能力、数据质量的治理能力和历史数据的积累能力的几个方面。
(1)信息标准执行能力
校级信息标准管理系统,一方面可以全面升级改造学校原有信息标准的内容,另一方面可以加强信息标准的实际使用和执行情况的管理手段。学校内部的主数据库和业务数据库一旦有和信息标准不同步或不一致的情况,系统将及时检查并将差异情况提报给数据平台管理人员,帮助其了解和及时纠正信息标准执行的差异,确保信息标准的可执行性。
(2)公共数据平台结构
公共数据平台应包含数据管理平台、应用服务支撑平台。通过数据集成与处理,可以实现基于公共需求的智慧校园服务,基于教学需求的智慧学习服务,基于管理需求的智慧管理服务。
(3)共享数据的开放能力
ETL作为业内通用和常用的成熟技术,在数据交换和共享过程中的稳定性和高适用性具有很好的优势。但随着信息架构的发展,传统的ETL方式缺少数据共享的及时性和灵活性,无法将一些需要快速反馈的数据进行有效同步,直接通过数据库进行数据交换的途径也缺少多元的数据共享通道和手段,在后期的信息化建设过程中,需要提供及时有效、灵活可配的数据共享方式,便于后期碎片化服务的封装和建设。
(4)数据质量的治理能力
数据作為信息化建设的核心内容,其质量好坏在高校内一直是一个无法量化的黑盒,但数据质量的好坏直接影响到学校后期数据分析和数据利用的有效性,因此需要一套先进的管理工具,对学校的数据质量进行全面的监控,帮助数据平台管理人员了解校内数据质量,便于其有效推进和提升校内整体数据质量。
(5)历史数据的积累能力
数据平台应提供对历史业务数据进行详尽保存,作为学校数据资产的积累,用于后期的数据分析。
2.完善信息标准
信息标准建设是数字化智慧校园建设的重点之一,对推进校园信息化建设,保证信息的交流与共享,有着重要的意义。学校所采用的信息标准必须保证和国家以及教育部的信息标准相兼容。首先要定义公共数据标准,形成平台内的教育元数据库和业务数据库,用于向各应用服务提供数据访问,支持第三方系统以open-api方式的访问。提供数据加解密、数据权限管理、功能权限管理、认证服务等功能服务,提供交换平台的基础管理功能。
《教育管理信息化标准》的颁布为教育部门进行教育数据总体的规划和组织,建立统一的数据平台提供明确的规范和标准,减轻学校人力资源和财政管理的负担。学校信息标准制定的实施过程如图2所示[4]。
学校信息标准包括代码集、数据集和编码规则3个部分,如图3所示。
3.构建数据管理平台
数据管理平台包括数据标准管理子系统、元数据管理子系统、主数据管理子系统、数据质量管理子系统[5]。该平台的建设可以提高数据的质量(准确性和完整性),保证数据的安全性(保密性、完整性及可用性),实现数据资源在各组织机构部门的共享,挖掘出数据的价值,支持决策分析,充分发挥信息化作用,用数据价值增强师生对信息化发展的信心与价值认同。具体来说,能够对校内的校内信息系统提供数据交换和共享;向上级和外部单位提供相关的统计和报表;为全校师生提供个人的数据服务及信息的公开查询;为院系教学单位提供教学、实训、人财物管理支撑;为学校领导及职能部门的科学管理和决策提供支持。此外,该平台面向数据后端服务,如数据处理、审核、统计和上报等,是基于数据整合的信息资源的综合服务。数据管理平台架构如图4所示。
(1)数据治理
在将各种数据源加载到数据平台中的过程中,还需要经历一个重要过程,即“数据治理”。数据治理的主要功能包括数据标准管理、元数据管理、数据质量管理、数据资产管理、数据安全管理五个部分。这个阶段的重要性不亚于数据源本身。因为,原始数据虽然潜在包含着信息,但是如果不经过有效的处理,不能将这些数据组合成逻辑上相互关联的、形态和意义一致的数据集,就无法进行有效的处理,分析和洞察也就无从谈起。而且,就复杂性和工作量而言,这部分是最难以进行自动化机器处理的,大部分数据清洗工作需要人工分析、讨论、抉择后才能确定,因此效率难以提升。数据治理过程中实现业务数据统一编码,实现管理数据统一编码,完成对学生、教师等信息资源规划工作,建设全校统一、共享的教育基础数据库,为平台服务提供基础数据支撑和保障。围绕学校、教师、学生主题,实现学籍、综评、成绩、师资等业务系统权威数据写入主题数据库的集成开发。实现基础数据交换服务和统一数据服务,满足信息化平台上的应用整合、共享交换、统一管理等要求,提升平台整体架构的合理性、灵活性和扩展性。endprint
(2)教育基础数据库构建
数据中心教育基础数据库由代码集、主题数据库、共享数据库等部分组成。教育基础数据库的设计,按照信息资源规划的方法,通过概念模型、逻辑模型和物理模型设计,通过数据共享交换接口将权威数据抽取清洗入库,实现数据汇集,并最终以数据服务接口的方式按教师、学生为主线提供信息服务。
1)权威数据模型
业务数据中心的建设基础是需要实现权威数据模型制定。权威数据模型定义:源数据由唯一业务源产生和维护,采集到共享数据库供其他业务共享和引用的数据为权威数据。如学生基本信息是典型的权威数据模型,它是由教务系统产生和维护,采集到共享数据库供教务管理、教学质量分析等众多的全局服务模型所引用。权威数据模型包括教师、学生、组织机构、课程等。
2)主题库
主题库是面向特定应用领域,由若干逻辑相关的数据资源按照统一的标准规范整合形成,具有系统性和完整性,并通过统一的系统提供一站式服务的数据库。每一主题由相应的数据类、数据表与数据项构成,数据项用元数据进行描述。
在数据主题域的划分上,参考相关教育管理信息标准,结合我校教育管理业务特点,将基础数据库进行了主题域划分。
整体上,将主题数据库主题域划分为学生、机构(学校)、教职工等多个实体域,划分出经费、房产设施、教学、体卫艺、教科研、德育、安全、综合评价、办公、统计决策等多个过程域。
3)共享库
共享库以主题库中的数据为基础,主要面向各类应用提供公共数据服务,按业务应用需要集成数据,构建数据视图,针对某项业务提供数据查询和报表展现。包括教师、学生、课程基本数据视图,学籍、办公、成绩、装备等业务数据视图,以及各种分类统计数据视图等。
4)公共代码集
公共代码集由中华人民共和国国家标准(GB)代码集、教育部教育管理信息化标准(JY)代码集、教育管理数据定义标准、教育信息化规范与自定义代码规范组成,每一代码集包含若干代码表。通过数据管理平台的设计将达到以下目标:建立全校性的共享数据中心;实现全校信息编码的统一和一致;保证任何两个业务系统之间没有冗余业务数据;保证“谁产生、谁维护”,所有的数据都只有唯一的维护者;保证可以提供反映整个学校的全面信息;保证可以为整个学校决策支持所需的数据信息;为学校的将来的决策支持系统积累分析数据。
(3)数据清洗与整合
数据清洗与整合平台实现共享数据中心的数据采集与分发,提供对被交换信息进行清洗、转换、装载入库等数据交换服务,即清理脏数据,完成对数据的整理,确保数据一致性、完整性和正确性。
(4)数据安全防护
除了网络、应用层面的安全,对数据还要提供数据层面的多级安全防护。
一级防护:数据接入防护。从部门接入加密数据,到平台后解密存储,不直接传输原始数据,防止数据泄露。
二级防护:数据加密防护。后台数据匿名化映射,用户不真正接触实际数据,接触的是匿名化和反匿名化数据。
三级防护:数据权限控制。数据开放权限控制严格,数据只开放给具有权限接触的人,防止隐私泄露。
四级防护:非法访问拦截。后台采用session直接过滤掉不在用户权限范围内的数据,有效防止数据库注入等攻击。
4.搭建应用服务支撑平台
应用服务支撑平台包含服务中心、应用中心、消息中心、接口中心四大部分[6],涵盖了用户统一身份认证、权限分配控制、日志、统计、应用配置管理、应用业务逻辑实现、通知实时传递、数据统一出入验证等功能,为终端交互的实现提供全面地、可扩展的、维护便利的支撑。提供应用的统一分发、管理、审核、集成、访问渠道,可以对所有应用(包括自建和第三方应用)进行上架下架、权限配置等操作,操作结果可以实时在用户手机上体现,实现高效可靠的应用权限控制,减少运营风险。
服务中心可以对系统整合通用表单、定制表单、第三方表单、报修类应用和预定类应用提供相应的程序接口,方便其他系统获取表单及流程状态。
应用中心是所有表单的集中整合,通过表单和服务的整合,按照不同的维度对于服务和应用进行划分,方便使用者检索、使用。
消息中心通过调用学校短信平台、统一信息门户、微信企业号、微信公众号、邮件系统等消息接口对服务的申请和审批流程做实时的提醒,这样可以让申请者和审批者及时的处理和感知服务所处的流程阶段及当前有多少审批需要处理。
接口中心包括两方面:①一站式网上服务大厅平台对于其他系统的调用接口。如通过与数据中心的调用将姓名、院系等基本信息直接从数据中心作为数据源配置到表单中从而省去了用户再次填写的麻烦也在一定程度上提高了数据的准确性和完整性;②其他系统调用一站式网上服务大厅平台的接口。如MIS系统、微信平台等,通过调用一站式网上服务平台的数据,将服务、申请状态、审批状态等展示到第三方系统中。
三、结束语
智慧校园架构下公共数据平台建设是一个迭代完善的过程。每一次迭代都是为信息标准的制定为开头,以构建调整数据管理平和应用服务支撑平台为结束。公共数据平台是校内各类数据流通的管道,是数据分析的仓库和载体,需要加强数据治理和安全防护。在智慧校园整体架构中,公共数据平台和统一身份认证、统一信息门户、综合服务门户、网上办事大厅和工作流平台等共同构成PaaS公共平台层。
参考文献:
[1]黄荣怀,张进宝,胡永斌,杨俊锋.智慧校园:数字校园发展的必然趋势[J].开放教育研究,2012(4):12-17.
[2]王燕.智慧校园建设总体架构模型及典型应用分析[J].中国电化教育,2014(9):88-92+99.
[3]刘冬邻.智慧校园数据中心平台建设研究[J].电子技术与软件工程,2016(3):208-209.
[4]李華,刘波,龚艺,杨永其.高校教育管理数据标准建设实践[J].安徽电子信息职业技术学院学报,2017(2):97-102.
[5]刘磊.公共数据平台在高校数字化校园建设及管理中的应用[D].上海师范大学,2008.
[6]于长虹.智慧校园智慧服务和运维平台构建研究[J].中国电化教育,2015(8):16-20+28.
(编辑:王晓明)endprint