智慧时代数据服务的发展与思考
2015-07-04宓詠
文/宓詠
高校信息化经历了三个阶段:基础设施初步建设阶段、信息化建设全面铺开阶段,以及信息化服务提升阶段。现阶段,信息化模式在新的环境下有了新的趋势:
首先,信息化正在扮演更加多元的角色。从过去单一注重信息技术管理领域,到现在更多围绕改善用户体验、业务数据分析和业务流程管理领域;
其次,数据、信息的重要性已经超越了业务流程本身。相比业务流程设计,信息管理和应用技术的重要性更高。而且,创建了新的信息化业务模式,从外部数字化到逐步建立内部全面的数据化业务能力,加强IT技术与业务流程的全面融合。因此,需要我们从技术角度、业务流程、人员角色、上升到整体战略层面,通过IT驱动业务发展和模式创新。
第三,信息化已经全方位嵌入到整个业务服务过程中。由自建或共享的服务组织,集中提供IT应用和基础架构,并全面嵌入在各种相关的业务服务之中。
发展既带来很大的变化,也带来了诸多机遇,过去只是专注基础建设、应用系统开发、资源整合、运行服务,而现在随着社会大环境的改变,用户在改变,业务部门也在改变,因此,我们的方式也需要相应变化。
从早期的规划到数据的应用,流程的贯通到最终提供各种服务,这是近几年复旦大学正在做的工作。
从数字化到数据化的过程
毫无疑问,大数据时代将会涌现针对数据的存储、分析和挖掘的各种技术和应用。目前,高校虽然还不能算全面进入大数据应用时代,但是已经在逐渐接触大数据。数据潮的涌现,对于高校的信息化管理者来说,在解决好海量数据的获取、汇集、存储以后,应着重考虑数据化,即采用数据描述事物和现象使之可量化分析的过程。
应该说,数据化能带来的好处是显而易见的。在高校信息化中以量化的数据来描述用户角色、属性、业务和服务,使得用户角色数字化、业务过程标准化、服务质量可量化,将改变数字校园建设的方式。信息化校园数据架构如图1所示。
图1 信息化校园数据架构
从数字化到信息化到数据化的过程中,早期的建设更多强调数字化只是将手工操作变成业务系统,信息化则更多的体现在应用和服务的有效支撑;而数据化则是指在数字化和信息化基础上,利用数据来对事物和现象进行描述,使之能同时被人和IT设施所理解,量化是数据化的核心。
当前,高校信息化的数据应用也存在诸多问题。如许多高校都实现了数据的集中和交换,甚至也有业务系统内部的数据展示分析,以及通用报表数据统计等,但问题依然突出:第一,数据规模不断在扩大,数据的同步规则越来越复杂,管理成本越来越大;第二,数据质量不高,数据应用的有效性不高,导致有数据却用不起来;第三,整个业务流程变更,新的业务随着学校的发展有所变化,因而对数据组织架构提出了新的要求。更大的一个问题是,终端用户的问题变得千差万别:用户系统变成一个个烟囱,互不相通,师生利用个人数据需登录业务系统模块,系统越多、与“人”相关的数据就越多,要全面获取这些数据的难度就越大。师生要查人事数据到人事处,要查教务的数据到教务处系统等等,而系统越多,需要获得数据的难度越高,需要不断地去了解新的系统和应用。因此,数据中心的建设过程中,IT部门关注数据的整合过程,强调完整性和一致性,但是最容易被忽略的是,我们保留的数据和用户所需的数据,这两者之间的偏差无法一一对应。
高校的师生用户始终是游离在数据产生和交换的信息化过程之外的,高校建数据中心,人们首先想到的是买服务器、买存储,很少关注数据在哪,应该以什么样的形式保存、展现、处理、服务。因此,我们始终强调信息系统中最有价值,最有待发掘的宝藏就是“数据过程”。早期复旦大学也做了很多的应用,如用Excel表做贫困生补助,了解学生消费情况,包括学生的成绩,学生的行为分析等等,包括新生第一学期的学习成绩和东部、西部、中部学生的城乡差别,不同类型学生的成绩,包括插班生、自主招生的学生成绩和高考招生学生成绩的比较等,以及学生的评价,学生的选拔,学生开课等情况,早期我们对此做了大量的分析,应该说这些分析非常有用,也给我们的工作带来很多帮助。然而,这个过程采用传统的Excel等工具是非常辛苦的、效率也不高。
这几年,积累的数据从过去的几十条、几百条、几千条、几万条,到现在的几十万条,甚至上百万条,有些日志几个月下来就有上千万条的数据,这些数据该如何处理?传统的方式难以为继,数据的形态发生了巨大的变化,应用无法得到满足;并且积累如此庞大的数据,如果不善加使用,也是一个很大的浪费。可以说,经过几年的积累,目前已经到了数据反哺业务的阶段,能够通过数据的综合利用来提升信息化的服务水平,进一步提高管理效率。
构建统一数据服务平台
复旦大学近两年经过整体设计与规划,明确一站式的服务,推进院校两级管理,实现科研管理的改革和校务信息的公开。在整个建设过程,强调统一的数据平台,即面向师生个人及校二级部门的数据中心和分析平台。在校一级,更多的是数据展示和决策支持;在个人,主要是查询填报。在此基础上,我们也详细分析了需要支持的硬件的环境、业务数据库的调整、安全体系、数据标准,以及如何面向个人,面向二级单位,面向学校提供相应的服务。
整个平台采用科学的规划,重新构建数据基础,以面向对象的方式有机组合所有的教学、科研、财务、人事、生活等各种相关的数据资源。将数据管理的后端和前端适当分离,在数据的交换保管的过程中,由信息化部门统一操作,数据的产生、收集由具体的部处和二级单位共同承担,数据的组织结果将提供给各服务平台调研和分析。
数据分析应用由二级单位和学校灵活定义,整理并充分利用,通过这种方式建立校一级,二级部门以及师生个人的数据收集、流转和服务的机制。具体来说,就是围绕着一个人,比如一个教师或者一个学生,融合各类属性的数据,逐渐建立数据中心,提供用途,可以查询,可以上传到各个数据的通道。同时,建立一表通,减少个人用户在业务申报流程周转的步骤,提高数据进度。
面向二级单位和学校的数据采集平台和分析的展示平台,提供不同层面的数据管理,因为校级,二级单位/院系,个人,不同角色对数据需求都不一样,分析的内容也不同,不同的层面进行数据的管理,业务的分析,以及决策支持。那么,对于数据有哪些值得注意的问题。
一、数据如何产生,谁产生,谁维护,采用什么样的统一代码标志;
图2 数据整合共享平台
二、数据标准如何统一;
三、数据传输如何进行,交换中心采用什么方式进行数据的交换;
四、与数据分析相关的数据如何建立;
五、如何保存和利用数据。
为此,复旦大学对数据的结构进行了大量的改造。首先,对业务数据库进行一些规范,适当归并/减少业务数据库,增加全局数据库和历史数据库以及数据仓库的建设;并且,增加了综合业务数据库,使得日常数据能够快速获取,如微信,移动APP等数据能快速获取,不必像传统从数据库中获取。同时,不改变或少改变原由的业务流程(如图2所示)。无论是面向个人的“一站式”服务,还是面向院系的快速配置数据分析,或是面向学校的决策支持展示,最关键的问题在于数据整合,因此,信息化的整个定位已经从技术性向资源整合的方向转变。
向资源整合方向转变
随着应用的深入和普及,各业务系统大量的数据交换需求自然存在,由于时间的积累,建设的方式不一样,时间前后也不一致,包括系统吻合度,数据交换网,数据越来越增加,授权也越来越复杂,需要我们对现有的信息和数据进行整合,提高资源的利用,提高部门之间的共享、交换以及服务和决策的能力。
我们的目标很明确,对师生员工,进行个人的数据处理以及全方位的信息服务;对业务部门,实现部门之间数据共享;满足学校一级的信息决策的需求,包括部门的综合分析、统计、评价等。从内容上来看,对业务类的结构化的数据和非结构化的数据进行整合,特别是非结构化数据,是否转化成结构化可描述的方式。在应用上面要区分哪些是部门自己私有的信息,哪些是部门之间需要共享的交换信息,以及为大众服务,为学校提供服务的公共信息如何整合。
在这个基础上整合的流程注重三个方面:
第一、数据源;
第二、数据交换、转换和集成;
第三、数据应用。
总的方式是,不改变业务系统而将数据在数据层直接进行整合。通过这种方式,在整合的数据上进行数据综合的分析、展示以及利用,提供决策支持,
如以教师的个人数据中心为例,围绕教师抽取六大类的数据,包括教学、科研、财务、个人基本信息、资产、生活信息六大类服务(如图3所示),在这个数据中心中,老师从1980年以来发表的文章,近五年来的中文文章,近些年带过的研究生,上过的课程,挂在名下所有的资产,科研经费余额,课程的信息等,均一目了然。研究生的个人数据中心,一共分十个分类;本科生的数据中心,分七大类,以逐步构成复旦大学的教工数字档案、学生数字档案。在此基础上,也能实现一表通,逐步减少老师、学生重复填表的问题。
针对各二级部门的服务,我们提供给各院系相关业务系统的两百多项数据,包括学院师资情况,论文、资产、项目科研经费等,需要时,可以有一些相应的数据分析。至于校一级的数据平台,则包括人员的基本信息、综合服务、科研、教学、资产、报表等,每天的实时数据均可查询。各个校区学生宿舍安排、使用的情况;各个院系有多少项目、教授、高级职称、人数、经费、项目和经费的分析,以及业务部门的分析等。
图3 教师数据展示模型
思考与发展展望
应该说,经过几年发展,复旦大学围绕着个人、二级单位的业务和数据,建立了基础的数据服务体系。面向以人为本的主线,逐渐完成了顶层设计,包括数据交换平台建设,三级体系以及展示工具。
关于数据建设方面,目前有三个挑战:即如何增强标准,如何完善全系列数据,以及重视数据的积累。决策需求主导了数据服务方向,这是目前关键问题之一,通过逐步建立起数据服务的良性循环机制,创新服务门户,来真正解决师生到底是需要服务器还是服务的问题,利用技术来有效支撑我们的服务。数据平台架构如图4所示。
未来,复旦大学要实现一个真正的网上一站式服务大厅,学校的流程审批、各种表单填写、业务流程办理状态等都能在网上向师生开放,以此提高学校的办事效率和信息公开。此外,信息办也正配合各个院系梳理数据家底,并将相关的数据集中整合,逐渐形成可查、可控、可管的诚信体系的组成部分。
图4 数据平台架构
总体上说,高校信息化工作从数据化逐渐走向服务化,最终向智慧化的方向发展。信息化管理、协同化支撑、个性化的服务是智慧校园要达到的目标。
通过有线、无线、物联网的三网有机融合,强调“人财物入网、计算入云、数据入库”的设计理念,以及全面感知环境、网络无缝互联、支撑海量数据、开放学习环境和个性化服务,都是智慧校园的核心要素。利用大数据、信息推送、视频识别、无线定位、传感网络等各种新技术,充分重视O2O、计算入云、环境入网、大数据、无感知、自动化、平台化、碎片的整合、一站式服务的技术特点,逐渐凝炼成智慧校园完整蓝图。
进入智慧时代,传统的结构化数据已远远不够,要逐步将非结构化的数据考虑进来,如在资产管理系统中结合CAD图,实现大型设备可视化;如在一卡通平台上,结合进短信服务通讯平台、收费平台、移动支付、微信扫码、搜索引擎、传感定位等。
应该说,校园服务的互联网化是我们智慧校园追求的目标:第一、需要我们自身改变,以适应用户业务部门的需求变化。第二、以服务为核心,深化和拓展数据化的服务以及服务的信息化,让信息化成为学校业务发展的数据基础和支撑工具,让信息化真正成为一个全员创意的过程。