提升高校信息化数据质量
2012-11-09贾春燕赵亚萍程艳旗
文/贾春燕 赵亚萍 程艳旗
提升高校信息化数据质量
文/贾春燕 赵亚萍 程艳旗
高校数据质量问题来源及需求
近年来,多数高校已通过信息化建设积累了大量数据,但是这些数据存在很多问题,导致不能被有效利用。影响数据质量的因素主要来源于四方面: 信息因素、技术因素、流程因素和管理因素。
信息因素: 产生这部分数据质量问题的原因主要有:元数据描述及理解错误、数据度量的各种性质( 如数据源规格不统一) 得不到保证和变化频度不恰当等。
技术因素: 主要是指由于具体数据处理的各技术环节的异常造成的数据质量问题。数据质量问题的产生环节主要包括数据创建、数据获取、数据传输、数据装载、数据使用、数据维护等方面的内容。
流程因素: 是指由于系统作业流程和人工操作流程设置不当造成的数据质量问题,主要来源于系统数据的创建流程、传递流程、装载流程、使用流程、维护流程和稽核流程等各环节。
管理因素: 是指由于人员素质及管理机制方面的原因造成的数据质量问题。如人员培训、人员管理、培训或者奖惩措施不当导致的管理缺失或者管理缺陷。
随着各高校的数字校园建设逐步进入信息集成阶段,用户对信息化和数据的要求也越来越高。一方面,要求信息化对业务有更加深入的支持,从原来的“局部信息化”发展为“全面信息化”,从简单的“数据管理”发展为“信息资源综合利用”; 另一方面,信息化的重心也发生转移,从原来关注应用系统的功能和关注业务部门管理的数据,发展到了关注用户对信息的需求,业务管理人员关注跨部门的数据共享,决策人员需要决策数据支持,全体用户要求提供集成的、个性化的信息服务。因此,高校的信息化建设要进一步发展,要想真正满足信息集成阶段用户对信息化和数据的需求,就必须构建完善的数据质量管理体系,解决上述数据质量问题。
数字校园数据质量管理改进
数字校园数据质量管理整体框架
数据质量管理是一个全员参与的管控体系,涉及到数据应用和管理的各职能部门在整个管理体系中扮演着不同的角色并承担着明确的责任。各部门之间形成较为完整的协同工作模式和相应的协调机制。一方面满足快速业务发展的要求,另一方面能够逐步形成高校完整统一的数据质量管理能力,并为更多未来业务的数据应用服务,形成良性互动的工作模式。数据质量管理框架定义了数据质量管理要求,由业务需求主导,并根据业务需求制定数据质量管理策略,以指导数据质量管理的全过程。
数据标准是数据质量管理中考察数据质量状况的主要参考; 数据质量管理流程包括数据质量的监测、报告、评估及数据质量改进活动等工作环节; 岗位职责基于数据质量管理流程各步骤分解的具体任务制定,在实施数据质量管理时,将根据这些岗位职责,指定相关的负责人并明晰其职责范围; 工作模板定义实施数据质量管理流程时,各岗位人员开展工作、报告问题、联系沟通要用到的信息传递工具模板,是将数据质量管理流程标准化的重要手段之一; 数据质量问题,历史记录是评估数据质量管理效果和数据质量改进趋势的基本要素; 数据质量评估是改进的基础,帮助质量管理人员明确进一步的管理行动方向。
数字校园数据质量管理主要内容
1. 制定一个稳定的可操作的数据质量标准;
2. 建立一套稳定的数据质量监测体系,从而及时地发现数据质量问题;
3. 建立并实施一套数据质量不断改进、数据使用价值不断提升的管理机制,从而使数据质量的改进成为数据质量管理部门日常工作的一部分;
4. 建立一个可靠的数据质量评估流程,衡量数据质量的改进效果,并判断改进趋势。
实现数据质量管理的主要方法
1. 建立、健全完善的制度管理
在学校内部建立完善的数据质量管理制度,确定数据质量管理的流程; 建立完善的数据认责制度,确保数据在每个环节的质量。 同时为更好地实施相关的规章制度,在执行的过程中,建立数据认责制度与员工的绩效和奖惩挂钩的体制,成立专门的组织负责数据管理工作,使数据质量管理有章可循,确保各个环节的数据质量。完善的数据质量管理制度和数据认责制度是数据质量管理的重要环节。在具体的实施过程中可以着重通过以下几个方面来加以解决:
建立由管理层牵头的数据管理机构,推动数据质量的改进工作。
数据质量改进与管理的关系密不可分。在数据质量的管理上,需要建立一个由数据主管部门牵头,相关业务部门参与的项目小组负责数据质量标准定义和控制。责任人落实到各个系统业务主管。如果发现有质量问题,要及时向各业务部门进行通报,从而保障数据质量改进的有效推行。
制定可操作的数据质量管理制度。
管理部门需要和技术人员一起根据实际情况制定可操作的管理制度,主要的管理制度包括:分阶段定义的数据质量目标、数据评价办法、数据管控流程、统一编码、数据核对规则等。如何定义数据质量评价标准,首先前端、后端、管控部门根据其业务对数据的不同要求,评价标准各有不同( 如后端业务支撑部门对数据的要求是保障其系统的正常运行; 前端业务部门对数据的要求是真实反映业务情况; 管控部门要求数据要和财务报表保持一致) 。其次,数据仓库建设也要结合实际情况,合理制定各阶段数据质量评价标准,以保障系统建设的顺利进行。
完善的数据质量控制流程是持续改进的基础。
数据质量问题牵涉到提供源数据的业务系统,在质量改进中必然存在由谁来进行改进的问题,那么界定改进过程中系统间功能边界也是数据质量管理的难点问题。为界定数据质量改进过程中各系统间的功能边界,在进行数据质量改进实施过程中,需要根据数据质量问题的特点,制定一套数据质量控制流程,为提高数据质量水平起到了关键的作用。
制定一个完善的数据质量管理流程,以实现数据质量的持续改进,这也是数据质量管理的闭环过程在实际操作中,对由于没有形成数据质量的改进闭环出现“前清后乱”问题的解决办法。
2. 采用信息技术使流程自动化
利用先进的技术建立数据质量管理系统,采用信息技术自动完成数据质量管理相关的信息收集、规则识别与管理、质量诊断、质量报告和数据质量问题处理。只有形成一个有效的数据质量管理的改进闭环,才能发现问题并及早纠正问题,节约成本,最大化地利用数据资源。
以上两点是数据质量管理必不可少的途径,二者缺一不可。高校希望提高数据质量,但由于系统和应用程序经常接收到新数据,数据的总量也在不断提高。但提升数据质量并不是一次就能完成的,需要使用一种反复进行的阶段性过程来管理数据质量。
本文以高校信息化建设为背景,分析了信息系统数据质量问题产生的原因及高校数据质量管理需求,阐述了数据质量管理整体框架和主要内容。一方面通过完善数据质量管理制度和流程,对数据进行科学、有效的质量管理和质量控制; 另一方面通过技术手段实施数据检查,说明在数据质量管理中如何发现数据质量问题,并通过数据质量管理流程进行改进。通过这两个主要的实现途径,对数据质量管理的实现方法进行初步探讨,以期为高校数字校园过程中提高数据质量提供参考。
( 作者单位为浙江大学图书与信息中心)