高校人员身份信息化数据治理策略研究
2023-12-04叶宁
叶 宁
(闽江学院现代教育技术与信息建设管理中心 福建 福州 350108)
0 引言
随着教育现代化步伐的加快,以及云计算、物联网和人工智能等技术在高校中的应用,高校普遍部署了服务于教学科研改革和管理创新的各类业务系统,积累了各类校园信息化数据资产。 数据资产已成为高校的重要战略资源,部分高校建设着眼点由原来只关注数据集成和共享,逐步转到重点关注从数据生产、治理管控直到数据消费的数据全生命周期[1]。 但很多高校在信息化建设早期没有顶层设计和规划,购买了功能相对独立的信息系统,这些系统数据标准不统一,数据多源异构,数据质量参差不齐,海量数据还不能形成真正有意义上的数据资产。 数据共享不足导致各业务系统数据重复采集、数据不一致等问题,使得数据共享的权威受到极大挑战[2]。 缺乏常态化核验机制,无法反馈数据质量问题。 数据资产归口管理部门不明确,缺少“一数一源”制度。
在此背景下,各高校陆续开展了数据治理工作,期望充分发挥数据资产的价值,实现管理的精细化、决策的科学化和服务的个性化[3],数据治理技术已成为教育应用创新的重要推动力。 高校数据治理覆盖高校内数据质量控制、数据权责分配、数据价值流动等多个方面[4]。 各高校在推进数据治理工作,进行需求调研、数据分析、数据加工等过程中,发现打通业务数据遇到的大部分问题,追根溯源是高校人员身份管理的问题,特别是临时人员管理、师生生涯体系管理方面问题。 本文通过分析高校人员管理存在的问题,提出人员身份数据治理方案架构,以期提升人员身份数据对业务服务的能力,进一步满足师生的智慧服务需求。
1 高校人员数据管理存在问题
1.1 缺乏顶层规划和协调
高校在信息化早期建设过程中,缺乏顶层规划和设计,大多数以各业务部门自行建设本部门业务系统为主,由于各业务部门的身份数据一般是从自身业务视角出发,各层级人员数据、组织数据的形态和结构大不相同,导致信息系统分散化,数据共享与流通困难[1]。 很多学校领导对数据治理和数据共享关注少、指导少、参与少,部门间沟通存在较大阻力[5],相似的人员身份数据在多个系统中重复填报,且填报的数据准确性、完整性、权威性也得不到验证。 近年来,各高校逐步打通各业务系统数据孤岛,建立了校内通用平台,将线上办事、上网认证等事项都纳入校内通用平台,实现师生事项一网通办。 当校级通用信息化平台需要人员全集信息,特定的业务系统需要特定且精准的人员信息时,人员身份数据质量问题就凸显出来了。 因此,亟须确定各类人员数据从哪个系统来、由谁来负责维护,即确定各类人员的统一权威数据来源及数据维护方式,进而能在校内通用平台集成跨业务系统的同一人员的各类教学、科研、校内生活等信息。 人员数据资产归口管理部门不明确、各业务系统组织机构信息不同步、一人多号或一人多身份等问题严重阻碍了数据集成和共享的进程。
1.2 人员数据责权不清
高校人员类别多,包含教职工、学生、第三方服务人员、附属单位人员、校友、访客等。 本科教务系统和研究生教务系统中的学生数据质量较高且相对规范,可以作为学生的权威数据来源。 在编教职工一般以人事系统作为权威数据来源。 大部分编外人员如外聘任课教师、单位自聘教职工或第三方服务人员,一般由各个教学科研单位或业务部门聘用并进行考核,人员流动性大,大部分高校人事处并不直接管理这类人员,人员信息以线下数据维护为主。 在编外人员未确定其权威数据来源、未进行线上化管理的情况下,各职能部门对该类人员数据维护责权不明确,无法及时维护其信息。 同时,缺乏对人员数据全生命周期的管控,业务系统管理人员信息化水平参差不齐,数据生命周期管理意识淡薄,人员身份数据管理制度不健全、管理不规范等[6],难以提高数据质量。
一是大量临时人员过期账号沉淀。 学校存在大量临时人员,学校为其开通上网及相关业务系统账号权限,但人员离校后,一般不会主动告知相关部门,账号依然可以访问业务系统,如离职人员的VPN 账号、外聘教师的教务系统账号、各类人员的上网账号等,各业务系统沉淀了较多的过期账号,存在安全隐患。 二是人员和组织机构数据不同步。 人员信息变动和组织机构调动后,在缺乏各业务系统数据联动和维护机制时,各业务系统中的人员基本信息、历史和现状的组织机构信息经常是不一致的。 三是人员身份数据缺失。 数据标准不同、共享不畅、缺乏数据规范录入的制度、数据维护责权不明确是造成数据缺失的主要原因[7]。
1.3 一人多号或一人多身份
高校一人多号问题比较普遍,很多高校工号编码带人员属性,非编教职工转正编教职工或者附属单位人员转到校本部时,就会存在一人两个或多个工号现象;本科生考上本校研究生,同一人就会存在本科生和研究生两个学号账号。 以上描述的是同一人跨部门和跨时间的情况,但同一人在当下时间也有可能身兼多种身份,比如教职工兼本校在职研究生,或某行政部门副处长兼某学院副院长、某委员会副主任等。 对于行政部门和教学单位的职务,必须根据角色切换设置不同的审批权限。 人员身份不固定,业务系统间不联动,同一个人身兼多个身份时,在不同系统间需管理多套账号密码。 人员身份数据不完整、不精确、不连通,就无法对用户进行精细化授权。 在业务系统身份关键字段缺失时,如教职工仅有姓名和人员编号,但证件号为空,各业务系统的人员编号为自行编号,就无法通过人事数据的工号或证件号准确采集到该人员在各类业务系统的数据,这时就必然涉及不同系统账号编码之间的对应关系人工梳理和数据清洗工作。
2 人员身份数据治理方案架构
针对高校人员管理存在的问题,本文提出一种基于数据中台的人员身份数据治理方案架构(如图1 所示)。 数据中台以数据仓库和大数据平台为底座,整合数据融合集成、数据开发运营能力,实现数据“采集-存储-计算-管理-使用”全流程。
图1 人员身份数据治理方案架构
人员身份数据治理方案架构主要包括数据采集、数据治理、数据服务、数据应用、制度规范等方面。 依托数据中台的融合集成平台采集各异构数据源的人员身份信息,在制度规范下对人员身份数据进行数据治理,对多身份源进行数据清洗、整合、分类,提供人员和组织机构信息等多样化的数据服务,适配多样的数据应用和共享需求,实现人员全周期自动化管理。 人员身份数据治理流程如图2所示。
图2 人员身份数据治理流程
2.1 制定数据标准
数据治理是不断平衡组织内外众多利益群体的利益诉求的系统工程,各高校在信息化战略和目标、发展规划、信息部门职责、数据现状、投资建设等方面差别较大,适用不同的数据治理框架[6],数据治理工作没有成熟可依的数据标准、通用完善的数据平台和系统性的实施方法[3]。 在开展身份数据治理前,业务调研是非常必要的。 业务调研是针对各业务部门的组织机构、信息系统建设情况、身份数据内容和形态、供需关系、交换共享需求等进行调研了解,特别是针对人员身份相关数据标准及代码标准与业务部门进行字段级确认,逐步建立人员身份数据标准,明确数据来源和权责部门。
2.2 数据采集
人员身份数据采集是从各异构数据源采集各类人员的数据。 数据采集提供对各类型数据库数据集成功能,实现对高校各类线上系统的全量数据集成。 本专科生、研究生以及在编教职工都有明确的线上系统作为数据源,故需将无线上系统的编外人员进行线上化管理。本方案通过建设专门的编外人员管理系统,通过分级授权模式实现各个二级单位部门的临时人员管理,编外人员信息可通过该平台进行查询,让各部门权责分明。 同时,学校建设专门的流程平台(如一网通办、一张表工程等),配置人员授权和注册管理模块,规范配置人员录入和审核流程,对人员进入规则进行治理,设置账号有效期和访问权限。 此外,有的高校在建设人事系统时,将编外人员管理作为人事系统的一个独立模块;有的高校建设全人员管理系统,将在编教师、学生及编外人员等高校各类人员都纳入同一平台进行管理,都实现了编外人员线上化管理。
2.3 建设数据仓库
在数据集成基础上,将原始的多源、异构数据集中存储在贴源层数据库实例中,实现了数据的同构化、同实例化,即教务系统、人事系统等采集到的一比一数据。 标准层完成数据模型的实体化及标准化,通过对贴源层的原始数据资源进行清洗、整合、转换等,形成与数据模型匹配的标准化数据,按照主题分类、子类进行存储,实现对数据资产的持续化管理,即各类人员信息的分类重构。 服务层从业务的视角,将标准化数据仓库的数据重新组装,以便快速响应具体业务场景的数据需求,即业务系统的各类人员数据需求。
建立身份ID 体系,收集所有人员的个人ID(如身份证号、护照号等),以及业务系统(含线下数据)中人员信息,根据其中的个人ID 和业务ID(工号/学号)的对应关系,识别归属同一自然人的信息,根据个人ID合并同一个人在校期间的多重身份,个人ID 与人员唯一标识一一对应,按照多个维度重新规划人员分类方式,记录在人员信息表的相应属性中。 收集组织机构信息和职务信息,对组织机构进行分类。 对人员进行分类设计/标签化,形成统一、权威、多体系的人员信息库和组织信息库,数据对接进入数据仓库,建立校级数据仓库。 根据身份数据标准,创建数据模型如表1所示。
表1 人员及组织信息数据模型
2.4 数据质量管控
对学校现有身份数据进行质量评估,身份数据的准确度、规范度、完整度和连贯度是重点治理方向,围绕姓名、工号、学号、手机号、证件类型和证件号、身份、职务等字段进行评估。 数据质量管控流程如图3 所示。 配置质量检查规则,如非空性、唯一性、手机号有效性、身份证号有效性、工号有效性等,输出手机号为空或字段值无效、证件号码为空或字段值无效、组织为空等数据质量报告,按照“谁产生谁负责”的原则反馈给数据源归口管理部门进行整改,使其补齐相关数据。 可以设置登录统一身份认证时强制要求绑定手机号来收集手机号信息。 对各个系统中人员数据与权威人员信息进行比对,输出每个人可以登录哪些系统的信息,输出各个系统中可能已经过期、无效、错误的人员清单,反馈给各业务系统归口管理部门进行整改,以提升数据质量。
图3 数据质量管控流程
2.5 数据共享开放
在人员身份数据治理完成后,就可以根据各平台对人员和组织机构数据使用需求,从业务视角将数据仓库的人员身份数据重新组装,定制设计对应的数据资产,在数据集市上进行开放,以便快速响应具体业务场景的数据需求。 以多种接口如应用程序编程接口(application programming interface, API)、 数据抽取、 转换和加载(extraction-transformation-loading,ETL)、数据库连接等向应用供应数据,并基于安全策略、审核管理、运行监控等机制实现管理性和安全性。 比如,定制人员全集信息和组织机构信息,供校级通用信息化平台使用;定制人员分类信息和组织机构信息,供特定业务系统使用。
2.6 建立制度约束规范
身份治理涉及全校人员身份信息的治理,不管是规范人员身份信息数据源阶段,还是在治理过程中数据规则的制定以及数据整改阶段等,都需要在明确的规章制度下执行。 高校需建立符合各校实际的人员身份与组织标准规范、编外人员线上化管理规范、个人数据采集维护规范等相关制度文件,明确各系统对接认证时使用的账号规则、身份数据的生产、更新及使用规范等。
3 结语
本文通过人员身份数据治理,实现高校各类用户的全生命周期自动化管理,有利于解决用户多账号、多密码的痛点,提升用户体验;有利于规范账号管理,避免因离职账号、临时账号等不规范管理引起的数据泄漏风险;有利于打通各业务系统数据,提升管理效率,更好支撑学校各项业务,通过数据分析提升学校数据资产价值,促进高校信息化发展。