基于人脸及设备识别技术的巡检工作平台建设探讨
2018-10-17曹蕾姜宁王焰
曹蕾 姜宁 王焰
中国移动通信集团江苏有限公司南京分公司
0 引言
数据中心机房楼具有设备资产密集、安全要求高等特点,为保证数据中心机房的安全与稳定,数据中心人员进出管理是数据中心的日常运维的基础工作。同时,组织相关工作人员对机房内的各类动环设备状态进行周期性巡查,是保障设备正常运行、防范风险的重要手段。随着互联网时代数据的爆炸性增长,数据中心机房的动环设备数量急剧上升,巡检工作量大大增加,如何进一步提高该项工作的效率与精度逐渐引起了业内人员越来越多的关注。
目前,数据中心动环巡检往往通过人工巡检、纸质文本记录的方式进行,巡检周期长导致存在长时间的间断期,不能很好地满足及时发现设备隐形故障的要求,巡检质量与人员专业性和责任心相关程度很大。在人员进出管理方面,大量采用传统的纸质登记的方式,代维人员进出缺少照片、人证比对等环节,人员无法有效核对,不便于事后查询。此外,在机房动环设备巡检管理方面:作业形式落后,设备巡检以纸质化为主,而大量纸质记录不便统计及追溯;且作业进度缺少管控,无法很好保证代维人员按时、按量、按质完成相应的维护作业计划等。
1 人员及设备管理的解决思路
1.1 人员管理
针对机楼在人员管理方面存在的效率低、可靠性差等问题,在人脸识别技术的基础上,结合目前较为成熟的图像识别技术、数据集成与处理技术等,对数据中心机房的人员出入进行智能化管理。在管理进出机楼的人员时,以身份证并配合人脸访客机作为身份核查的重要依据,通过人证对比,可获取出入人员信息,解决人证不符的问题,同时实现对运维人员进入机房的可追溯性,从而提升机楼的安全性及进出人员的安全保障。
1.2 设备管理
针对传统设备在管理方式上存在的问题,通过对管理设备增加唯一识别码,实现每台设备的精确管理。在巡检过程中,代维员工通过预约系统预约进入机楼,并扫描待检设备的唯一识别码,获取该设备的工作情况及既往检查数据,如周巡检记录、月巡检记录等,在此基础上,代维员工可上传此次巡检任务的现场检查情况至处理终端,为相关设备的检修提供依据。
1.3 管理系统的全寿命周期分析
基于上述人员进出管理技术及设备管理技术,可以有效地建立起巡检人员的工作情况数据集合,在此基础上,可以实现巡检人员的检查频次与设备故障情况的相关性分析,对于更好地配置巡检人员的巡检密度,更加有效地发挥巡检效率,具有重要的作用,从而实现人员、设备管理系统的集成化、一体化。可以实现设备维护的及时性、准确性,对于防止设备维护不及时、降低维护成本具有显著的意义。此外,可以实现管理系统的全寿命周期成本分析,有效降低管理系统的运营成本。
2 系统组成架构
本文研究的一套机房动环设备作业自动化系统,通过整合进出人员管理及设备管理技术,可以实时查询、统计进出机房的人员情况及设备作业信息,实现了对机房现场及机房设备的高效管理和安全监督。管理系统的工作流程如图1所示。
图1 管理系统工作流程图
2.1 系统架构
该管理系统包括四个平台,分别是:数据平台、CMS系统、内部管理系统及手机终端APP。其中,数据平台作为整个管理系统的基础性组成部分,包含人像识别、业务接口、消息接口等各种对外接口、对内接口以及平台的前台展现;CMS系统根据特定的算法评估机房大数据分析,主要应用于内部管理系统,与前台网站亦有交互;内部管理系统,包含公司业务的相关管理、公司机房设备相关管理、员工业务系统管理以及对平台数据进行分析等,是整个管理系统的中枢;手机终端APP主要用于工作人员的业务操作及数据传输。该管理系统的具体架构如图2所示。
图2 管理系统的组成架构
2.2 系统APP框架
作为管理系统的重要组成部分之一,系统APP部分包括:HTML5 UI层、HTML5中间件及原生应用组件。其中,HTML5 UI层是基于CSS3的UI库,提供高用户体验的Widget实现;HTML5中间件主要提供基于JavaScript的包管理和MVC框架,以及Canvas图形库和DOM操作库;而原生应用组件可以将无法用HTML5开发的部分服务通过原生语言开发,并通过PhonegGap进行打包,并提供可供HTML应用调用的JavaScript接口。
而根据框架结构,系统APP框架又包含机房管理数据平台、CMS系统、系统底层架构。作为底层的硬件架构及软件系统架构,系统底层架构主要保证平台的正常运行,保证系统平台的安全性;在此基础上,CMS系统提供平台登陆、基础管理等一整套的解决方案;而机房管理数据平台,基于底层架构,具有更加完善的功能和更强大的扩展性,APP框架图如图3所示。
图3 系统APP框架图
3 运用与效果
通过数据中心动环预约系统及访客机智能化进出方式,有效地解决了传统方式管理机楼进出人员的缺陷,对于提高出入人员的管理水平具有重要的作用。此外,该人员管理系统作为人员信息的重要获取途径,可用以相关人员的工作情况的检查。
图4 人脸访客机进出系统
设备管理方面:一方面实现了设备的有序、高效管理,对于及时、准确的定位须维护的设备具有重要意义,防止出现因设备维修不及时导致的损失;另一方面该技术能够有效地约束巡检人员的工作情况,避免出现因巡检人员的主观惰性导致设备巡检不主动、不到位、不及时等情况,改变坐班管理的同时节约了现场管理人员的人工成本,管理的规模越大节约费用越多。
全寿命周期成本分析:由于上线时间较短,目前的数据还不能较好地体现出大数据的分析功能,接下来CMS系统可根据特定的算法,评估各机房数据分析,改变设备优化缺乏可靠依据、设备厂商竞争力弱的现状。
图5 人脸访客系统截屏
4 结语
本文研究的自动化管理系统,分别利用人脸识别、设备识别码技术,实现机楼进出人员和设备的有效管理,能够提高对代维员工进出流程的管理水平,并改善代维员工设备巡检过程中不主动、不到位等问题,从而保证设备维护的及时性。此外,通过整合进出人员管理及设备管理技术,可以实现巡检人员的检查频次与设备故障情况的相关性分析,对于更好地配置巡检人员的巡检密度,更加有效地发挥巡检效率、降低运维成本,具有重要的作用。
另外,通过本次课题实践得出需求的分析过程,是系统提升质量的关键过程。分析需求过程需要提供如下信息:
(1)问题分析:可度量的目标、范围和系统考量度等;
(2)解决问题的优先级:风险分析和规模预估,先解决什么、后解决问题等;
(3)系统功能性:需求描述、非功能性需求描述、领域关系描述、测试标准和功能变化预测等信息。
上述信息的详尽准确,对系统的高质量完成至关重要,同时也是软件开发人员缩短磨合期与软件试用期的关键。下一阶段数据中心机房动环巡检研究的应用方向为人工智能,在实际工作中,需求的捕获、需求分析与建模,都需要维护人员与软件开发人员一起研究与开发,为快速解决实际运用问题提供思路与方法。