APP下载

客户图档信息识别算法的研究与应用

2018-03-20冯薇玺宁柏锋张国昌

数字通信世界 2018年1期
关键词:图档证件数据库

冯薇玺,宁柏锋,张国昌

(1.深圳供电局有限公司,深圳 518048;2.深圳市康拓普信息技术有限公司,深圳 518034)

随着社会经济的进步发展,用电负荷不断增长,以及用户对供电质量要求的提高和安全管理要求的不断提升,使电网管理复杂程度和日常运维工作量呈几何增长,电网管理的规范化、信息化、智能化成为了重点研究方向。南方电网公司在 十二五 实现了如何利用信息化技术实现 管理制度化、制度流程化、流程表单化、表单信息化 ,在 十三五 规划中提出了推广建设智能电网、物联网,通过技术创新和新技术应用,建设更加智能的电网的信息建设发展战略。

1 客户图档信息识别算法的具体操作流程

(1)原始数据库的构建。由于我们每个人的个人信息材料比较多,我们需要每一类都进行数据库的搭建。比如:身份证、营业执照、回乡证、港澳通行证等,由于每一类证件的排版、格式、相片位置都存在很大差异,所以为了保证后期工作的简便性,我们需要进行大量的数据采集,确保我们的数据库足够容纳的下每一类型的信息。同时为了确保信息录入和输出的精确性,在有条件的情况下我们还可以采集客户的指纹,这个工程是比较浩大的,可是一旦完成,对于以后工作的帮助也是非常大的。信息的录入需要我们每一个人的配合。

(2)提前预处理。我们将前期准备的各类证件进行了详细的分类,同时通过计算机扫描技术,对每一类证件都进行灰度化、二值化、差值算法、去噪、归一化等处理。同时根据中英文书写和印刷之间差异,设计不同的数据库,或者可以进行一个粗分类,确保我们的信息录入时正确的,通过这个粗分类可以将不同的信息准确的送到不同的信息识别引擎中去进行有效的识别,考虑到我们的相关证件由于印刷字体能问题可能会导致数据经过归一化处理后的容易出现锯齿状的现象,我们可以在系统中加入其他算法,确保录入系统中信息的完整性和准确性。

(3)识别算法的研究。为了保证经过我们系统处理过的信息所生成的二维码成为可以通用的二维码,我们需要考虑与图档信息录入系统相匹配的信息识别系统的开发,确保我们系统的自闭型能够得到有效的保护。我们通过对方向线上、穿越线特征等算法的对比研究。通过大量的实验和理论论证,最终选择了性能良好的LDA(Linear Discriminant Aualysis)降维方法,通过此方法将数据库信息压缩到原来的四分之一,识别时间缩短到原来的六分之一,而且准确率也有了非常大的提升,通过LDA算法实验数据的科学理论分析,得出了性能分析曲线图。可以作为我们强大的数据支持。

(4)信息提取算法的研究和识别系统。在基于关键字(百家姓,身份证号,联系电话、家庭住址等信息)分类的基础上,使用各类证件上的相片来辅助信息的分类,实现了信息的自动分类,而且在信息分类时还可以查出一些明显的逻辑性错误,实现一个完整的图档信息录入识别系统。

2 客户图档信息识别系统的应用

客户图档信息识别技术可以应用于电力行业日常班组作业、客户资料建档等业务场景,快速完成大量机械式采集的工作,强化数据采集与信息推送手段,提升现场数据的录入效率、质量以及信息量,推动现场作业、客户服务、身份认证等场景的革新,使员工具备更安全、更高效、更便捷、更丰富的现场工作能力,为电力行业人工智能化发展奠定基础。

(1)用户到智能营业厅办理业务,需在终端机手工输入港澳居民来往内地通行证或营业执照等资料。通过客户图档信息识别算法的自动识别和结构化整理工作,自动识别为可编辑文字,人工简单检查修正后入库,减少人工输入成本,提高输入效率,提高平台服务质量。

(2)智能营业厅通过使用身份证和银行卡自动识别实现用户信息的录入和用户身份认证,速度快,准确率高,规避恶意欺诈等业务风险。

(3)智能营业厅的身份证、银行卡和营业执照等存量图档资料,是用纸质存储。通过客户图档信息识别算法的自动识别和结构化整理工作,快速实现电子化入库,减少人工输入成本,提高输入效率,使纸质客户图档信息用信息系统管理成为可能,提高了图档数据存储和传输的安全性,方便图档信息的查询和统计,支撑智能预测和决策。

(4)通过电网图像识别平台能够为南方电网一体化 6+1系统的业务应用和多终端提供统一标准的图档识别服务,让业务系统研发者摆脱复杂的图档识别算法和模式构建,专注于应用功能的开发,提高了资源合理利用和信息共享。

(5)外单位人员管理是供电企业安全管理的一大难题,需要信息化系统进行规范化管理,由于外施工单位公司和人员较多,在系统中维护其公司和个人安全资质比较困难,维护工作量大。通过身份证识别、图档识别,通过终端设备扫描身份证等资质材料,获取外单位人员信息并自动录入信息表单,大量节省安监人员的录入和维护工作量。

(6)随着电网智能化的发展,电网的智能设备将会越来越多,部分大型的智能设备将会非常关键,如变电站和配电站中的操控设备,为了更安全地对设备进行操作,有必要将来在智能设备上安装身份识别装置(如身份识别、指纹识别,或是人脸识别),以防止非工作人员或非技术人员对设备的随意操作。

另外,我相信我们的客户图档信息识别算法未来也可以应用于其他行业的方方面面:

(7)帮助我们的政府进行人口普查工作的开展。在不久的将来我们的人口普查工作就不需要走街串巷了,很多时候只需要坐在办公室打开数据库,进行数据库扫描,针对存疑的个人信息进行有针对性的走访,减少我们工作人员的工作量,同时也是帮助我们的国家节省开支。

(8)协助我们的警察对网上在逃人员进行追缴。如果图档信息系统得到了普及,所有的公共场所都配备了这样的系统,那么我们的网上追逃人员就真的无处遁形了,配合警察同志的工作将是他们惟一的出路。同时可能会提高我们公安干警的破案率,人民群众的生活也会更加安全,提高了违法成本,对那些心存侥幸的犯罪分子产生一定的威慑力。

(9)方便我们的日常生活。图档信息识别系统的推广,我们就可以实现无证登机、无证上车,减少了大家出行等待的时间,同时即便自己的证件丢失了也不需要大老远的跑到自己的办证所在地重新进行相关证件的补办,大大的节约的我们人民群众的生活成本。

(10)加快信息化社会的构建。由于经济的快速发展,我们的科学技术也得到了前所未有的资金支持,计算机的使用已经渗透到生活的各个领域,影响着我们生活的方方面面,我们一直在提信息化社会的搭建,可是到目前为止,我们国家的信息化程度还是有很大的进步空间的,想要真正的实现社会的信息化,我们要做的努力还有很多。图档信息识别系统的开发从很大程度上推动了信息化社会的构建,由于本系统的研发都是基于内网的开展,很难遭受到外来病毒的干扰,所以系统的稳定性可以得到有效的保证。

3 结束语

客户图档信息识别系统的推广对于我们当前的社会发展是非常有必要的,这也是我们社会发展到一定程度所必须要走得路。这篇文章通过对客户图档信息识别系统的介绍:①原始数据库的构建②提前处理③识别算法的研究④信息提取算法的研究和识别系统,让我们的读者能有一个系统的概念。同时也介绍了系统在电网行业以及其他领域的应用场景,就以客户信息档案录入来计算,平均每个客户可减少3分钟的信息录入时间,可极大的提高工作效率,提高客户满意度。所以这项技术的研究是非常有价值和应用前景的。

[1] 倪怡雯,穆平安,戴曙光等;《快速眼动信息识别算法研究》[J];计算机应用研究,2014(03).

猜你喜欢

图档证件数据库
因应聘证件引发的劳动纠纷
变电站图档资料综合管理系统的研究与设计
学院成功举办2017年伊朗出入境证件识别培训班
电力设计院图档管理的数字化实现
数据库
数据库
数据库
数据库
清代样式雷图档保管研究
营销业务系统的智能化客户档案管理分析