低质量人脸图像数据库的搭建与测试*
2019-11-27刘琦
刘 琦
(河南警察学院,河南 郑州 450000)
随着技术发展,主动配合的图像采集及识别技术非常成熟,静态人脸图像识别准确率更是达到99.999 9%,无限接近于100%。但是动态人像布控中一个极为关键的问题是非主动配合人脸图像采集的质量问题。路人库中充斥着大量低质量人脸图片,因无法达到人脸检测最低标准而无法充分利用。搭建低质量人脸图像数据库,并与相对应高质量人脸图像进行比对,为下一步处理低质量人脸图像奠定基础。
1 低质量图像研究意义
人脸识别技术发展迅速[1-3],通用的图像质量评估流程如图1所示。不难发现,当图像的质量被评估为不合格后,就会被丢弃或仅仅报警处理。但是,往往路人库中存在着丰富的低质量图像,无法达到检测标准。对低质量图像进行研究,融合其他技术甚至是传统技术,较好地解决这一问题至关重要,具有非常重要的研究意义和实用价值。
图1 人脸识别系统中质量评估框图
如果低质量图像的问题得以解决,会为人们生活各个方面带来更好的安全保障。例如在公安机关涉及的相关案件处理流程中,可以简化更多侦破流程,提高办案效率。在案件侦查阶段,公安机关会从监控视频资料中截取所需嫌疑人的人脸图像,但大多数情况图像的质量极低,通过算法处理之后可以提高图像的识别概率,从而极大地缩小目标范围,提高调查取证效率。在诉讼阶段,可以更好地提高公诉质量,在电视报道中可以经常看见,检察机关在批捕或起诉各类犯罪案件时,常因为视频录像或嫌疑人图像的模糊无法有力地证实犯罪,极大地影响了公诉的进程。在证据出示阶段,往往由于现场勘验的空间狭小、光线不足等条件影响图像质量,从而因证据不足审判无法继续。
综上,低质量图像问题的解决无论是对于公安系统案件侦破效率的提高,还是对于居民人生安全的保障来看,都起着至关重要的作用。
2 低质量图像的定义
对于低质量图像,在识别时往往会出现模糊、有遮挡、亮度不够等侧重于主观方面的词汇[4-5],本文在界定低质量图像时则采用人脸图像质量评估算法来界定,当该评估结果为“低质量图像”时,则为本文所讨论的对象。
3 低质量图像的处理
本论文的研究对象为低质量图像,为更好地研究相关算法以及进行数据库的搭建与测试,从某地市公安局得到了涉及低质量图像识别的案件信息及嫌疑人图像,以下对所收集图像的具体情况进行阐述。
根据某地市公安局提供信息,共得到相关案件30 起,案件信息如图2所示,案件性质类型涉及持刀抢劫、入室盗 窃、飞车抢夺、无名女尸身份确认等;案件信息包括案件详情描述、监控视频、人脸截图、系统对比图像等;共计得到人脸低质量图像273 张,根据图像审核标准选出质量较好的图像47 张,供后文数据测试使用。
案件情况与筛选出的低质量图像汇总如图3所示,其中的命名方式为:首位数字为涉及案件的数字代码、次位数字为该图片在该案件中出现的顺序。
图2 案件信息
图3 低质量人脸图像汇总
3.1 图像分类
图像的分类使得多个图像根据自身特征信息划分到不同类别,有助于图像的检索、收集、存储与使用。相比人眼视觉效果的区分效果,科学的分类规则更能体现图像的各自特征信息。
本小节针对以上所筛选出的47 张图像,进行不同方式的分类,为数据库图像信息的录入打下基础。
3.1.1 基于图像格式的分类
图像的格式即计算机用于存储图片的格式,格式不同,也就决定着图像有着不同的优缺点,如JPG 格式图片之所以能被广泛地应用,因为它下载速度快、文件的尺寸小,各种类型的浏览器均支持该图像格式;但同时它也存在着会被压缩耗损而降低数据质量的缺点。
常见的图像类型有:JPG、PNG、TIFF、SWF、BMP、PCX、TGA、WEBP、AI、EXIF、CDR、PCD、WMF、FPX、EPS、DXF、PSD、RAW、EPS、PSD、UFO 和SVG 等,本文所讨论对象中有45 张JPG 格式图像、2 张PNG 格式图像。
3.1.2 基于图像大小的分类
作为图像属性的大小与数据库的搭建工作有着密不可分的关系,图像大小决定了用于存储该图像文件所需要磁盘存储空间的大小,它的度量单位是字节,计算公式为:
文件的大小与该图像的像素数目有着直接的关系。将图像按照大于1 G、小于1 G 大于100 k、小于100 k 分为三个等级,统计三个等级数量分别为4 张、20 张、23 张。
3.1.3 基于图像分辨率的分类
分辨率是生活中常常提到用来描述图像清晰程度的专业名词,专业来讲,它是表达图像内所含数据量多少的一个参数。包含数据越多,文件的长度越长,那么就能够展现出该图像更多的细节;然而当数据非常少时,图像就会随之变得粗糙,这样的状况在将图像尺寸放大时表现更为明显。本文所讨论的就是后者这类分辨率的低质量图像。根据数据的大小将所得图像进行了分类,分为高、中、低三个等级,分别有23 张、14 张、10 张。
上述三种方式都能实现对图像的分类,本论文的研究重点为图像的质量问题,所以本设计数据库搭建工作采用基于分辨率的分类方式进行分类。
3.2 低质量图像数据库的搭建
根据需求搭建预处理模板数据表、深度学习功能模块数据表和人脸识别模块数据表,如图4、图5、图6所示。
图4 预处理模块数据表
图5 深度学习功能数据表
图6 人脸识别数据表
3.2.1 预处理模块数据表
所得到的低质量图像的原始照片多在某些因素上被影响,其中有无法恢复的部分,比如大小、分辨率等,但部分因素造成的影响可以在预处理的流程中被处理,比如饱和度、亮度、色调等,该数据表则对图像的具体信息进行统计与存储[6-8]。
3.2.2 深度学习功能数据表
该数据库是为后续小组另一位成员算法的实现而搭建,该算法的核心思想为通过基于深度学习的训练来提升低质量图像与高质量图像的识别概率,即需要一个数据表来存储两者图像的标识,便于数据库的调取。
3.2.3 人脸识别数据表
提升低质量图像的根本目的即为获取图像中人员信息,便于公安机关展开对嫌疑人的抓捕工作或案件审判中的举证工作,需创建人脸识别结果信息存储的数据表,信息内容包含人员的姓名、性别、民族、户籍等相关信息。
3.3 低质量数据表实现与测试
在数据中添加数据表后,开始对数据库的运行做测试,部分代码如下:
运行结果如图7所示,该数据库能够调取数据表里图像的信息并进行成功比对,得出两者的相似度。由此测试搭建的数据库可以满足需求。
图7 运行结果
4 小结
本文对低质量数据库采集后如何分类,建立预处理表、功能表及识别数据表,代码实现结果的测试等问题进行了研究与技术实现。本文的工作对于进一步处理低质量图像起到较好的支撑作用。