应用IPv6 技术的交互式个体识别系统
2019-08-15徐明晰
人脸识别系统近期广泛应用于政府、军队、银行、社会福利保障、电子商务等领域,如企业、住宅的门禁考勤系统。2018 年国际权威调研机构Gen Market Isights 发布的数据显示:2017 年,全球人脸识别设备市场价值为10.7 亿美元,而到2025 年底将达到71.7 亿美元,在2018到2025 年期间,将以26.8%的速度增长。据此可知,人脸识别设备市场容量大,发展前景广阔。“应用IPv6 技术的交互式个体识别系统”这一项目,将人脸识别技术成功应用在教室的门禁系统,可以通过截获人脸图像实现自动开门等功能。
项目介绍
由于目前所使用的IPv4 网络地址资源十分有限,严重制约了互联网的应用和发展。而IPv6 的使用,不仅能解决网络地址资源数量不足的问题,而且也解决了IPv4网络拥堵、载入速度慢、带宽不够等问题。
在人脸识别过程中,需要累积采集到大量人脸图像相关的数据来验证算法的准确性,大量数据组成的训练集将有效地提高识别准确性。由于IPv6 相较IPv4 拥有更大的地址空间,更小的路由表以及更高的安全性,所以若将人脸图像的信息即时通过IPv6 上传或下载,其数据安全性又能得到一定的保证,那么这时的人脸识别系统将会有更高的识别率和判断速度,将更好地应用于各个领域。
本项目通过将人脸识别和手势、姿态识别综合应用于门禁系统,形成一套门禁控制和手势操作的系统,具有广泛应用和推广价值。人脸识别系统通过优化算法方式设置更多像素点,使得采集的样本信息更加准确而精密,同时建立更大的人脸信息数据库,提高了可靠人脸相关信息的数量。
系统构成
交互式个体识别系统分为两个部分,一是改进后的人脸及姿态识别部分,二是为实现友好交互的语音识别部分,两部分的核心处理算法均布置在IPv6 服务器上,其信息传输均使用IPv6 网络协议,整体系统架构如图1 所示。
图1 整体系统架构
人脸与姿态识别由最初的adaboost 函数更新为CNN 卷积神经网络。通过使用深度学习神经网络中的CNN 算法来实现检测人脸信息。程序对单张彩图进行卷及操作,对人体每个关键点都输出一张热点图谱,用峰值来代表关键的位置。采用多个阶段进行人体姿态的学习,把第一阶段得到的所有热点图谱的预测值放进下一阶段,用一个类似神经网络进行卷积操作,它会优化上一阶段的结果。反复这个过程,直到最终结果。然后将得到的点阵与信息库中的人脸信息进行比对,从而实现识别。
通过将摄像头拾取的图像信息传送到IPv6 服务器,由简单函数识别出人脸部分并分割图像,将截取到的人脸图像传入训练好的模型中,判断完成后即输出信息至node.js 平台和控制硬件中,硬件反应为执行开门或静止,node.js sever 将数据保存至数据库并传递到网页界面更新。为了进一步实现友好交互和提高用户使用体验,项目放弃了原本的网页界面使用GitHub上的开源项目MagicMirror 的界面,并调用了一些实用类Api(如天气)。
语音识别技术由最初的识别身份定制问候语提升为具有一定功能的语音交互。
使用麦克风设备输入音频信号,通过自动语音识别技术(ASR 模型)将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列,借助微信软件开发包和神经网络模型产生相应文字类应答,此过程仍需外部Api(如用户询问天气)。最终通过TTS(Text To Sound语音转文字)模型转为声音回答用户。
未来期望
IPv6 作为下一代互联网协议,除地址数量极多,更有地址空间增大、路由表长度减小、组播增强、加入自动配置以及安全性提高等显著优势。
基于IPv6 以上优势,未来项目计划实现分析同一用户的人脸信息的变化偏值来解决常见的用户面部特征因存在微小变化而导致的无法识别问题。通过大量的用户样本分析,以期达到求出一段时间的变化偏值均值,及随时间上述变化的走势,来普遍解决上述问题。另外,通过IPv6 与人脸识别系统的结合可以让这两个部分发挥应有的功能并实现更多的价值。