视觉图神经网络的人脸识别方法研究
2024-02-09汤文昊
摘要:近年来,随着深度学习技术的飞速发展,一种基于视觉图神经网络(Visual"Graphic"Networks,"VGNN)的人脸识别方法受到了广泛关注。"VGNN是近年来兴起的一种深度学习方法,它把图像表示成图结构,并通过神经网络来学习图像的特征与关系。在人脸识别领域,图像神经网络能够通过学习人脸图像间的相互关系,从而完成人脸识别任务。首先,介绍了"GNN的基本理论与体系结构;其次,详细阐述了基于视觉图的神经网络模型体系结构与训练方法,并进行了实验验证。研究成果可为后续的人脸识别研究提供借鉴与参考。关键词:人脸识别"图神经网络""空间多尺度"注意力机制
中图分类号:TP391.41;TP183
Research"on"Facial"Recognition"Method"of"Visual"Graph"Neural"Network
TANG"Wenhao
Heilongjiang"University"of"Business"and"Technology,"Harbin,"Heilongjiang"Province,150025"China
Abstract:"In"recent"years,"with"the"rapid"development"of"deep"learning"technology,"a"facial"recognition"method"based"on"Visual"Graphic"Networks(VGNN)"has"attracted"extensive"attention."VGNN"is"a"deep"learning"method"that"has"emerged"in"recent"years."It"represents"images"as"graph"structures"and"learns"the"characteristics"and"relationships"of"images"through"neural"networks."In"the"field"of"facial"recognition,"image"neural"network"can"complete"the"task"of"face"recognition"by"learning"the"relationship"between"facial"images."Firstly,"the"basic"theory"and"architecture"of"GNN"are"introduced;"Secondly,"the"architecture"and"training"method"of"neural"network"model"based"on"visual"graphs"are"expounded"in"detail,"and"the"experimental"verification"is"carried"out."The"research"achievements"can"provide"reference"and"guidance"for"the"subsequent"facial"recognition"research.
Key"Words:"Facial"recognition;"Graph"neural"network;"Spatial"multi-scale;"Attention"mechanism
人脸识别是一项非常重要的生物识别技术。人脸识别过程中,需要通过大量的人脸图像来判断是否为同一人。传统的人脸识别方法一般都是手工设计特征并提取特征。随着计算机视觉技术的不断进步,基于深度学习的方法也得到了广泛应用。基于此,提出了一种基于视觉图谱神经网络(Visual"Graphic"Networks,"VGNN)模型。VGNN由特征抽取层和分类层两部分构成。特征提取层采用卷积神经网络对人脸图像进行特征提取;分类层采用通用分类器对不同的人脸图像进行分类;在人脸识别领域,图像神经网络常被用来解决诸如光照、表情、姿态等复杂问题[1]。该算法能够有效地从人脸图像中提取出特征,利用深度神经网络对人脸图像进行识别与分类。在实际应用方面,图神经网络已在安全保卫、身份认证等方面得到了广泛的应用。本文主要介绍了基于视觉图的神经网络技术及其在人脸识别领域的应用与实践。在此基础上,本项目还将对这一研究方向进行展望。
1"视觉图神经网络的人脸识别模型
VGNN是一种新兴的人工智能技术,可以被应用于人脸识别。VGNN采用深度学习技术,其核心网络层"VGNN具有学习人脸特征的能力。在人脸识别方面,"VGNN可以用来识别不同的人脸特征,提高识别的准确性。首先,"VGNN网络的核心部分是由大量的节点和边构成的可视图结构。其中,节点代表了不同的人脸特征,而边则代表了人脸间的相互关系。VGNN通过自主机制学习节点间的联系,提高了识别精度。其次,基于图的卷积运算,提出了深度网络模型。该方法能够同时捕捉到人脸的整体与局部特征,提高了人脸识别的准确性。VGNN通过把多个节点连接起来,能够识别不同个体间的相似性和差异性,从而提高识别的准确性。
2.实验部分
VGNN是一种基于深度学习的人脸识别模型[2]。该模型以深度学习算法为基础,将图像特征显示成图结构,实现人脸识别。该网络主要由多个结点和边构成,每个结点对应一张图,用来描述输入图像和输出的对应关系。节点间的关系是由节点间的边连接起来的。VGNN技术的核心问题之一就是如何确定节点之间的连接关系。为此,本项目提出一种基于"长短期记忆网络(Long"Short-Term"Memory,LSTM)的学习速率调控机制。该机制能够根据节点间的相互关系等信息,自适应地调整学习速率,从而提高模型的预测精度和推广能力。在"VGNN中,采用了一种开放源代码“PyTorch”来训练模型,该框架由输入层、输出层和优化层3个部分组成。其中,输入层负责将图像输入到图像输出层,由图像输出层完成特征提取与分类;图表输出层被用来以图表结构来表达特征;优化器用来调节学习速率,提高模型精度。实验中,利用公共数据集"MNIST与CIFAR10对模型进行训练与检验。本文采用梯度下降法和交叉熵损函数对模型进行了评价。在此基础上,引入一种新的损失函数对模型进行改进,使其具有更好的预测精度和推广能力。实验证明,基于"PyTorch框架构造的"VGNN模型在人脸识别方面具有较高的性能,能有效地提取图像特征并精确分类。相对于其他深度学习算法,"VGNN在性能、泛化能力等方面都有较大的提高。
2.1实验设置
VGNN以卷积神经网络(Convolutional""Neural"Networks,CNN)为基础,能够对人脸图像进行检测与分类。该模型使用了局部卷积和全局卷积两大基本组件。利用局部卷积对图像进行细节提取,利用全局卷积学习图像结构特征。该算法的每一卷积由一个完全连通的层构成,该层包含若干个分岔点和一个分岔点。本研究利用公开数据集,共400张人脸图片,包括正、背、半侧面3种人脸图像。本项目以人脸数据为训练样本,利用预训练好的模型对所提方法进行验证。采用"FasterRCNN算法对预训练模型进行训练,并采用微调策略对其进行微调[3]。实验中,将测试集划分为训练集和测试集,分别用来评价所提出的方法,并对所提方法进行评价。在训练过程中,采用批量标准化、激活函数、损失函数、正则化等方法对模型参数进行调整。批量标准化可解决过学习问题,激励函数可选用多项式或"Gabor函数,损失函数可选用梯度下降法或交叉熵损函数。正则化项可调节模型的正则系数,以降低过拟合问题。本研究利用VGG16、VGG19、VGG15这3个模型对本项目提出的方法进行了验证。在测试过程中,将测试结果和其他方法做了对比。实验结果表明,该算法对不同类型的人脸图像都能进行精确的识别。
2.2实验训练超参数设置
(1)数据集:本研究选取常用人脸图像库,包括"Yale"Fusion、"ImageNet等[4]。(2)图像预处理:对图像做一些预处理工作,如灰度化、降噪、归一化等。在训练"VGNN模型时,采用梯度下降的方法,设定学习速率和梯度衰减系数。(3)模型体系结构:本文选用三层"VGNN体系结构,包含卷积层、池化层和全连通层。(4)超参数值设定:会使用一些超参量,如学习速率、正规化、批尺寸等来控制模型的效能。这里需特别指出的是学习速率这一超参数值的设定:当学习率提高时,模型的准确性会降低。因此,设定适当的学习率,以控制模型的准确性。(5)规格化:规格化可借由增加规则项来降低模型过拟合风险,但却降低了模型的准确性。批数是一个非常重要的参数,它直接关系到模型在训练集与测试集中的性能。为了在精度与速度之间取得平衡,设定了适当的批数。(6)训练策略:采用随机梯度下降法对模型进行训练,通过调节学习速率、梯度衰减系数等参数,实现模型精度与速度的控制。(7)评价指标:使用一些评价标准,如准确率、召回率、F1得分来评价模型的表现。实验结果表明,该模型具有较好的识别效果,且具有较高的识别精度。
2.3损失函数
VGNN是一种以深度学习为基础的人脸识别技术,其核心是损失函数。基于此,本项目提出了一种基于"VGNN的人脸特征提取方法。此损失函数使用名为“softmax损失”的新损失函数[5]。在此基础上,结合特征与上下文信息,提出了一种改进的人脸识别方法。在训练模型时,通过融合特征与上下文信息形成新的特征矢量,并以此矢量为输入,实现人脸类别的预测。相较于传统深度学习模型,"VGNN模型在特征表达能力、识别精度等方面有较大提高。另外,该模型具有很好的扩展性,可以根据不同的人脸图像及背景进行自适应调整。实验结果表明,该模型能够有效地识别出不同性别、年龄、表情、姿态等特征的人脸。最后,提出了一种基于"VGNN的人脸识别算法。该算法采用了一种新的损失函数,能有效地处理各种人脸图像及背景。
2.4评价指标
在视觉图神经网络中,通常采用多种度量方法对模型进行评价。其中,识别率和准确性是最常用的度量。识别率是指模型对已有标签的人脸图像进行再识别的程度。正确率是指模型在无标签人脸图像上的再认程度,一般用F1得分来评价。另外,本文还给出了准确度、召回率、F1得分等指标。其中,正确率指有标签与无标签图像的分类精度,一般用F1得分来评价;召回率是指模型对有标签与无标签图像进行检测与修复的正确率,通常用F1得分来评价;F1得分反映了模型在有标签与无标签图像之间的正确识别率,一般用F1得分来评价。在"VGGNN中,不同的度量指标对人脸识别模型的评价结果也不一样。例如:基于图像特征的人脸识别模型可能更适用于识别率指数,而基于序列数据的人脸识别模型则可能更加适用于精度指数。基于图神经网络的人脸识别模型需要综合考虑多个指标才能对其进行评价。在实际应用中,可根据具体需要选取合适的评价指标。
3"实验结果数据分析
首先,将了解"VGGNN的架构。该网络由人脸图像、邻接矩阵和图像量3个部分构成。人脸图像由两层卷积层和全连通层构成,图的矢量是随机的种子节点。首先,用"ImageNet来训练模型;本研究以10"000张人脸图像为训练样本,其中正面图片10"001张,背面图片10"001张。在此基础上,利用优化器自适应矩估计(Adaptive"Moment"Estimation,"Adam)训练模型,通过不断调节学习速率,实现模型参数的自适应调节。最后,用测试用例验证了模型的有效性。在训练阶段,采用多种损失函数对模型进行评价。其中,均方误差(mean-square"error,"MSE)和平均绝对误差(Mean"Absolute"Error,"MAE)是最常用的损失函数[6]。"MSE表征了模型对人脸图像分类的正确率;MAE表征了模型识别人脸的准确性。而最常见的损失函数为交叉熵损函数和余弦损耗函数。这些损失函数有助于对不同数据集下模型的性能进行评估。最后,通过实验数据对"VGNN模型的数据进行了分析。实验结果表明:"VGGNN模型对于各类人脸图像具有良好的识别能力;VGGNN模型能够准确地识别前、后两类人脸图像。其次,"VGGNN模型具有更强的泛化能力,同时也更具稳健性。经过优化,"VGGNN模型可适用于各种人脸图像。
4"结语
综上所述,本文主要研究了基于视觉图神经网络的人脸识别方法。实验方面,将利用"Gabo、"Laplacian、GramSchmidt、"Butterworth等多种图神经网络结构与算法,比较各种算法的性能,寻找最优解。实验证明,本文提出的方法能较好地完成人脸识别任务,并能对人脸进行正确的识别。同时,项目的研究成果也可推广到虹膜识别等其他生物特征识别领域。然而,由于视觉图网络本身的复杂性、算法的多样性,以及不同算法间的差异性等问题,仍有待于进一步的研究与改进。
参考文献[1] 魏永超,朱泓超,朱姿翰,等.视觉图神经网络的人脸识别方法[J].现代计算""""机,2024,30(3):18,17.
[2] 王晨海,彭婵娟.基于机器视觉的局部遮挡人脸图像识别仿真[J].计算机仿真,2023,40(11):170174.
[3] 季瑞瑞,谢宇辉,骆丰凯,等.改进视觉Transformer的人脸识别方法[J].计算机工程与应用,2023,59(8):117126.
[4] 张净.基于视觉的人脸属性分析:表情识别与人脸几何感知[D].杭州:浙江大学,2022.
[5]韩笑,韩剑.基于融合分层视觉感知的人脸局部特征识别[J].计算机仿真,2022,39(7):184188.
[6] 罗岩,冯天波,邵洁.基于注意力及视觉Transformer的野外人脸表情识别[J].计算机工程与应用,2022,58(10):200207.