APP下载

基于深度学习的计算机图形描述算法研究

2021-03-17邓卫军

微型电脑应用 2021年2期
关键词:图形学图像处理卷积

邓卫军

(湖南科技职业学院 软件学院, 湖南 长沙 410000)

0 引言

随着现代人工智能的发展,基于计算机的深度学习已经应用在现代社会的各个领域[1]。传统的计算机图形算法技术主要是以识别图像为主,需要前期人为地对图像进行预处理。为了能够更好地利用计算机进行图像的识别并提高其精度,深度学习理论得到了快速的发展[2-3]。现代计算机中利用深度学习的处理技术都需要大量的数据模型并进行相应的训练模拟[4]。

传统的计算机图形描述分类都在一定的程度上需要人工的辅助,依靠人工的经验对图像进行分类。国内外学者针对计算机图形学算法和深度学习理论都有过研究。吴发辉等[5]基于图形学算法实现了平面与参数曲面的纹理映射技术;张朝等[6]介绍了计算机图形学算法系统的设计要点;吴峥等[7]基于C++平台实现了计算机图形学等相关功能;刘俊明等[8]分析了基于深度学习的目标检测算法的优缺点,并归纳总结了单阶段检测算法的框架模式。本文主要分析深度学习的特以及基于卷积神经网络分析计算机图形描述算法的特点。

1 深度学习理论

深度学习理论是现代计算机机器学习中的一部分,其主要是利用计算机神经网络系统将高层中隐藏的信息进行建模的方法[9-10]。其主要分为卷积神经网络和递归神经网络。

1.1 卷积神经网络

卷积神经网络(CNN)主要是由5部分组成,包含数据的输入层、输出层和卷积层等。在实际的应用中主要过程是将数据矩阵中的元素与卷积层中的元素一一对应并相乘,然后将所得到的数据进行相加求和,最后将求和的结果进行赋值。针对图形识别,卷积神经网络将最终的赋值与图像的像素进行对应[11]。在卷积神经网络体系中,深度学习能够自动识别并提取图像的相关特征。具体的卷积运算,如图1所示。

一般情况下卷积神经网络包含2个卷积层和对应的池化层以及1个连接层。本文在考虑卷积网络模型的过程中,为了能够简化卷积网络神经的计算过程,设计的卷积神经网络模型,如图2所示。

图2 卷积网络模型

在考虑卷积神经网络实验中,一般假设损失函数为交叉熵损失。具体的函数表达,如式(1)。

(1)

1.2 递归神经网络

深度学习中的递归神经网络(RNN)中存在很多模型,比较常见的有LSTM(记忆网络模型)[12]。递归神经网络,如图3所示。

LSTM的模型如图3(a)所示,其神经结构单元如图3(b)所示。LSTM递归神经网络主要有各个不同的神经单元组成,神经单元主要有输入、输出和遗忘门组成。计算机通过对各个门的控制可以高效地变化输出的信息参数和模型。

(a) LSTM模型

基于计算机的深度学习采用的递归神经网络主要使用的是LSTM网络,在输入的参数中主要是图像的相关参数:宽和高,损失函数也是交叉熵损失函数。动态的递归神经网络处理数据的网络模型,如图4所示。

图4 递归神经网络模型

2 计算机图形描述算法

计算机图形描述算法是计算机图形学中的一部分,其主要是利用计算机来研究图形特征的计算模式[13-14]。随着计算机的快速发展,计算机图形学也慢慢地融入到计算机处理技术中来。计算机图形描述算法涉及我们平常生活的很多部分,包括图像处理、计算机投影成像和3D图像处理等。研究计算机图形描述算法的过程中需要深入的理解计算机和几何原理。这是因为计算机不仅需要简单的呈现画面,还需要模拟出不同的空间变化,这样才能更加准确的显现图形的准确程度。

图形与图像处理之间的转换关系[15],如图5所示。

图5 图形与图像处理之间的联系与转换

从图5中可以看出,数字图像在和模型之间进行转换的过程中需要利用计算机图形学对数字图像进行处理,而数据模型在处理图形的特征时需要进行相应的模式识别。

3 基于卷积神经网络的计算机图形描述算法

传统的计算机图形分析主要集中在人为的处理,对图像特征的提取过渡的依靠人为的工作。图形的多样性导致了在处理的过程中的复杂性,同时,人为处理图像的信息中存在很大的主观性,不能准确地提取图像的特征。基于卷积神经网络的计算机图形描述算法可以快速、准确的识别图像信息,不需要人工的干预,对于结果的准确度和速度有很大的提升。本文通过实际的实验设计来验证基于神经网络的计算机图像算法的特征及其应用。

3.1 实验设计

本文设计了一个基于卷积神经网络的计算机图形识别算法。具体的流程,如图6所示。

图6 CNN 算法流程图

卷积神经网络图像的来源大小为224×224×3。f、d、s分别表示卷积神经网络的卷积核大小、卷积层的个数和步长;p表示相应的辅助填充参数。本文提出的CNN算法模型在其前端有一份预处理层。CNN架构结构主要有5个不同的卷积层组成,每个卷积层后都添加一个BN层和ReLU层。卷积层1、2的共同点是都由两个卷积核组成;卷积层3、4和5的共同点则都由1个卷积核1个最大池化组成。其中每个卷积层中的最大池化的内核尺寸为3×3。

3.2 实验结果与分析

为了能够使得到的额数据能够准确地处理,本文利用MATLAB对深度学习数据进行了相应的分析和处理。本文选择的数据为了满足模拟训练的要求,其中80%作为训练数、10%为验证结果数集、10%为测试数据集。同时,本文的实验进行了相应的对比测试,通过对此重复实验避免数据单次测得的偶然性。

在选择评价方法上,本文主要选择的是接收者操作特征(ROC)曲线,如图7所示。

图7 ROC 曲线示意图

为评价选择的ROC曲线示意图,其主要反映的是敏感性和特异性的变化关系。图7上的点一一对应每个信号的反应程度。

其中,横坐标为负正类率(FPR),其主要的计算,如式(2)。

(2)

纵坐标为真正类率(TPR),其主要的计算,如式(3)。

(3)

式中,理想情况下TPR无限接近1,FPR无限接近0,TP、FN、FR、TN,如表1所示。

表1 二分类问题分类结果

将图像收集的样本预测进行分类,主要分为正类和负类,其在预测的过程中出现的情况如表1。另外,AUC为图7曲线的面积,AUC能够很好地反应图像处理数据的分类效果。AUC的值越大,分类效果越好。

基于卷积神经网络处理计算机图形时,AUC范围一般在0.5~1之间。对于AUC小于0.5的模型来说其算法效果是最差的;当AUC=0.5时,此时的模型没有实际的意义。

4 总结

本文研究了深度学习的两种理论:卷积神经网络和递归神经网络。通过对这两种神经网络系统进行分析可得:两种神经网络系统都能很好地处理图像的识别问题,对于人工辅助图形的描述有着很好的代替作用。同时,本文分析了基于卷积神经网络的计算机图形学描述算法,通过实验设计的方式利用接收者操作特征(ROC)曲线和其面积能够很好地判断计算机图形学描述算法的准确性,为后续学者的研究做一个参考。

猜你喜欢

图形学图像处理卷积
人工智能辅助冠状动脉CTA图像处理和诊断的研究进展
基于3D-Winograd的快速卷积算法设计及FPGA实现
卷积神经网络的分析与设计
基于ARM嵌入式的关于图像处理的交通信号灯识别
从滤波器理解卷积
基于图像处理的机器人精确抓取的设计与实现
机器学习在图像处理中的应用
基于傅里叶域卷积表示的目标跟踪算法
突出实践需求的GIS专业《计算机图形学》课程优化改革
第7届国际图象图形学学术会议