生成对抗网络在计算机视觉领域的应用探索
2019-09-05王靖
王靖
摘要:现在计算机已经在我们的生活中无处不在,所以计算机的一些技术也在不断的更新,生成式对抗网络就是在这样环境下的产物。生成式对抗网络的特点就是有独特的零和博弈和对抗训练的思想形成的一个高质量的样本,比传统的机器学习算法有更加强大的表达能力。现在是当前研究的热点方向。
关键词:生成对抗网络;计算机视觉领域;应用
在2014年的时候Goodfellow等人提出了一种生成式的深度学习的模型叫做生成式对抗的网络。这个模型一提出就深得计算机视觉研究领域的喜爱。现在深度学习和移动设备都在快速的发现,但是关于图像生成和图像处理等方面已经被很多人进行了研究。生成对抗网络可以为了弥补一些数据上的不足生成一些目标的数据集。还能够在生成对抗网络上进行图像翻译和文本和图像之间的相互生成。
计算机视觉就是计算机在使用过程中的一些相关设备对生物视觉出现的一种模拟,最终出现让计算机像人们一样可以通过视觉看世界,计算机视觉能够自己适应环境。要想判断机器能不能理解现实的世界时,就可以看它能不能創造出一个真实的世界,如果人们不能分辨出是真实还是虚假的时候,就通过了图灵的测试。在计算机出现之后,就在世界上出现了许多的生成算法,在传统的算法中是利用手工提取的办法和浅层模型组合进行结合从而实现目标的生成。
一、生成式对抗网络内容
(一)生成式对抗网络的结构
生成式对抗网络有两个模型存在:一个是生成模型,还有一个是判别模型。生成器和判别器都是函数,使用深层神经网络来实现。生成式对抗网络结构如图
所示:
在生成对抗网络中有极大和极小的双玩家游戏的时候叫二人零和博弈。这里面包含两个神经网络的零和游戏框架中进行相互的竞争。在系统中游戏的名字用函数来表示,这些函数都是可微性的。两个玩家都是有自己定义的函数。两个玩家的损失函数都需要依赖对方的函数,但是不能进行更新,在训练之后也会达到一个纳什均衡。
(二)生成网络方面
生成器可以用微函数的方式来表示,当随机输入一个变量的时候,一般是利用高斯变量来生成一个假的样本分布。所以对于微函数中就要求需要有少量的限制条件,对于输出的变量可以是第一层,也可以是最后一层。但是要注意的是,这个微函数必须是可微的,因为这样经过判别器的时候就会通过梯度来进行参数的更新,要不然就会出现传递不了的现象出现。
(三)判别网络方面
在生成对抗网络中,判别器最主要的目标就是要判断输出的是不是真实的样本,并且在根据这种真实的样本进行及时反馈。在和生成网络构成一个零和的游戏。这个游戏主要是由两种场景组成的,两个玩家的模型要通过足够的训练,这样游戏才会达到一个纳什的均衡状态。
(四)生成对抗网络的优缺点
自从生成对抗网络出现以后,在许多的领域里面都会提到生成对抗网络。在最开始提出这个的时候,假设的验证出现的很少,在数据方面几乎没有任何的假设,是随便存在的,最终的目标都是要让生成对抗网络有一个无限制的建模能力。其实生成对抗网络的模型在设计的时候是非常简单的,不需要先设计出一些复杂函数模型,利用反向传播算法的训练网络就能够让生成器和判别器能够正常的进行工作。生成对抗网络还能创建许多不需要监督的学习模型,这些模型都有非常厉害的算法框架,是用机器和机器进行对话,在通过自身的对抗和博弈,在经过无数的数据训练的方法,真正的学到一些和现实世界有关的内在规律。事情都是有两面性的,有利就有弊,在无限建模能力的目标的存在背后还存在很多的问题,因为生成的时候太过于自由的存在,就会在训练的时候很难保证稳定性和收敛性,这个时候就会出现模式崩塌的现象,更严重的能够导致训练没有办法继续进行;传统的生成对抗网络要是梯度消失了,就会在训练的时候非常的困难,还能够导致生成器和判别器出现一些损失;因为生成对抗网络本身的热点,很难生成离散的分布。现在提出新的生成对抗网络的目的都是为了更好的增加模型的稳定性,从而更好的保证生成结果的质量。
二、生成对抗网络在计算机视觉领域的应用
(一)能够在计算机里面生成一些高质量的图像
生成对抗网络最开始只是应用在图像生成和建模上,因为不管是监督学习还是不监督学习的方式,生成对抗网络都能够记录真实的数据。研究者一直在经过不断的研究,为了让生成的图像更接近真实的图像。
(二)能够在计算机里面进行风格迁移和图像翻译
生成对抗网络在计算机上还有一个有意思的应用就是风格迁移,意思就是把图像从一种风格的情况变成另外一种的风格。
(三)能够在计算机上进行文本和图像之间的互相生成
生成对抗网络能够在图像数据库里面,经过训练生成和真实进行一些相似的分布,例如:生成对抗网络可以在人脸数据集上通过一些训练,就可以生成一些人脸分辨不出来的图像,这些都是通过直接学习的方法进行分布的。
(四)能够在计算机上进行图像还原和修复
现在人脸识别的技术在实际生活中应用的越来越多,但是这种密集人群在检测的时候就会非常的困难,这时候就需要利用一些科技的手段对局部到整体的信息进行识别。这时候就可以利用生成对抗网络的技术提出双路径的生成对抗网络,这种技术就能很好的改变现在的问题。
三、结论
作为一种生成模型的生成对抗网络,为一些问题提供了很好的解决方法。还分析了生成对抗网络在计算机的视觉方面的应用。其实生成对抗网络就属于是一个包容性的框架,这个框架能够和许多的学习模型进行结合,解决了许多传统机器解决不了的问题,为计算机事业做出了许多的贡献。
参考文献:
[1]王坤峰,苟超,段艳杰,等.生成式对抗网络GAN 的研究进展与展望[J].自动化学报,2017,43 (3):321-332.
[2]郑华滨.令人拍案叫绝的Wasserstein GAN[EB/OL].2017-04-02 [ 2018-01-20 ].https://zhuanlan.zhihu.com/p/25071913.