APP下载

基于智能生成技术的传统招幌创新设计

2023-03-02武汉轻工大学陈莹燕通信作者李淑彤

工业设计 2023年1期
关键词:鉴别器损失智能

武汉轻工大学 陈莹燕(通信作者) 李淑彤

传统招幌是古代商家吸引顾客、促进销售和建立品牌的主要手段,它的形成源于古代商业活动中的宣传需要,其材质自然朴素,造型直观规整,色彩朴素明快,图案吉祥,历史悠久,并贯穿于传统文化和民俗之中。而如今,智能生成技术如雨后春笋般纷纷涌现,其应用也广泛渗透到了诸如计算机视觉、文化保护、自然语言处理之中。运用智能生成技术将传统招幌加以保护和创新,已成为当下文化建设的重要任务。通过将两者的结合可以更加精准地诠释传统招幌的信息内容,表达信息理念,更加形象化、细节化、视觉化实现非物质文化遗产传承[1]。

1 智能生成研究现状

近年来,卷积神经网络、生成对抗网络(GAN)等深度学习技术日趋成熟,这些技术能生成符合源数据样本风格相似的图像,使越来越多不同领域的研究者和商业公司更关注智能生成技术。在现阶段,基于深度学习的生成设计可以将语义概念网络模型和视觉概念网络模型进行组合,通过算法训练和参数调整,使计算机能够挖掘指定的跨领域事物之间的潜在联系,从而生成新的信息,这些算法有助于在给定预设目标的情况下进一步探索,并跟踪算法从概念到结果的思维过程。

因此,有望通过人工智能设计的方法来学习传统招幌的视觉表现及风格,在尽可能保持其原有视觉风格特点的基础上来进行智能生成。这样既有利于设计师摆脱既定的思维框架,又能借助人工智能技术提供的各种支持,激发设计师的创作灵感,开拓设计思路,使设计出的产品更加多样化与全面化[2]。但由于GAN的程序需要收集大量的训练与数据,目前从一些传统历史文献、书籍、照片档案中收集到的传统招幌比较有限,只能尝试根据其形象特征重构制作出一些招幌图案。文章通过利用设计学图像处理算法与计算机智能图形生成算法来进行图形数据的增强,构建了一个可包含多达1000 张图片PNG 格式的矢量传统招幌图案数据集合,运用GAN 来自动生成传统招幌。

2 中国传统招幌分析

我国“招幌”的形态表现有着近百年的历史。在原始社会时期,招幌以实物成列、口头叫卖声为主;春秋战国两汉时期,行商多以声响、演示幌子广告;坐商多以实物为幌、文字为幌(酒旗)。秦汉时期,出现了视听广告,商人用工具发声;实物展示中出现了一种新形式的垆(指放置酒缸的土桌)。北魏时期,实物陈列幌直接展示了商品本身的实物质量和特点。隋唐时期,挂在商店门前作为标志的牌子(招牌)开始出现,洛阳率先流行起“挂牌经营”和酒旗,灯笼广告也在此后开始盛行。宋元时期,抽象的幌子日益增多,开始逐渐重视装饰,采用了夸张的旗帘造型(瓶、勺、扫帚、构、碗等)装饰,形状开始从原来单一的三角形逐步变化成长方形等;颜色也从使用单一的颜色逐渐过渡到使用更为鲜艳而明亮的色彩,应用形式方面也已不断趋于完善,范围基本涵盖各种大型艺术建筑(包括彩楼、门等)。当时的店铺幌子除了有店铺行业身份识别的基础作用,还增加了一些更具自身特色的个体标识。到了元明清历史时期,从招幌的表现形式上看,大多是对中国古代早期实物展示招幌的又一种继承与创新,主要代表产品有实物陈列式招幌、实体模型幌(拥有体积及重量的物理形态概念实体物件)、招牌、符号招幌、标志幌、店铺装饰幌等形式;在使用方法上,做到有店必先有幌,一幌一店的水准[2]。作为中国商业品牌文化输出项目中较典型、较具代表性的视觉载体,招幌文化的核心地位正式确立,成为中国民俗文化宝库中极为重要的一部分。

除此之外,我国“招幌”的文字记载也可以追溯到几百年前,如韶庐的《商标考》、佚名的《北京民间生活彩图》和孟元老的《东京梦华录》等,这些传统文字主要简述了招幌的应用类型,并没有进一步的深入剖析[3]。随着当代艺术研究者对中国传统视觉艺术越来越重视,传统招幌的视觉形象研究也多了起来,研究方向也逐渐向民间工艺美术靠拢。如今,由传统招幌设计演变出的广告设计领域,智能技术已经渗入广告创作环节的工具辅助阶段。智能技术分解创意环节,实现了由整体到局部的拆解,广告创意变成了可拆分、可重组的元素组合,程序化创意将色彩、字体、文字、图片等不同部分分割开来,并组成为多种组合,这很大程度上打破了“千人一面”的传统创意模式[4]。一些学者也开始关注中国古代各种招幌广告形式的研究,但缺乏从智能生成与保护角度的系统整理,大多是零星的文章,研究性不强。

随着时代进步,不同形式的招幌所伴随的经济背景、商业环境均产生了多方面的历史变化,在大量搜阅了相关信息之后,发现有关各种招幌形式的研究资料大多仅以简单文字形式的特征描述为主,单着眼于描述出在某种经济背景和特殊环境背景下所产生出的招幌,缺少对招幌的图片记录,导致许多传统招幌的图像流失严重。传统招幌急需融合当代审美,进行传承与革新,并将人工智能为代表的新技术融入其中,寻找新的发展机遇。

3 基于智能生成的传统招幌设计实验

3.1 GAN 相关工作

近年来,深度学习的发展逐步加深,一种新的算法出现在智能生成领域,即GAN。它是由Ian GoodFellow 公司2014 年提出的算法模型,主要目标是通过学习真实世界中的图片风格去智能生成创作一些新的图片。相比于传统的神经网络模型,GAN 是一种非监督类型的深度学习方法[5],它包括两个主要部分——生成器和鉴别器,让这两者之间互相对抗,达到一种均衡,从而生成出工作者想要的图像。鉴别器的主要作用是鉴别出一张图片到底是真实显示的图片还是完全虚假的图像;生成器用于随机生成一个样本,并能将它转作为假样本。生成器的工作目标其实是以伪造训练图片来欺骗鉴别器,让鉴别器完全无法从中分辨出来真假,做法则是通过选取训练图片数据中潜在空间的元素来进行随机组合,并加入一些随机的噪音,作为假数据输入鉴别器。在实际训练的过程中,鉴别器还会自动接收到真实训练数值和生成器产生出的伪训练数值,鉴别器的任务是判断图片是属于真数据的还是假数据。该训练会一直持续到平衡和谐的状态。训练结束后产生的则是一个满足固有特性要求的自动生成器和一个判定能力较强的鉴别器。前者可以用于机器创作,后者则用来机器分类。

在智能生成中,GAN 有着更为广阔深远的现实应用与前景,理论上能训练任何一种生成器网络。首先,GAN 能更好地对数据分布建立模型,使图像更锐利、清晰等。其次,GAN 无需像马尔科夫链采样那样在学习进程中进行推测,也没有复杂的变分下界,可以几乎完美的避开因相似计算值而感到棘手的问题[6]。

3.2 传统招幌的数据集构建

要使用GAN 生成传统招幌,首先需要构造一个招幌数据集,由于可找到的招幌图片数量有限,且颜色各异,且GAN 对于数据的要求较高,为了降低GAN 的训练难度,提高生成效果。此次实验对彩色图片进行边缘提取转化成黑白图片,过程为使用高斯滤波器平滑图像。计算梯度的范围和减弱方向并在梯度增加的数值范围内执行NMS(非最大值抑制)。随后使用阈值算法进行边缘检测。最后经过canny 算子进行边缘提取,得到了1158 张二值图片。

3.3 传统招幌的生成

此次实验采用使用GAN 生成传统招幌。由于原始GAN 存在一定的局限性,例如生成质量差、训练缺乏稳定性,后来研究人员在训练稳定性上进行了一系列改进。WGAN 使用Wasserstein距离数据来定量描述所观察了解到的一些真实现象,来减轻GAN中发生的模式崩溃[7]。WGANGP 提出了使用梯度惩罚的策略来代替在WGAN 中的权重被截断,从而可产生更为出色的图像效果,并有效地避免了模式的崩溃[8]。LSGAN 使用了最小的二乘损失函数,缓解了GAN 训练结果不完全稳定和生成的图像多样性不足引起的问题[9]。SAGAN 引入到了自适应注意力机制,并在首次实现在图像生成器系统中使用谱归一化,生成出了一些相对较高质量的图像。BIG-GAN 通过采用大模型和更大的参数量而获得了性能大幅度地提升,使图像拥有更高的分辨率[10]。在目标图像风格转换的任务中,Pix2Pix 可以采用成对数据集,将同一目标域上所有的目标图像作监督的信息数据集,然后分别独立指导完成风格迁移[11]。Cycle-GAN 通过使用非平行的数据集,采用一致性损失,使用双层生成对抗网络来完成风格转换的任务[12]。

通过加入空间注意力机制,对DCGAN 网络进行改进,以达到更好的图片生成效果。卷积神经网络系统(CNN)在可监督学习领域的各种学习任务上总体表现比较良好,但在无监督的学习任务领域上表现比较不佳。DCGAN 结合有监督学习系统中使用的CNN 和在无监督学习系统中使用的GAN,使得网络训练稳定,快速收敛。且在每个卷积层之后加入空间注意力机制(SE block),使得网络更关注生成图片的空间特征,改进之后的DCGAN 网络生成器和鉴别器分别如图1、图2 所示。

图1 改进的生成器结构

图2 改进的鉴别器结构

文章所提出的图像生成模型采用图像生成对抗网络的思想,使用深层的神经网络理论来解释学习的数据风格特征,由图像生成器和图像鉴别器两个部件组成。生成器结构图如图1 所示,生成器主要包括微步卷积层、批量归一化层和激活层,它通过任意一个100 维的随机向量,学习传统招幌图像中的数据风格特征分布,来生成某种特定的数据风格特征的传统招幌图像。当一组100 维左右的随机向量输入生成器后,通过四个微步卷积的操作来进行连特征提取,并将最终数据通过一次注意力机制(SE block),映射到了一张128×128 像素所组成的图像上,图1 中的每个箭头分别表示为每一个微步卷积层的操作。鉴别器结构如图2 所示,当128×128 位像素的图像输入鉴别器之后,鉴别器通过卷积连续下采样提取图像8×8 通过线性和激活层区提取图像高级特征。它通过需要区分图像生成过程中的图像数据,并尽可能有效地学习如何严格区分生成的合成图像和真实的图像,最终使用图像生成器中的生成的图像输出与其输入数据符合于真实的合成图像,使实际生成的图像数据无法严格的区分图像生成鉴别器数据信息的分布。方法中并未包含使用的全连接层和池化层,所有的权重都将自动被初始化为一个标准差为正负各0.02,均值为负正至0 之间的正态分布。实验中使用批量归一化梯度的操作方式来标准化权重,优化网络梯度,以尽量避免训练时梯度消失。同时在激活层上使用到了非线性的LeakyRelu 激活函数,一方面更加容易的提高了计算和收敛的速度,另一方面又解决掉了梯度的消失现象和一些神经元没有完全被激活的问题。保证训练更加稳定。

损失函数包括生成器的损失函数和鉴别器的损失函数:

z 分别为表示发送图像和输入图像信号返回到图像生成器中指依照实际情势进行的自由组合的图像信号的向量,G 表示生成器的损失函数,D 表示鉴别器的损失函数。在整个GAN 中,可以通过最小化生成器中的损失,使得随机生成出来的图像信息更容易欺骗鉴别器网络,并被判断为真,而如果同时能通过最小化鉴别器中的损失,使得鉴别器鉴别效果更准确,将真实的图像判断为真,将生成的假的图像判断为假。生成器和鉴别器损失函数均使用Adam 优化器来最小化损失函数。

4 传统招幌的智能生成设计结果

此次实验使用NVIDIA GeForce RTX 3070 显卡训练生成对抗网络,经过48h 的训练,模型收敛,生成器与鉴别器达到稳定的结果。

基于传统招幌的智能生成方法,通过输入制作好的招幌数据集进行训练,模型训练完成之后,可使用生成器随机生成多种风格的招幌图,减少人工制作招幌的成本。但对于GAN 的训练,与分类、检测等计算机视觉任务不同的是,GAN 的训练过程类似于一种创作的过程,其模型与原理更为复杂,对数据集的要求也更高,训练周期也更长,故在使用GAN 进行传统招幌的智能生成时,应注意以下几个方面:

1)高质量的数据集。实验中,GAN 通过学习传统招幌数据的特征,来智能生成新的招幌图片。生成的招幌图片的质量极大程度上取决于训练时的数据集质量。由于制作数据集的人力成本很高,为了使GAN 不产生欠拟合的问题,故简化了生成目标,将制作的数据集进行二值化,仅用白色表示招幌的轮廓,其余部分则为黑色,这样在训练过程中,灰度值仅需要除以255 则可规范化,简化了训练过程。

2)模型的选择。模型的选择直接决定了GAN 的智能生成效果,由于实验中制作的数据集规模比较小,故不适用于复杂的模型,因此采用了一个轻量级的网络,并引入了空间注意力机制,提高了传统招幌的智能生成质量。

3)损失函数的确定。一个良好的损失函数类似于一个好老师,引导着模型去达到想要的结果,使得模型收敛更快,训练更稳定在函数GAN 中,由于有两个部分存在—生成器和鉴别器,所以损失函数中还需要同时包括这前两个部分,这里采用的是交叉熵损失,充分考虑了两个部分的损失。

4)优化器的选择。在选择了损失函数之后,Adam 优化器的优化效率对GAN 十分显著,避免了梯度消失等问题。

由于数据集较小且风格较为单调,智能生成效果依然有一些局限性,后续准备制作一个更大的数据集,且对模型进行适当的改进。此外,由于采用GAN 的生成方法,不需要人工参与,不能朝着设计者所希望的方向进行生成,后续也准备尝试,将生成任务变为仅仅生成招幌的部分元素,使设计者能够有一些自主的空间进行发挥。

5 结语

文章提出了一种基于智能生成技术的传统招幌创新设计方法,通过分析GAN 的训练以及生成过程,首先制作了一个关于传统招幌的数据集,为了简化任务,对招幌数据集进行边缘提取,并将数据二值化,输入改进的GAN 进行训练。训练完成后,生成器可智能生成一些高质量的黑白边缘的传统招幌图片。该方法对弘扬传统文化,简化设计师设计过程具有重要意义。

猜你喜欢

鉴别器损失智能
基于多鉴别器生成对抗网络的时间序列生成模型
胖胖损失了多少元
卫星导航信号无模糊抗多径码相关参考波形设计技术*
玉米抽穗前倒伏怎么办?怎么减少损失?
智能前沿
智能前沿
智能前沿
智能前沿
阵列天线DOA跟踪环路鉴别器性能分析
一般自由碰撞的最大动能损失