APP下载

采用CycleGAN模型生成石材与蕾丝纹理的创意设计思考

2020-08-07钟以恒钟尚平

美与时代·上 2020年5期

钟以恒 钟尚平

摘  要:基于循环一致生成对抗网络(CycleGAN)模型,生成了石材随机纹理和蕾丝规则纹理两大类型图像。根据视觉效果技术指标计算、生成蕾丝纹理的视觉创作缺点分析,以及设计师主观评价,揭示了两类生成图像具有的艺术价值和不同的应用价值:可直接使用生成的石材纹理,而须经过加工才能使用生成的蕾丝纹理,但可直接利用其多样无穷的灵感和创意。面对类似蕾丝的规则纹理平面创意设计,“人-机”协同是时代发展的必然。

关键词:CycleGAN模型;石材随机纹理;蕾丝规则纹理;创意设计思考

无论是在现实世界还是在视觉艺术中,纹理都是重要的感知元素[1],纹理提供了丰富的细节和多样性,这对计算机图形而言是必不可少的。如图1所示,图像纹理可分为规则纹理和随机纹理及其域变形和范围变形[2]。来自大自然的石材纹理表现出耗散结构[3],是典型的随机纹理,主要包括大理石和花岗岩两大纹理类型。如图2所示:从左到右,前三幅为大理石图像,后三幅为花岗岩图像。蕾丝是镂空织物,是人工或机器编织的网眼组织,其纹理具有一定的规则,在女装特别是晚礼服和婚纱上用得很多,也经常使用于服装的袖口、领襟和袜沿。图3为蕾丝纹理图像示例。

行业调查表明,用于仿石材瓷砖的石材纹理图案必须突破简单拷贝天然石材纹理,而用于服装设计的蕾丝纹理图案必须突破人类设计师的创意枯竭,加入计算创意元素,才能满足市场对产品的多样化、艺术化和个性化等装饰需求。传统的纹理图像计算机生成方法通过构造纹理描述特征函数,很难有效准确地反映真实图像的分布,使得产生的纹理图像在多样性、清晰度等方面性能欠佳。

2014年GoodFellow等提出生成对抗网络(Generative Adversarial Nets, GANs)[4],就引起了学术界的广泛关注,成为人工智能及深度学习领域的研究热点。其最直接的应用,就是用于图像、视频、自然语言和音乐等多种媒体的生成。目前GANs应用于图像纹理生成有两类方式,即有监督方式和无监督域映射方式。作为典型的无监督域映射GAN模型,循环一致生成对抗网络[5](Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks, CycleGAN)引入了循环一致损失函数,可以生成质量较高的图像,特别是针对目标输出无法明确定义的图像生成任务。

本文基于CycleGAN模型生成石材与蕾丝纹理图像,从清晰度、多样性、与训练集的近似程度等方面评估其视觉效果,分析其具有的创意设计美学艺术价值;在平面创意设计的应用价值和应用方法视角下,区分石材随机纹理和蕾丝规则纹理,揭示了生成的石材随机纹理具有直接应用价值,而生成的蕾丝纹理图像含有视觉创作缺点:不具有对称与平衡的构造,也不具有简洁与留白的意境,需要经过人类设计师的加工才能在平面创意设计中使用。但是人工智能对抗生成方法可无限生成多样性的蕾丝图像,理论上可以持续快速、无穷地给人类设计师提供辅助设计灵感和创意,节约设计师的时间和精力。因此,面对类似蕾丝的规则纹理图像的平面创意设计,“人-机”协同,人工智能与人类设计师交叉融合和协同共进是时代发展的必然。

一、基于CycleGAN生成的石材与蕾丝纹理图像及其视觉艺术价值

我们从福建南安石材交易市场自采集了197类、共8万张石材纹理图像,处理成256×256大小规格的石材图像集。另外,我们从福建长乐某蕾丝贸易公司自采集了6大类、共5万张蕾丝纹理图像,处理成256×256大小规格的蕾丝图像集。在Tensorflow深度学习框架下基于CycleGAN模型完成实验,开发语言为python 3.5.2,使用4块NVIDIA GTX 1080Ti GPU。实验中,我们从石材图像集中随机选取大理石和花岗岩图像各2万张作为训练样本,用近2×48小时分别训练成模型,并据此生成了大理石和花岗岩图像各1万张(可无限生成图像),图4和图5为生成的大理石和花岗岩纹理图像示例;另一方面,我们从蕾丝图像集中随机选取2万张作为训练样本,用近48小时训练成模型,并据此模型生成了蕾丝图像1万张(可无限生成图像),图6为生成的蕾丝纹理图像示例;另外,我們还从蕾丝图像集中随机选取1万张作为“纹理”训练样本,以及从石材图像集中随机选取1万张作为“风格”训练样本,用近48小时训练成模型,并据此模型生成了带石材风格转换的蕾丝图像1万张(可无限生成图像),图7为生成的带石材风格转换的蕾丝纹理图像示例。

目前,通过评价生成图像的视觉效果来刻画GAN模型的性能,具体方法如:通过计算Inception Score[6]、FID[7] (Frechet Inception Distance)等技术评价指标,来评估生成图像的清晰度、多样性以及与训练集的近似程度等视觉效果。另外,由于风格转换图像的清晰程度与“风格”训练样本的纹理背景保持一致,清晰程度很难准确反映图像风格转换的效果;在多样性和近似程度上,风格转换图像不同于“纹理”训练样本和“风格”训练样本,而是融合了两者的特征,无法采用多样性和近似程度指标去衡量。因此,在对图像风格转换图像(如图7)的视觉效果评价上,目前没有合适的技术评价指标,主要根据人的主观感受去衡量视觉效果的优劣。

研究[8]及根据人的主观感受去衡量图4、图5、图6、图7的视觉效果表明:基于CycleGAN生成的石材与蕾丝纹理图像的清晰度、多样性以及与训练集的近似程度等性能良好。

按视觉传达设计原理[9],平面创意设计不仅通过分析美学产生的视觉刺激,从而进行心理层面的影响,以此达到有效的视觉传达效果,体现艺术价值;同时,也要求达到视觉效果与使用功能的统一,将美学与应用价值相结合,注重设计作品的交互性、功能性、人性化等方面。上述表明:基于CycleGAN生成的石材与蕾丝纹理图像的视觉传达效果良好,具有美学艺术价值。以下将从平面创意设计的角度,分析基于CycleGAN生成的石材与蕾丝纹理图像的应用价值及设计问题。

二、采用CycleGAN生成的石材与蕾丝纹理的创意设计应用价值及应用方法

在平面创意设计中,设计师会遇到“命题作文”的需求,即给定某个设计目的或某种艺术风格进行创作[10]。因此,在平面创意设计视角下,基于CycleGAN生成的石材、蕾丝纹理图像要达成某个设计目的,就首先要回答如下基础性问题:有应用价值吗?价值几何?怎么用?

(一)基于CycleGAN生成的石材与蕾丝纹理图像的应用价值

石材与蕾丝行业调研结果表明:无论是具有自然随机纹理特性的石材图像,还是具有规则纹理特性的蕾丝图像,目前都欠缺判断其是否具有及具有多少应用价值的技术评价指标,只能依据人类设计师的主观评判。根据相关企业多名创意设计师对如图4、图5、图6、图7所示图像的主观评价可以得出:

1.从可用性角度看,目前以CycleGAN作为代表的人工智能对抗生成方法更适合生成随机纹理图像。也就是说,基于CycleGAN生成的石材图像与自然产生石材图像的异同已很难分辨,可直接用于生产如大理石瓷砖等产品;而生成的蕾丝纹理图像只能给予人类设计师灵感和创意,需要经过人类设计师的再加工才能应用;

2.人类设计师做设计项目有了一定经验后,往往能摸索出套路或规律性的设计方法,这可以少走弯路,提高效率,但往往也失去了设计的新意。创新一直是设计界所追随的目标。设计师是否具备创新思维与创新能力,往往决定着设计师的高度与作品呈现出的艺术价值。相比人类设计师,人工智能对抗生成方法可无限生成多样性的石材与蕾丝图像,可以持续快速(理论上)无穷地给人类设计师提供(辅助)设计灵感和创意,从而满足新时代产品设计的个性化需求,结合现代设计理念,有效提升设计高度。

(二)基于CycleGAN生成的蕾丝纹理图像的视觉创作缺点

按蕾丝行业设计师和视觉创作常用的美学原理:蕾丝纹理一般需要具有对称与平衡的构造。对称的设计,可以使人产生平和、庄重、严谨的心理感受,而平衡的摆放可以给人心理上带来稳定的感受。在视觉的形式美中,平衡性是形式美的核心。从阴阳太极图案到传统年画、剪纸、工艺品上的图案等,多数都采用了平衡的設计语言,使画面在轻重上体现出和谐的视觉效果,而不平衡则用来表现自然的特性(如:石材图像等)。如图6、图7所示,基于CycleGAN生成的蕾丝纹理图像目前并不具有平衡性。

另外,按视觉创作常用的美学原理,人类设计师常常使用“简洁与留白的意境”设计。“留白”指少量的图像为主体,具有一定章法和节奏地在画面上留出空间,给受众留有想象的余地,给画面一种正在呼吸的感觉。这一手法也是极具中国美学特征的。在朴素的设计作品中美学不在于设计形式上的复杂性,而在于对至微细节的掌控,这种掌控其实也源自对所要表达的主题的深入研究。也就是说,人类设计师往往会主观地控制画面的构图,虚实相生,而使我们想要表达的设计变得主旨更突出、核心更概括、图像也因此而更加具有意境美。一味堆积设计元素有时反而会使得画面显得拥挤,化繁为简既是设计的美学,也是生活的哲学。如图7所示,基于CycleGAN模型生成的带石材风格转换的蕾丝纹理图像,画面拥挤,整体视觉效果不够简洁、大气,目前的人工智能显然还不具备人的情感和想象力。

(三)如何用好基于CycleGAN生成的石材与蕾丝纹理图像

如上述,基于CycleGAN生成的石材图像的可用性好,可以直接用于生产如大理石瓷砖等产品。我们讨论:怎么才能用好基于CycleGAN生成的蕾丝纹理图像?

由上所述,基于CycleGAN生成的蕾丝纹理图像目前只能作为人类灵感和创意的来源,需要经过人类设计师的再加工才能使用。因此,要用好它,首先人类设计师需提炼出设计目标和设计需求,待CycleGAN模型产出多种创意设计图像后,设计师去挑选他们喜欢的创意方案,或者进行不断地重新组合,直至产生最满意的结果。实际上,通过以上工作,机器能够快速设计出符合特定内容和风格的图像,辅助设计师完成草稿;针对上节所述的生成图像的创作缺点,由人类设计师进行创意修改和细节深入。总的来说,人工智能不仅给人类设计师提供(辅助)设计灵感和创意,同时也节约了设计师的时间和精力[11]。

在基于CycleGAN生成石材与蕾丝纹理图像的设计实践中,人工智能系统作为辅助创意设计的工具,已经达到了创作或辅助创作的标准,具有较好的应用前景。

三、石材与蕾丝图像的人工智能对抗生成与人类创意设计的协同共进

在石材与蕾丝图像的基于CycleGAN的人工智能对抗生成实际中,我们再一次看到:机器适合生成随机纹理,如石材图像;而对类似蕾丝的规则纹理图像的生成,机器仅仅可以承担部分创造性工作,但是最具创新意义的转换创造,目前只能通过“人-机”协同的方式完成[12]。也就是说,基于目前的技术和算法能力,人工智能生成的蕾丝纹理设计结果相比人类设计师的作品还是非常初级的,甚至存在基本的视觉创作缺点。这正说明了人类设计师的不可取代性,人的情感和想象无可替代[13]。

另外,综上所述可知:在美学艺术和应用价值评估方面,无论是针对具有自然随机纹理特性的石材图像,还是针对具有规则纹理特性的蕾丝图像,目前都缺少较为准确的技术评价指标,只能依据人类设计师的主观评判。

但是在这个融合协同的时代,人工智能已经可以辅助设计师完成重复性的劳动,提高人类设计师的工作效率,因此,设计师更需要了解人工智能技术,懂得将它作为一个强大的辅助设计工具来使用。另一方面,目前的人工智能是没有理解能力的,更谈不上具备人的情感和想象,人工智能永远在路上[14]。社会和时代的发展为人工智能提供了学习、理解和辅助人类创意设计的机会。

四、结语

针对基于CycleGAN模型生成的石材随机纹理和蕾丝规则纹理两大类型图像,技术指标及主观评价表明:基于CycleGAN模型可生成具有美学艺术价值的石材与蕾丝纹理图像。另外,行业设计师认为:生成的石材随机纹理图像可用性好,而生成的蕾丝规则纹理图像不具有对称与平衡的构造,也不具有简洁与留白的意境,需要经过人类设计师的加工才能使用。但鉴于人工智能对抗生成方法可无限生成多样性的蕾丝图像,可以持续快速、无穷地给人类设计师提供辅助设计灵感和创意。因此,只要通过“人-机”协同的方式,我们相信,人和未来的机器将共同创造出更好的创意设计,促进设计行业变革,满足新时代产品设计的个性化需求。

参考文献:

[1]Bergmann U, Jetchev N, Vollgraf R. Learning Texture Manifolds with the Periodic Spatial GAN[C]// Proceedings of the 34th International Conference on Machine Learning, Sydney, Australia: ACM, 2017:469-477.

[2]Georgiadis G, Chiuso A, and Soatto S. Texture Compression[C]//Proceedings of the IEEE Data Compression Conference, Snowbird, Utah, USA: IEEE, 2013:221-230.

[3]申维.耗散结构、自组织、突变理论与地球科学[M].北京:地质出版社,2008.

[4]Goodfellow I J, Pouget-Abadie J, Mirza M, et al. Generative Adversarial Nets[C]//Proceedings of the International Conference on Advances in Neural Information Processing Systems, Montreal, QC, Canada: MIT Press, 2014:2672-2680.

[5]Zhu J Y, Park T, Isola P, et al. Unpaired Image-to-Image Translation Using Cycle-Consistent Adversarial Networks[C]// Proceedings of the International Conference on Computer Vision, Piscataway, NJ,USA:IEEE, 2017: 2242-2251.

[6]Salimans T, Goodfellow I, Zaremba W, Cheung V, Radford A, Chen X. Improved Techniques for Training Gans[C]// Proceedings of the International Conference on Advances in Neural Information Processing Systems, Barcelona, SPAIN: MIT Press, 2016: 2234–2242.

[7]Heusel M, Ramsauer H, Unterthiner T, Nessler B, and Hochreiter S. GANs Trained by a Two Time-scale Update Rule Converge to a Local Nash Equilibrium[C]// Proceedings of the International Conference on Advances in Neural Information Processing Systems, Long Beach, USA: MIT Press, 2017:6629–6640.

[8]徐強,钟尚平,陈开志,张春阳.不同纹理复杂度图像生成中CycleGAN循环一致损失系数优化选择方法[J].计算机科学,2019(1):100-106.

[9]曹方.视觉传达设计原理[M].南京:江苏美术出版社,2014.

[10]杜宇慧.美学思想在视觉设计中的体现[J].数码设计,2019(9):20.

[11]高峰,焦阳.基于人工智能的辅助创意设计[J].装饰,2019(11):34-37.

[12]范向民,范俊君,田丰,戴国忠.人机交互与人工智能:从交替浮沉到协同共进[J].中国科学:信息科学,2019(3):361-368.

[13]范迪安.一堂好课——范迪安谈未来的人工智能[EB/OL].[2020-03-16].http://tv.cctv.com/2019/12/08/ VIDEQtsm9rjpn9Q3l0ZDSVjA191208.shtml.

[14]张钹.走向真正的人工智能[EB/OL].[2020-03-16].https://baijiahao.baidu.com/s?id=1604667011248503461&wfr=spider&for=pc.

作者简介:钟以恒,东南大学艺术学院。

钟尚平,博士,福州大学数字与计算机科学学院教授。研究方向:机器学习。