APP下载

人工智能背景下中式家具的创新设计研究

2024-02-27郑佳勇郑晓如

林产工业 2024年1期
关键词:中式家具样本

苏 晨 郑佳勇 郑晓如

(湖北工业大学工业设计学院,湖北 武汉 430068)

2023年人工智能生成内容(AIGC)蓬勃发展,以ChatGPT为代表的生成式人工智能,开启了全球第四次科技革命浪潮[1],越来越多的传统产业开始意识到AI的潜力,家具产业也不例外。人工智能的开发与应用,极大地推动了家具设计工作向着智能化、数字化方向转变。中式家具是富有民族特色和文化魅力的传统家具,其承载的区域文化源远流长[2]。中式家具智能设计研发需要综合考虑传统文化元素、现代设计理念、智能生成算法的三方融合。以中式家具的智能设计为研究对象,将传统文化元素集成到人工智能生成的算法中,优化智能设计在传统文化产品上的应用流程,提出基于卷积神经网络和扩散算法相结合的智能设计模型,从算法逻辑上实现人工智能与传统文化的融合发展,并将其应用到家具设计上,以期推动中式传统家具与当代艺术、设计、科技等领域的交叉融合,进而打造兼具时代性、前沿性和传统韵味的新中式家具。

1 人工智能在中式家具创新设计中的运用

随着人类进入了一个知识外包的全新智能时代,使用AI工具协助工作学习必将成为各大行业的重要方向[3]。人工智能在家具设计领域取得不少成果,但也存在的一些局限性,特别在传统家具产品的智能开发上。Hu等[4]构建了家具风格数据库,利用基于深度学习的图像分类方法对家具风格(如美式风格、洛可可风格、哥特风格等)进行识别与特征提取。王思航[5]对模块化家具与人工智能相关技术进行了分析,提出了一套定制化衣柜家具的智能设计方法,用于辅助设计师提高工作效率,为企业带来收益。清华大学未来实验室[6]利用图像生成技术输出320 000张新椅子图片,展现了人工智能在产品造型推敲上的先导性。然而,其生成方案的成熟度与文化价值上有所欠缺,大多数生成方案存在趋同性的问题,需要设计师对其调整与再设计。由于缺乏对传统文化的深度挖掘与数字融合,导致文化产品的智能设计会在一定程度上削弱其文化认同和区域文化价值。人工智能辅助家具设计领域有了一定的研究,但在传统中式家具的特征识别与智能设计生成的研究较少,也鲜有利用智能设计赋能传统文化产品开发的文章。

中式家具的特点是结合我国的历史、地域、习俗、信仰等因素,创造出了富有传统特色和魅力的家具产品。中式家具设计的关键在于创新和传统的协调,要将传统文化元素融入到家具设计中,需要有一定的创新能力和审美观念,避免陷入刻板印象或过度夸张。同时也要平衡好传统与现代、民族化与国际化之间的关系,使家具既能体现民族风格,又能适应当代生活和审美需求[7]。本文用人工智能辅助中式家具的创新设计,提出了基于卷积神经网络(CNN)与潜在扩散模型(LDM)的中式家具智能设计模型,从而将文化特征考虑到生成算法中,强化LDM算法对中式家具文化特征的识别和应用,最后提供中式家具的方案生成。系统架构如图1 所示。

图1 系统架构Fig.1 System framework

2 基于CNN的中式家具特征识别模型

卷积神经网络(Convolutional Neural Networks,CNN)是一种专为图像相关任务设计的特殊神经网络,可以对图像进行高效、准确的特征提取和分类[8]。中式家具的发展,亦是继承与创新的关系,研究中式家具设计,需要着重分析其产品符号语言。因此,对中式家具的创新设计需要确定中式家具产品符号的语言规则,比如确定其形态、材质、装饰等方面的特征,并在构建样本库时人为地进行分类,区分识别重心[9]。这些符号和象征作为中式家具特征识别的关键特征,将有助于CNN模型更加准确地进行中式家具特征识别和分类,判定其是否具有传统文化特色。

2.1 中式家具样本库构建

由于传统家具种类丰富,为便于开展研究,本文以椅子作为代表性家具,进而整合传统家具设计的共性研究。利用批量下载工具,从网络上下载4 000余张传统中式椅子的相关照片,并通过初步筛选,确定了1 500余个图像样本,包括完整椅子形态图、材质图和装饰纹样图。为便于后续图像模型训练,对图像做出以下规范:1)一张图片中只包含单个对象;2)图像大小大于224×224像素;3)各个特征的图片数量大致均等(不宜相差过大);4)形态图需要有完整的椅子单体,材质图需要凸显木质纹理,装饰纹样标签的纹样清晰可见。最后由专业设计师与家具领域专家进行分类筛选,并确定了形态标签的椅子图片562张,材质标签的椅子图片435张,装饰纹样标签的椅子图片519张。

表1 中式家具样本库Tab.1 Sample library of Chinese furniture

2.2 构建并训练中式家具的特征识别模型

图像分类是图像学习的基础,广泛应用于安全、交通、互联网等计算机视觉领域。传统的图像识别方法大多采用特征提取和机器学习方法[10]。该方法需要手动设计特征提取器,然后再通过机器学习算法对提取的特征进行学习与分类,而深度学习方法可以通过多层神经网络自动学习图像中的特征[11]。这种端到端的学习方式可以减少特征工程的工作量和人为偏差,简化了图像分类流程,更适合大体量复杂的图像识别任务。家具图像比自然图像更为复杂,图像细节特征更为丰富,所涉及的运算规模更大。因此,本节提出了基于CNN的中式家具特征识别方法。与传统方法相比,它具有更好的灵活性和鲁棒性,能实现对纹理、形状和颜色等特征的识别提取,得到其设计造型上的语义特征。通过设置多个分类头,最终实现对家具特征的识别,可以得出其整体造型是否符合中式家具形状特征;其表面材质是否符合中式家具纹理颜色特征;其上的装饰纹样是否具有中式家具纹样的形状特征。因此,模型的输入应该是中式家具图像,输出应该是一个向量,代表中式家具的造型语义特征和材质特征。

具体步骤如下:

1)使用Python中的OpenCV库进行图像预处理。将所有图像转换为相同的大小、颜色空间和分辨率。常用的图像预处理技术包括裁剪、旋转、缩放和归一化。在此阶段加入数据增强环节,对每个训练样本进行水平翻转。最后将每个数据样本与其水平反转的样本尺寸分辨率统一为224×224像素,作为深度网络最终输入。

2)使用深度学习框架Keras和Python搭建VGGNet 16模型,作为特征识别模型。VGGNet是一种常用于图像识别的传统深度卷积神经网络模型。VGGNet 16网络有16层,其中包括13个卷积层和3个全连接层(图2)。首先通过激活函数向CNN中引入了非线性元素,使CNN模拟真实环境中样本数据的非线性分布。为了更好地发挥其特征识别的功能,并使其收敛速度更快,构造了新的激活函数SReLU,兼具SoftSign和ReLU函数的优点,定义如下:

图2 特征识别模型的网络结构Fig.2 The network structure of feature recognition models

式中:yi为第i个激活函数f的输入。激活函数层的输入大于0时,取ReLU函数值;小于0时,取SoftSign函数值,表示不同颜色的图像通道。ac为不同颜色通道的值,控制负半轴的输入。

采用softmax对图像进行中式家具属性分类,计算公式为:

式中:FurnitureP为中式家具特征属性的概率输出;hFC3为最后一层全连接层FC3的输出。根据中式家具特征属性的概率输出,即可得到输入样本图片具体的特征形容。

该网络损失函数公式为:

式中:(x(i),y(i))为第i个样本;m为训练样本的个数;hw(x)为假设函数,表示出数据分布。

求出softmax损失函数的最小值,则是该算法训练的过程。最后模型末尾添加全局平均池化层和全连接层,三层的全连接层对卷积层提取的特征映射再进行抽象和非线性融合,得到更有效的特征表达,保持前两个全连接层与原模型一致,将FC3的输出修改为2。最后,把学习到的特征输入到softmax分类层进行细化输出,得到具体的中式家具特征识别结果,比如其形态是否符合中式家具形状的识别条件,材质是否符合木质的纹理颜色条件等。

3)训练模型并应用。在训练时,可以使用传统的分类模型训练方法,例如交叉熵损失函数、随机梯度下降等,然后需要指定合适的损失函数和优化器,例如softmax交叉熵损失函数、Adam优化器等。训练模型需要输入训练数据train_data和标签train_labels,以及验证数据validation_data和标签validation_labels,并指定训练轮数epochs和批次大小batch_size。训练参数会直接影响模型的最终应用效果。经过多次调整,具体参数如表2所示。采用Adam为优化器,它是一种自适应学习率的优化算法,兼具AdaGrad和RMSProp算法的优点,能够在训练过程中自动调整学习率。此处设置初始学习率为0.002。将步骤1)中建立的样本库按比例设置为训练集与测试集,对无法打开的数据进行清洗,最终完成模型训练。

表2 训练参数Tab.2 Training parameters

为检验网络能否正确识别椅子风格,输入20张家具图片进行实际测试,最终输出的特征识别符合率为85.6%,说明该模型真实可靠。应用中式家具特征识别CNN模型对网络爬虫爬取的25 353张有效图片数据进行特征标注,清洗不符合要求的图片数据,得到每张家具样本的识别特征并建立相应的数据集,为后续扩散模型的条件输入与训练提供数据集支撑。

3 中式家具的智能设计生成

智能设计在国内学界已经得到广泛运用。李雄等[12]采用生成对抗网络(Generative Ad-versarial Networks,GANs)和神经迁移进行手绘草图的渲染。裴卉宁等[13]运用GANs的变体——深度卷积生成对抗网络( DCGAN)快速生成汽车造型设计。程鹏飞等[14]采用基于卷积神经网络的风格迁移技术完成泳衣的图案设计。然而,目前国内对智能设计的生成算法大多都采用GANs,对于运用扩散模型进行智能设计相关研究较少。GANs的训练往往需要大量的调试和超参数优化,而且容易遭遇模式崩溃等问题。相比之下,潜在扩散模型(Latent Diffusion Model,LDM)的训练过程更加简单和直观,并且能控制图像生成过程,使得生成的图像更加符合用户的需求[15]。然而,LDM在图像生成中也存在一些缺陷。例如,对图像细节、结构特征以及样式的把控不足等问题[16]。相比而言,CNN在图像处理和特征提取方面具有良好的性能,可以加强扩散算法在细节特征与图形样式方面的把控力。文化产品的智能设计开发需要注重其文化细节特征的呈现、保留与融合。因此,本文创新性地提出基于CNN与LDM的中式家具智能设计系统,不仅是在中式家具领域智能化设计的突破性尝试,更是扩展了扩散模型的运用维度,打破了智能设计领域应用算法单一的现状。

3.1 潜在扩散模型原理

2020年提出的去噪扩散模型(Denoising Diffusion Probabilistic Model,DDPM),首次将扩散模型运用于图像处理领域[17]。2021年12月,CompVis和Runway团队进一步提出了潜在扩散模型[18],在潜空间中完成扩散过程,相比纯扩散模型快得多,在过去三年蓬勃发展,甚至间接引发了AI绘画的技术浪潮。LDM的整体流程如图3所示。

图3 LDM整体流程Fig.3 LDM process

首先利用编码器E将输入图像x压缩为低维潜在数据z。前向扩散过程会逐步向z中加入高斯噪音,一共有T步,即z0,z1,z2…zt-1,zt…zT,最终则输出噪音图像数据zT。前向过程q(zt|zt-1)指的是通过向低维潜在数据zt-1中添加高斯噪音得到zt,它是一个从t=1到t=T的马尔科夫链,分布公式为:

式中:z为一个从真实数据分布中抽出的数据q(z)[即z0~q(z)];βt(0≤βt≤1)为差异时间表(Variance Schedule),是一个随时间变化的变量。

在此过程中,需要保证T足够大和βt的设定合理。定义和αt=1-βt,再通过重参数技术,才能最后得到服从分布q(zt|z0)的任意一个样本zt。

接着输入需要条件,比如语义或者特征向量。本研究在此处对接了CNN特征识别模型输出的中式家具特征向量,作为条件输入。经语言模型τθ将它们转换为嵌入向量即低维表征形式,一般采用BERT文本编码器进行转化,并与zT进行拟合,再通过交叉注意力(Q,K,V)映射到U-Net网络层。U-Net作为扩散模型的主干网络,可以对噪音进行预测,从而实现反向去噪过程,即从高斯噪音中采样并绘制图像。由于反向去噪过程未知,因此运用U-Net神经网络对降噪过程p(zt-1|zt)进行学习。θ是神经网络的参数,该神经网络的目标是利用zt去学习zt-1的概率分布。去噪过程公式表示为:

式中:pθ(zt-1|zt)是一个需要计算均值μθ和方差Σθ的高斯分布,p(zt)=N(zT;0,I)是随机采样的高斯噪音。

正向添噪与反向去噪的过程反复进行,最终得到一个新的潜在数据z,再通过解码器D,将其解码回图像,完成新图像的生成。传统GAN包括生成器和判别器,生成器用于生成画作,判别器将判断该图像是否合格。两者不断竞争学习,迭代生成,最终输出合格的画作[19]。而LDM只需要生成器,通过正向扩散与反向去噪迭代运算完成后,重建一个以相同分布为先验的全新样本,进而解码输出图像。扩散模型的算法更加简单高效,在智能设计与方案生成方面具有很大的潜力与研究价值。

3.2 基于CNN和LDM的中式家具智能设计模型

搭建基于CNN和LDM的中式家具智能设计模型,首先要建立VAE变分自编码器,将CNN输出特征向量和原始图片数据转化为低维潜在向量。然后,将这些低维潜在向量输入到所建立的LDM模型并完成模型训练。最终输出方案,并对生成模型进行评估,具体步骤如下:

1)搭建变分自编码器(VAE),完成中式家具特征向量的输入,作为LDM模型的初始状态。在第二节中,笔者用CNN构建了中式家具特征识别模型,要将其输出结果对接至潜在扩散模型。首先,需要通过VAE把高维特征向量与调用的图像数据降维成低维潜在向量。VAE包括编码器E与解码器D,编码器将输入内容转化为低维表示形式,使得扩散过程是在该低维表征中进行,扩散过程完成后,再通过解码器将其解码编译成图片,完成最后的图像输出。Python搭建VAE主要代码见表3。

表3 VAE搭建代码Tab.3 VAE building code

2)建立并训练LDM模型。在Python中借助开源机器学习库PyTorch载入预训练的潜在扩散模型,定义一个包含多个扩散步骤的模型,每个扩散步骤包含一个可逆块和一个通道注意力机制。这里定义1 000个扩散步骤,每次生成4个图像。在潜在空间中,使用扩散模型来生成新的中式家具设计。在每个迭代步骤中,模型会从之前的图像中提取特征,然后在潜在空间中执行一个扩散过程,生成新的潜在向量。最终通过VAE逆向映射到图像空间中,生成新的中式家具设计方案。潜在扩散模型的目标是在潜在空间中生成新的样本,使得这些样本尽可能地接近于训练数据的分布,越接近于原始数据分布,说明得到的数据越像真实数据,具体的损失函数:

式中:εt为添加的高斯噪音;εθ(zt,t)是一个神经网络,用于预测从z0到zt时刻添加的噪声。

训练过程不需要对所有时间片进行训练,可以直接采样t时刻,然后得到xt并用神经网络预测添加的噪音即可。训练过程见表4 中的Algorithm 1。样本生成过程是个反向去噪的过程,也就是zt到zt-1的过程。利用前一步训练得到的εθ(zt,t),循环T步逐步去噪,即可从噪音中恢复一个像真实数据分布的新数据z0,样本生成过程见表4的Algorithm 2。

表4 训练和样本生成的伪代码Tab.4 Pseudocode for training and sample generation

完成样本生成,以中式椅子样本输出为例,图4分别采样不同迭代次数下LDM生成网络的4份输出图像数据,从左到右依此为扩散次数250次,500次,750次,1 000次。可以看出,生成的图片随着扩散次数的增加越来越清晰,表明扩散过程在不断拟合输入的特征识别条件,并越来越接近真实图像分布(图4)。

图4 不同迭代次数下LDM输出图像Fig.4 LDM output image with different number of iterations

3)生成模型评估。采用Frechet Inception Distance(FID)定量评估和专家主观评估对生成图像进行评估决策,以检验LDM模型的生成质量。FID是一种用于评估生成模型和真实数据分布之间差异的指标,主要用于评估图像生成任务中生成图像的质量[20]。FID计算生成样本和真实样本在Inception v3模型中的激活特征之间的Fréchet距离,即生成样本和真实样本在特征空间中的差异程度,公式表示为:

式中:μ1和μ2分别表示真实图像和生成图像在Inception模型中的特征向量均值;Σ1和Σ2分别表示真实数据分布和生成模型的协方差矩阵;Tr表示矩阵的迹操作。

通过计算两个分布的均值和协方差,最终得到FID值,FID越小,则图像质量越高,图像分布越接近真实数据,如表5所示。当FID值在0~15之间时,通常被认为是非常优秀的结果,表示生成图像与真实图像非常接近;特别当FID值为0时,也就代表生成图像与真实图像一模一样。FID值的大小标准与模型实际应用场景相关,当生成模型是为了进行图片去噪、高分辨率图像合成时,则FID值越接近0,效果越好[21]。但由于本研究的目的是为了辅助中式椅子创新设计工作,生成图像需要与原始图像有所不同,才有创新设计价值,因此FID值在15~30之间最佳。此时生成图像与真实图像有所差异与变动,并且图像质量水平与细节特征的完整度已达到设计要求。在训练智能设计模型时,迭代步数是指进行参数估计和主题更新的迭代次数[22]。通过多次实验发现,当迭代步数超过250次时,学习曲线的代价值与训练错误值[23]大幅增加,模型容易出现过度拟合训练数据的情况。本研究把迭代步数设置为200次,此时模型输出的图像质量和FID值基本满足设计需求,与真实图像的差异合适。专家主观评估[24]采取打分方式,邀请5位行业专家对生成方案的美观性、特征细节、图像完整性进行评分,并根据标准权重计算得出方案满意度,满意度越高则代表生成效果越好。

表5 FID值变化结果Tab.5 Change in FID value

为了进一步验证本文提出的基于CNN和LDM的中式家具智能设计的可行性,将其与GAN生成模型、VAE生成模型[25-27]、图文预训练CLIP生成模型[28-30]进行对比分析,结果如表6所示。由数据可知,本文提出的基于CNN和LDM的设计模型FID值最终为21.76,方案满意度为81.6%,优于其他生成模型。该创新性的智能设计模型得益于在设计生成阶段融合了CNN所提取的特征向量,使得生成的椅子图片所具有的中式家具特征细节更为完善美观,智能设计效果更加成熟可靠,在文化产品的智能设计上表现出极大的可行性与优势。

表6 对比结果Tab.6 Comparison results

4 结语

本文提出了一种运用CNN和LDM特性的智能设计模型,以中式椅子为例,通过CNN对椅子图像的学习,提取中式家具形状和色彩纹理特征,再将其所提取的特征向量输入到LDM中,进而快速生成兼具传统韵味和现代审美的中式家具创新设计方案。

通过对智能设计模型进行评估,与GAN、VAE、CLIP模型进行FID值和方案满意度对比发现,该智能设计模型能够有效实现中式家具的创新设计,最大化发挥了人工智能在图像处理与内容生成方面的优势,解决了文化产品的智能设计极易缺乏文化价值和传统特征的问题。

针对后续研究,将继续完善文化产品智能设计系统,建立人工智能辅助文化产品开发的科学体系,并进一步延伸至其他传统文化产品的创造性转化,为计算机技术与人文学科融合发展提供参考。

猜你喜欢

中式家具样本
新年最美中式穿搭
用样本估计总体复习点拨
家具上的“神来之笔”
现代家具创新化研究
向日常生活敬:2018danishdesign MAKERS家具展
新·中式生活美学Chinese NewAge
最美中式酒店,你去过几个?
推动医改的“直销样本”
随机微分方程的样本Lyapunov二次型估计
中式烹饪营养与健康