深度学习下椅子造型特征标签识别与智能设计
2024-05-19常健楠李雪莲
常健楠 李雪莲
关键词:椅子设计;造型特征;深度学习;多标签学习;生成对抗网络
引言
家具有较为明显的要素特征,基于这些要素特征可以把椅子分为很多类别。设计师接受椅子的委托任务时,通常会基于所要求的使用场景、功能风格等进行设计构思,但是始终都会落脚到椅子的造型结构特征上。
传统的设计方法中,设计师需要花费大量时间和精力去寻找椅子的相关信息,判别出可以提供设计灵感的图像,分析图像中的设计要素等,从设计知识中激发出可以用于创新的设计灵感,这种漫长的过程耗时耗力,效率不高,进而导致了设计的创新能力不强。随着大数据、人工AI、深度学习等技术的日益成熟,渗透到各个行业,也给设计的创新设计方法带来了新的思路与方向。
大数据与深度学习带来一场思维的变革,也逐渐延伸到了产品设计领域,改变了传统的产品设计开发流程。大数据技术已经成为设计各个阶段的有力辅助工具,如利用大数据在设计调研阶段获取用户画像和创意灵感[1]、 指导产品色彩设计[2]、对工业设计创作流程的阶段优化[3] 等。大数据全面、及时更新的特点正在给设计赋能。研究由大数据人工智能赋能的产品造型设计新方法,对于设计师来说,可以提升设计流程,创新设计方法,提高设计效率;对于企业,可以降低成本,提高新产品设计开发速率,更好地适应市场需求与发展。
一、研究现状
在家具造型设计领域,张轶[4] 以符号学为理论指导,采用家具符号关联的手法,对家具造型要素符号进行处理与组合;史青[5] 指出家具造型设计过程不是单纯的形态塑造,家具设计应巧妙地构思审美艺术与使用功能等;宋艳彬[6] 家具的形态学,横贯整个家具的设计过程,是家具造型设计的基础,强调了其在家具设计中的重要性。而明确以椅子为主题的研究相对较少,张祖耀[7] 通过结合信息单元法和信息交合法,对椅子的设计需求展开分析,围绕功能、形态、材质、结构、色彩等要素构建了椅子的设计信息框架,并依據设计关键词开发设计的创新点。朱婕[8] 依据以往的翻译经验与艺术修养,深入了解德古拉·德·吉尔(Nicolai de Cier)教授关于构造的概念后,以椅子为例,对椅子进行了类型学的归类分析和设计概括。蔡文欢[9]基于感性工学相关方法,再结合统计分析方法与形态分析法,构建了办公椅情感化造型设计法则。
在图像识别应用领域,朱斌[10] 等使用卷积神经网络技术,研究椅子的情感意向识别并构建了产品意向识别模型。朱海鹏[11] 使用卷积神经网络识别家具的风格,以椅子为例,构建椅子风格识别模型并生成新图像。李怡[12] 等使用多标签学习技术对图像进行分类标注,形成了灵活分类的产品图像数据库,方便设计师利用标签检索并设计。
二、人工智能赋能椅子设计
在椅子设计中,设计师通常根据甲方提出的设计要求,基于自己的设计经验进行判断。需要调研大量的同类椅子产品图像进行设计参考、要素分析和汲取灵感,在大数据的设计背景下,产品图像造型的数据量暴增,而设计师还是通过人为手工的方式进行造型特征分析,工作量巨大,已经不能适应当下的设计节奏与需求。椅子产品图像隐藏着丰富的有效信息,缺乏相应的工具方法挖掘这些数据的价值。随着设计大数据的发展,依据数据驱动展开设计的创新方法出现,这是一种基于数据的创造力而研发的设计方法,将数据作为设计创意的中心[13]。
目前,人们对椅子的产品形态的研究多集中于感性工学,研究椅子造型与感性意向之间的关系。而在计算机技术高速发展的当下,图像所呈现的形态信息作为一种很可贵的可利用资源正在愈发凸显,大批量的椅子图像数据可以被计算机深度学习更好地识别分析,辅助设计师进行数据管理与设计构思。近年来,深度学习算法飞速发展,在各行各业中都赋予了巨大的发展潜能,“深度学习”是机器学习中一种基于深度神经网络学习的算法,善于处理海量、杂乱无章的用户数据,并将数据内在丰富关系和结构归纳出来[14],在当今这个大数据的环境下具有非常广阔的研究与发展空间。目前,深度学习技术在多标签图像分类[15]、图像摘要生成等领域取得了瞩目的研究成果,给予产品图像的分类和标注以理论的支撑,多标签学习技术能对图像特征进行学习标注,形成图像与特征标签的映射。设计师可以通过选择相同标签的图像,查看大批量设计图像数据,更好地分析设计图像,提高设计效率。
将深度学习引入家具行业、椅子设计,对设计者来说,减轻前期大量繁琐的基础工作,将工作重心转移到真正的设计上来,做出更有创意,更能吸引用户的产品。对行业来说,提高产品图像资源的有效利用,促进设计灵感的迸发,进而有力地赋能家具设计。
三、深度学习下的椅子智能设计流程
(一)研究路线
本文期望建立椅子智能设计流程,方法构建过程中主要包含1. 获取大批量椅子图像数据;2. 椅子图像识别与分类;3. 多标签图像识别标注椅子;4. 构建椅子图像数据库;5. 生成对抗网络生成椅子新图像。详细的设计流程图如图1 所示。
(二)图像数据采集
图像数据是本研究最主要的研究素材。以百度、Pinterest 与花瓣网站为主,利用爬虫工具在网站上查找并下载椅子图片。
通过网络爬虫获取了6 万张椅子图像后,经过人工简单筛选,发现椅子图像中夹杂着很多单张图上多把椅子、桌子椅子共同出现等不符合规定的图像。爬虫不具备理想的筛选能力,只能依据椅子等关键词进行爬取,因此,还需要经过后续的深度学习神经网络进行筛选剔除。
(三)椅子造型特征要素标签调研
研究搭建图像识别与标注模型、多标签学习标注模型,在构建样本集进行标签标注前,需要先获取椅子造型特征要素,构建标签。获取标签的步骤如下:广泛调研与椅子造型相关的期刊文献,统计多种椅子造型分类的依据—从类型学角度确定椅子造型特征大类—用形态分析法分析椅子具体造型要素—归纳确定椅子造型特征要素标签。
经过综合考虑,研究家具造型,尤其是以椅子造型为研究对象的论文,首先,通过文献、网络、书刊、杂志、报纸、从业者口述等途径广泛收集椅子的造型分类依据,见表1。
调研各论文中对椅子造型的研究分类方法,现有涉及椅子造型的研究,基本从形态、色彩、材质出发。造型类型学可以从横向造型角度和纵向结构角度更为深刻地理解椅子这种类型的家具造型,理解已有的椅子设计经验与知识。目前,已有的家具类型学从造型、材质、连接方式划分北欧椅子;形态分析法基于形态学来对事物展开分析,首先将研究的目标对象划分成各个基本的组成部分,再带有针对性目的地各自处理不同的组成部分。家具领域形态分析法的应用多是为了与感性工学结合,在本次研究中可以作为基础依据来对椅子造型进行划分。综合两种方法,本文决定从表2 所示角度进行划分,展开研究。
(四)椅子及特征要素识别分类实验
1. 建立卷积识别模型
卷积神经网络是深度学习的代表算法之一,以图像识别为中心,能较好地获取目标图像特征。可以实现椅子图像的识别分类,从获得的众多椅子图像中筛选不符合要求的图像。为此需要选择一个识别能力强、泛化性好、易操作的卷积神经网络。ResNet50 网络是公认的识别效果极好的卷积神经网络,而MoblieNet V2 网络则能在保持性能的前提下降低模型大小,提升模型速度,是一种小巧而高效的卷积神经网络。首先,要测试ResNet、MoblieNet 网络哪一个更适合用于此次椅子图像的研究内容。
实验选择在PaddlePaddle 上进行,该平台的构造框架是百度深度学习框架,提供了一些深度学习的源代码和研发项目,供研究人员免费自由学习。训练时保证网络畅通且除浏览器外电脑没有其余软件负载,所使用云计算为高级版算力卡:GPU:Tesla V100. VideoMem:16GB;语言环境为 Python 3.7;编程软件:Pycharm;项目框架:PaddlePaddle1.7.2 版本。训练集为通过爬虫获取的大批量图片,通过人工筛选出1280 张图片,其中,640 张为椅子的图像,640 张不是椅子的图像。
搭载好两种神经网络,除了各自不同的神经网络架构外,均需要保持参数一致。如均输入RGB 彩色3 通道224x224 的图像;设置训练集与测试集比例为4:1;以ReLU 为激活函数;用softmax 做回归分类。batch_size 为64;训练回合数为30;学习率为0.001;实验完成后均统计训练总时长、识别准确率,以及额外16 张测试图片的分类结果。
2. 多标签标注模型构建
多标签学习技术可以根据对图像特征的学习,进行多个标签的标注,形成图像与特征标签的映射。一张椅子图像包含有很多有价值的设计信息,按照前文构建的椅子造型特征要素标签,可以从多个角度更好地展现椅子的设计元素以及属性特征等,具有相同标签的图像可以提高对该标签所代表的客观特征的理解,并且可以帮助设计在自己的设计构思中体现该特征。
多标签标注模型需要首先对目标图像進行标签标注,一张图像标注多个信息,从卷积识别模型筛选后的数据集里随机抽取603 张椅子进行标注,分别按照构建的标签进行标注,标注完成后各标签的数量如表3 所示。
多标签标注模型在jupyter 上进行编码,使用jupyter 的好处是可以在代码单元格中直接运行代码,实现实时交互,方便检查和调试代码。训练模型的第一步是向多标签训练网络输入训练数据集并训练。第二步是邀请 5 位具有3 年以上家具设计研发经验的设计、家具领域研究生对 10 张家具图片造型特征标签进行评定。然后向网络输入已评定标签的10 张测试图片进行识别,并做多个标签标注。
3. 结果与讨论
椅子识别分类对比实验完成后,收集数据并分析,由表4 可知:两个网络均能正确识别验证图片,说明计算机可以识别椅子和非椅子并有一定的准确性;
训练时长RseNet 为94 分18 秒、Moblienet 为72 分57 秒,resnet 网络耗时稍微长一点。原因可能是,ResNet 残差结构先用1x1 的卷积降维,再升维,MoblieNetV2 则是先升维,再降维。因此对于ResNet,其残差结构是两头大,中间小。而对于MoblieNetV2则是中间大,两头小的结构MoblieNetV2 网络的核心是采用了可分解的depthwise separable convolution,优点是降低模型计算复杂度的同时降低模型大小。这使得其可以更好地运载在未来真实的移动端应用场景。所以成为当下持续研究的重点。
因此,选取MoblieNet 作为识别椅子和非椅子的网络,建立椅子图像识别与分类模型,并对大批量椅子图像进行识别筛选,得到符合要求的椅子图像继续接下来的实验与研究。
椅子标签识别标注实验完成后,本次预测集随机抽取了一万张椅子图像作为样本。模型预测的结果存在样本文件夹下的test文件夹内,预测的标签作为样本的名字,如图2。
通过在文件夹搜索栏输入标签(如fushouyi),文件夹将会指定所有标签中包含该标签的图片,即可查看带有该标签的图片是否符合该标签特征。以此验证模型训练准确率与有效性。
从预测样本中搜索标签并抽取一千张图像,检查核对。结果如下:扶手椅随机抽样1000 张,错误193 张,准确率80.7%。壳体随机抽样1000 张,错误237 张,准确率76.3%。几何形态随机抽样1000张,错误145 张,准确率85.5%。准确率普遍不高,分析原因,与训练样本分布不均衡有关,训练样本需要将各个样本均达到一定数量,才能使网络模型充分学习到各个标签下对应的特征。部分过多,部分过少会使得每个标签的学习效果都受影响。
四、设计方案生成
椅子图像数据库中图像数据以标签命名的形式存放,通过检索不同标签,可以选择含有共同标签的椅子,可以作为训练集进行新图像的生成。
(一)生成对抗网络
GANs 是由Ian 等人于2014 年提出的, 并首次在论文Generative Adversarial Nets 中進行了描述。生成对抗网络的结构内容主要包含两个,一个是负责生成新图像的生成器(Generator),另一个是负责判别真假的判别器(Discriminator),二者相互训练,相互竞争。训练过程中,生成器不断地生成越来越好的伪图像来迷惑判别器,使其无法判断是真是假;而判别器也在不断强化识别能力,努力正确地识别真假图像。
生成对抗网络对输入的图像进行分析、提取图像特征,然后以此为依据生成新的图像。通过对比f-AnoGAN-master 生成对抗网络和DCGAN 生成对抗网络对产品图像的生成效果,确定采用DCGAN 网络来生成图像并展开设计。
(二)设计生成与构思过程
设计生成需要先准备训练数据集,选择靠背椅这一标签下的椅子图像共8000 张组建训练集,另外,准备2000 张测试集,按照训练测试4:1 的比例组建模型需调用的数据。所有椅子图像均含有靠背椅这一标签,其他标签各不相同。生成对抗网络根据获取的图像特征,生成新的图像,新图像和用作训练的有相似之处,但又不同,既保有训练集图像的设计基因,又有自己独特的新特征。如图3 所示。
生成对抗网络生成新图像的质量受模型参数、训练时长等因素影响,整体图像形态较为清晰,但是具体细节却又模糊不清,因此,并不能直接作为最终的设计图纸,只能作为设计灵感草图提供给设计师,由设计师品味生成的图像,并从形态随机、不规则的“创意”之中,汲取设计灵感,通过进一步优化设计草图,构思产品的细节,如材质、结构等。
如图4 中草图1,看似“断腿”,缺乏基本的支撑结构,实则可以通过采用透明亚克力材料作为衔接,造成“断腿”的视觉效果,增加这张躺椅的创意性,同时可以引导设计师突破此时的思维桎梏,往透明材料、打破常规的视角去思考。又如草图2,与以往传统的圈椅似是而非,可以看作是座面的一种错位,也可以作为两把靠背椅交叉在一起的设计;草图3 中的红色椅子,生成图像中是红色的配色,通过对材质的思考,可以设计成红色为皮质面料,黑色为金属的椅子。下方腿部支撑一边为传统的三角形,一边为半圆弧形,三角形与原型的构成及材质的搭配营造出一种轻盈紧俏的设计感。
围绕草图1,通过手绘方案,设计推演,三维建模,材质渲染等步骤最终设计了“中空”躺椅。结合生成方案给人的第一直觉,缺少腿部支撑,本该是最舒服结实的躺椅,却让人看起来很不稳固,但是走近细看,躺下试试,才会惊觉它的稳固,以及采用透明亚克力给人支撑“中控”的错觉,耐人寻味。见图5。
总体来看,通过生成对抗网络生成的图像虽然还不能作为直接的设计方案使用,但是其生成图像的巧妙构思,极大促进了产品设计的设计流程,提高了设计效率,生成草图经过设计师的人为优化,即可得到比较成熟的产品设计方案。
结语
综上,围绕椅子造型特征展开研究,确立一种从获取、处理、分析、利用图像数据的研究思路,以深度学习为基础的椅子造型特征识别标注与智能设计方法。首先,将现有的椅子特征要素进行了重新梳理与归纳。其次,用Resnet、Moblienetv2 两种卷积神经网络进行椅子的识别与分类,从训练时长、识别准确率两个方面考量哪种网络模型更适合用在椅子智能设计领域。然后通过多标签学习标注模型,实现对海量椅子图像数据的造型特征标签识别标注。不足之处是标注样本不够均衡,但是依然证明了多标签学习标注模型的有效性。最后通过选定某一标签的椅子数据作为训练集,通过生成对抗网络生成可以提供灵感的设计新图像。
通过所构建的方法得到被学习标注的产品图像,还可通过对不同标签的选择,完成对数据的筛选分类,未来将带有标签的图像数据云端建库存放,以供所有家具行业人员浏览下载。根据选择的同标签数据集,通过生成对抗网络进行新产品图像生成,提供设计师符合一定标签的新产品图像,激活创意灵感,提高设计效率。