APP下载

基于SE-ResNet 的民族服饰识别系统的设计与实现

2022-07-08张玥何茜悦赵成龙

电子技术与软件工程 2022年8期
关键词:民族服饰服饰图案

张玥 何茜悦 赵成龙

(中南民族大学计算机科学学院 湖北省武汉市 430074)

1 系统设计

1.1 功能组件

民族服饰识别系统将围绕服饰图案识别模型展开设计。系统的识别模型搭载在服务器上,用户利用云平台上传民族服饰的图像后,系统调用模型进行结果预测,将返回的结果及相关专业信息显示在网页界面上,并通过平台的虚拟地图展示相似度高的其他服饰图案的地理分布。组件设计如下:

(1)界面展示:界面的设计原则是简约易懂,有上传图片和数字地图两个功能界面。用户在首页上传客户端本地的民族服饰图片,上传的照片可以是拍摄的民族服饰相片或民族服饰图案的绘画图像。数字地图界面以中国地图为底图,将上传的民族服饰图片所在地区在中国地图上标记。

(2)民族服饰数据库:通过对所需存储数据信息进行分析,采用关系型数据库对所需数据进行存储和组织,使用MySQL 数据库管理系统。通过上传图片进入对应民族服饰图案的数据库,直接查询到相关信息,该界面将展示获取的服饰图案详细资料。具体功能结构图如图1 所示。

图1: 功能结构图

1.2 架构设计

系统架构设计确定了系统的顶层结构,保证了硬件与软件之间的贯穿,有利于系统的稳定运行。本民族服饰识别系统的架构为浏览器/服务端模式,使用Spring + SpringMVC+ MyBatis 整合的SSM 框架搭建Web 应用。在网页上传本地相册的民族服饰图片以及展示民族服饰图片的识别结果;后台接收上传的图像数据,通过在服务器上部署的模型进行识别并将识别结果在民族服饰数据库中进行查找比对并返回民族服饰信息。系统框架设计如图2 所示。

图2: 系统框架设计

2 识别算法实现

2.1 深度学习概述

深度学习是机器学习领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能。不同于传统的基于人为的设置和使用机器学习算法,深度学习具有从样本数据中学习并获取到特征信息的能力。这些学习过程中获得的信息对诸如文字、图像和声音等数据的解释有很大的帮助,它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据深度学习。

深度学习中的卷积神经网络被认为是一种非常有效的图像识别模型,在图像识别领域取得的成绩远远胜过之前已有技术,之前的模式识别与机器学习算法如今被卷积神经网络所替代。卷积神经网络突破了之前的传统神经网络对层数的限制性,可根据需要选择网络层数,也在算法效率和准确性方面取得了非常好的效果。

2.2 图像识别

图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术,是应用深度学习算法的一种实践应用。图像分类识别一直是深度学习技术研究的热门方向,它作为计算机视觉领域的一个分支,目前已经取得了很好的应用。

近年来,深度学习研究领域诞生了许多高效的模型。例如:第一个深层卷积网络且首次使用ReLU、Dropout 等技巧训练的AlexNet。遵循简单高效的设计原则,有着窄小的卷积核和更深层级网络的VGG-Net。由He等人提出的ResNet 模型使用标准的随机梯度下降法训练、体量更小深度更大的模型。

民族服饰上的图案是民族文化的特征,特点是颜色多样且不规律,图案形状抽象不规则。在少数民族服饰文化保护的研究中,也在使用有关图像处理的关键技术。程远菲通过对民族服饰区域分割提取图案,使用 (HOG+Hu) 融合特征结合SVM 分类器识别模型对少数民族服饰图腾图像的分类识别,民族服饰图案识别精度达到89.3%常用的局部特征提取方法有Harris 特征提取、SIFT 特征提取等,而在图像纹理特征提取方面则有局部二值模式特征、局部方向模式特征等。在特征处理与服饰识别方面,陈金广通过最优节点优先(BBF)算法将服饰图像中的SIFT 特征和SURF特征进行特征匹配点的确认。

2.3 SE-ResNet模型

一般图像的全局特征则包括形状、颜色和纹理三种,本文的民族服饰的形状、颜色、纹理特征信息较多、种类繁杂,并且民族服饰图案的形状和纹理有着丰富的梯度信息,因此图像的分类识别难度较大。本文实验使用多层卷积的结构来进行分类,即通过设计适量的神经元计算节点和多层运算层次结构,选择合适的输入层和输出层,通过网络的学习和调优,建立起从输入到输出的函数关系。

本文设计的系统采用的识别网络是SE-ResNet,该网络属于“ResNet 家族”的一种。在原本的ResNet 网络的基础上加入了Squeeze-and-Excitation (SE) 模块,SE 模块作为一个通道注意力机制,通过赋予不同通道特征以不同的权重,使得算法更加有效地关注有用通道的特征信息,抑制无用信息的影响。具体创新点如下:

(1)特征压缩与激发 (Squeeze-and-Excitation) :Squeeze操作对各个维度特征进行全局平均池化 (global-averagepooling) ,对空间维度进行特征压缩,将每个二维的特征通道变为一个实数,使靠近输入的层也可获得全局的感受野;激发操作为每个特征通道产生一个权重,并用乘法逐通道加权在之前的特征上,最终实现了上述的有效利用有用的特征信息,弱化无用信息的影响,并且使得同时使浅层也能够得到全局的感受野。Squeeze 计算公式如下公式(1)所示。

2.4 实验设计与分析

2.4.1 数据集制作

各地少数民族有着自己独特的文化,主要便体现在民族服饰上。这些特有的少数民族服饰还较为完整保留着本民族的文化故事和特点。例如:鹡宇鸟、蝴蝶妈妈共同构建了苗族图腾崇拜体系,太阳纹用于儿童背带之上,表达了苗族民众对孩子健康成长的期许,龙则被黎族人视为最大的祥兽是因其象征着春天的来临并带来丰收。这些带有丰富寓意的图案在民族服饰中被大量运用。这些图案背后的丰富文化故事的也是本系统需要的信息的一部分。而服饰图案本身种类复杂、分支众多,不同民族的同一图案形状基本相似但纹理和颜色风格有略微不同。本文实验需要的图片数据集和图片专业信息量较大,因此我们采用的数据及数据信息主要来源于学校相关方向的团队收集获取,以确保图案标签信息的准确。

在数据采集过程中,采集到的民族服饰图案在形状上大致分为动物纹、植物纹、字纹、几何纹。为获得有效的民族服饰图像分类模型,实验采用的数据主要由学校相关专业团队搜集获得数据集图片来源分为两类,一类是民族服饰实物截取部分图像,另一类为比照实物绘制的线条图像。数据集经过人工筛选和信息核对,以确保获取的民族服饰图案与所属民族、图案名称、所属地区、图案特征信息等信息准确。

在训练过程中部分图案类别的图片数量不足时,主要通过以下两种方式补充新数据。其一是使用现实相似实物图片,如蝴蝶纹、鸟纹、鱼纹。因为通过观察发现服饰图案与现实对应实物轮廓基本相同。使用对应实物标准公开数据集进行适当的数据补充,以此来辅助模型学习服饰图案纹理形状特征。对于这些数据集,图像形状特征提取方面可尝试局部二值模式特征、局部方向模式特征等。其二是查询服饰书籍及网络搜寻。此种方法需要图片来源于官方,以确定图片特点是否标准符合描述以保证图片标签准确度。如苗族服饰图案来源于书籍《苗族服饰图志》,如图3 为苗族蝴蝶纹部分图案展示。

图3: 苗族蝴蝶纹部分图案

2.4.2 数据预处理

本实验采用Python 编程语言与OpenCV 对数据集进行预处理和数据扩充,并将不同处理方法下的训练数据随机组合以提高模型训练效果。本文实验将数据集数据随机分为训练集与测试集,训练集用于模型训练,测试集用于训练后的模型准确率评估,训练集和测试集数量比为4:1,数据集图片大小96×96。

图片数据处理主要采用以下两种方式:服饰图案剪裁、数据集数据增强扩充。由于图像来源大多是实物拍摄,有光照不均、角度不同等问题。而噪声是图像干扰的重要原因,通常因为不良照明引起的传感器噪声会使用高斯降噪的方法。本实验为提高图片有效特征信息的提取,采取的具体图像预处理有高斯降噪、平移、旋转、亮度调整等。

2.4.3 实验环境及结果分析

本文实验在Python 编程语言下使用Google 的开源深度学习框架Tensorflow 搭建图像分类模型。由于GPU 能够高效进行图形计算,极大缩短了训练所需时间,因此本文实验使用Google 的Colab 平台的GPU 环境,对深度学习模型网络进行训练。

实验在模型选择方面,最初参考了前文提到的HOG+SVM 的方法,在图案类别小于10 类时,训练后的模型测试准确率达到了90%以上,但是在不断增加图案类别后,识别准确率明显下降。除此之外,实验尝试了其他多种特征提取和分类器的组合及网络上现有的部分经典模型,通过尝试多种现有经典卷积神经网络CNN 模型,比较它们的训练和测试结果后,最终选择了本文使用的Se-ResNet 模型。通过制作的民族服饰数据集对模型进行训练,模型参数随着训练次数的增加不断更新,模型训练过程的loss 损失值最后稳定在0.025 左右,如图4 所示。模型训练的准确率最后稳定在0.94 左右(图5)。模型在参数量较少且满足90%准确率的同时,预测速度接近0.5s。模型的各项性能如表1 所示,测试结果满足模型简单、快速与实用的准则,因此选择使用SE-ResNet 网络作为本系统的少数民族服饰图像识别模型。

图4: 模型损失值曲线图

图5: 模型训练准确率曲线图

表1: 模型性能指标

最后用训练好的模型对测试集图片进行预测,模型验证集的预测分类成功比例为75%左右。通过实验对比发现苗族图案中蝴蝶纹、蝴蝶妈妈纹、龙纹、龙凤纹、姜央纹、人纹在验证集中相较于其他;类识别准确率更高,主要原因是由于这几类图片来源更加充足广泛,数据量更大。

3 总结与展望

随着我国软实力的不断增强,民族文化的传承和保护是现今国家发展规划的重点。本文致力于将少数民族文化与前沿技术结合,对民族服饰进行研究,以达到更好的传承与保护,为民族文化的发展提供更加深层的理论基础。如今图像识别技术是人工智能的热门领域,深度学习的特征提取技术能够更加有效地从数据中获取有效的服饰图案颜色、形状、纹理信息。这些信息反映着民族历史与文化发展的进程,这些要素之间的紧密而又复杂的联系正是探寻少数民族文化史的重要依据。本文设计的民族服饰图案识别系统以少数民族文化为内核,以web 应用为载体,利用深度学习技术结合实际应用场景,将高效实用的SE-ResNet 识别模型部署在系统中,最终通过数字地图直观呈现民族服饰识别结果,能够在生活中帮助人们认识和了解民族服饰图腾及其背后的文化内涵,直观看到相似度高的其他服饰及其地理分布,理解民族服饰图案文化的背后蕴含的文化基因。

猜你喜欢

民族服饰服饰图案
动物“闯”入服饰界
听诸子百家讲“服饰穿搭”
北京服装学院民族服饰博物馆
雪人的服饰
传统茶元素与民族服饰设计的融合探讨
北京服装学院民族服饰博物馆
画中谜
画中谜
画中谜
北京服装学院民族服饰博物馆