基于MLP神经网络的女大学生头面部号型归档与预测
2022-08-02杨妍雯陈佳珍郭子翊邹奉元
申 宇, 杨妍雯, 陈佳珍, 郭子翊, 邹奉元
(浙江理工大学 a.丝绸文化传承与产品设计数字化技术文化和旅游部重点实验室; b.浙江省服装工程技术中心;c.服装数字化技术浙江省工程实验室,杭州 310018)
COVID-19新冠病毒的暴发使口罩成为医护人员和普通人群的重要防护设备,如何提高口罩的贴合性与舒适性成为人们关注的社会热点问题,并且随着生活水平的提高人们的头面部形态发生变化,20年前的国家标准已不再适应如今头面部产品的适配设计[1]。因此,人体头面部数据特征提取及形态有效细分来满足口罩、头盔、面具等头面部服饰产品在人体适配设计过程中的需求成为迫切需要。
人体头面部特征及分类研究是口罩、面具与头盔等头面部产品结构设计、号型制定、舒适合体性研究及版型优化的重要基础[2]。李咏兰[3]以来自36个不同区域的8 174名成年男性为研究对象,并提取其12项头面部形态学指标,对汉族男性的头面部特征进行研究与分类。宇克莉等[4]以182名夏尔巴成人为研究对象,统计分析了西藏地区成人的头面部及体部指标,丰富了民族体质数据资料库。杜抱朴等[5]以134名成年人为实验对象,通过其14项头面部测量指标分析它们与8项地理环境因素间的线性关系。李欣等[6]对新疆不同地区柯尔克孜族成人的上眼睑皱褶、颧部突出度、蒙古褶等20项头面部指标进行观察记录,并比较他们的头面部特征差异,为体质人类学的研究积累资料。综上可以看出,近年来的研究主要集中在民族与地区对头面部形态造成的影响及各细部特征之间的差异,对数据库中包含大量样本的头型数据缺少有效分析,使得在进行头面部产品设计时没有反映群体的有效特征,并且在进行形态分类时缺乏准确有效的模型。多层感知器(Multilayer Perceptron,MLP)神经网络是一种人工神经网络(Artificial Neural Network,ANN)算法,随着神经网络技术的发展逐渐被应用于预测分类等方面[7],该模型具有很强的非线性逼近功能,结构简单,输入变量数目可控,操作性强,可以很好地应用在人体号型分类与预测研究中[8]。
本文为提高头面部产品适配性,以189名18~26岁在校女大学生为研究对象,通过主成分分析(Principal Component Analysis,PCA)提取影响头面部形态的特征因子;采用K-means方法对头面部形态进行分类,利用指数分型法把头面部形态进行量化分型,并提出基于MLP神经网络的头面部号型预测模型;可大幅提高由于头面部尺寸过于繁杂,在进行号型分类或选择时参考依据过多而产生的生产工作效率低等问题,为研究当代中国人的头面部尺寸和面向中国市场的口罩、面具等头面部产品设计积累形态学资料。
1 实 验
1.1 测量样本
不同地区、不同年龄的人体头面部形态、尺寸具有较大差异。为保证样本的代表性与独立性,本文以18~26岁女大学生作为测量样本,该年龄段女性的头面部已基本发育完全,能充分体现头面部形态特征。根据国际标准ISO 15535—2012《Standard of International Organization for Standardization》中规定建立人体测量数据样本量的计算方法来确定测量样本,如下式所示:
(1)
式中:n为估计样本量;σ为标准差;Δ为允许误差。
以头全高指标的σ=1.406 5为计算值,由式(1)计算得到估计样本量n=135,同时考虑到异常值和无效样本,确定本实验样本量为189人。并通过分组随机抽样法,将18~26岁女大学生分为三组,即18~20岁、21~23岁、24~26岁,在每组中抽取63名女大学生作为测量样本。
1.2 测量项目
根据GB/T 2428—1998《成年人头面部尺寸》中女子头面部项目尺寸规定的41个测量项目及实验对象的身高、体重,对女大学生的头面部尺寸进行测量和特征提取。头面部测点如图1所示,头面部测量项目如图2所示。
al:鼻翼点;ch:口角点;en:眼内角点;eu:头侧点;tr:发缘点;ft:颞嵴点;g:眉间点;gn:颏下点;go:下颌角点;li:下唇中点;ls:上唇中点;n:鼻根点;obi:耳下附着点;obs:耳上附着点;pu:瞳孔;pra:耳前点;se:鼻梁点;sa:耳上点;sba:耳下点;sto:口裂点;v:头顶点;zy:颧点;ex:眼外角点;l:枕外隆突点;sn:鼻下点;op:枕后点;pa:耳后点;prn:鼻尖点;t:耳屏点
1:头围;2:形态面长;3:头最大长;4:头最大宽;5:头矢状弧;6:头冠状弧;7:头全高;8:鼻尖点至枕后点距;9:耳屏至枕后点距;10:头斜长;11:两耳外宽;12:两耳屏间宽;13:额最小宽;14:面宽;15:两下颌角间宽;16:容貌面长I;17:容貌上面长;18:鼻高;19:鼻宽;20:鼻深;21:鼻下颏下点距;22:两眼外宽;23:瞳孔间距;24:两眼内宽;25:口宽;26:唇全高;27:耳基部长;28:容貌耳宽;29:耳屏颧点长;30:耳屏鼻根长;31:耳屏颏下长;32:耳屏下颌角长;33:耳屏点间额弧长;34:耳屏点间颏下弧长;35:耳屏点间颌下弧长;36:头顶:枕后点间颏下围长;37:头耳高;38:容貌耳长;39:头顶点至眉间点距;40:头顶点至鼻尖点距;41:耳屏耳上点高
1.3 仪器与要求
采用DP-LI马丁测量仪(北京亚欧德鹏公司),主要包括滑动计(测量范围0~200 mm/mm,精度±0.1 cm)、直尺(测量范围0~150 mm/mm,精度±0.1 cm)、钢卷尺(测量范围0~2 000 mm/mm,精度±0.1 cm)、触角计(测量范围0~450 mm/mm,精度±0.1 cm),以及软卷尺进行接触式测量,测量实验对象的头面部尺寸。使用SH200G身高体重计(杭州上禾科技公司),身高测量范围5~200 cm,测量精度±0.1 cm,体重测量范围5~165 kg,测量精度±0.1 kg,测量实验对象的身高与体重。
手工接触式测量要点:要求实验对象在测量之前平静3 min,并保持直立平视前方,按GB/T 2428—1998中女子头面部项目尺寸规定的41个测量项目在实验对象头面部标出测量点位置,进行3次测量计算并记录平均值,且要求3次测量结果误差在±0.1%之内,若超过则重新测量。
2 结果与分析
2.1 头面部形态分类
2.1.1 聚类变量选取
为综合41个头面部测量参数对头部进行分类,本文采用线性主成分分析(PCA)的方法对需要分析的头面部尺寸进行降维。PCA的降维处理是通过将数据嵌入到原始空间的低维子空间中来实现的,通过PCA提取了7个头面部特征主成分,前7个主成分的特征根均大于1且累计方差贡献率为82.459%。因此选择前7个主成分分析头面部特征,分析效果较为理想,因子分析如图3所示。
图3 因子分析结果
因子载荷矩阵旋转后的结果如表1所示。由表1可知,主成分因子1在头围、头最大长等表征头部轮廓变量上有较大载荷,定义为头部轮廓因子;主成分因子2在耳部变量上载荷系数较大,定义为耳部因子;主成分因子3在形态面长等表征上面部形态的变量上载荷系数较大,定义为形态上面部因子;主成分因子4在两下颌角间宽等表征下面部形态的变量上载荷系数较大,定义为形态下面部因子;主成分因子5在两眼内宽、两眼外宽变量上载荷较大,定义为眼部因子;主成分因子6在鼻高、鼻深、鼻宽等变量上有一定载荷,定义为鼻部因子;主成分因子7在大口宽和唇全高变量上载荷较大,定义为口唇部因子。因此,确定头面部形态的因子为头部轮廓因子、耳部因子、形态上面部因子、形态下面部因子、眼部因子、鼻部因子和口唇部因子。
表1 因子载荷矩阵
采用相关指数最大值法从提取的7个因子中选取相关指数最高的指标作为进行聚类分析时所需要的代表性指标,如下式所示[9]。
(2)
式中:Rj为变量j的相关指数;rij为相关系数;j=1,2,…,m;i=1,2,…,m;m为所在因子的指标数量。
根据式(2)可以计算得出同类主成分中每个指标的相关指数,结果如表2所示,代表性聚类指标即为各主成分中相关指数最高的指标。根据表2所示,同时结合头面部产品的实际开发生产需求选取各主成分中相关指数最大的头围、容貌耳长、形态面长、容貌面长Ⅰ、两眼外宽、鼻高及口宽作为代表性指标进行头面部形态聚类分析。
表2 各类因子的相关指数
2.1.2 最佳分类数的确定
通过混合F统计量(FMixed)来确定聚类的最佳分类数[10],计算方法如下式所示。FMixed越大表示类内联系越紧密且类间联系越分散,因此FMixed最大时其c值就是最佳分类数。
(3)
式中:P为聚类的变量数;F(k)为第k个聚类变量的F值,可由下式得到。
(4)
式中:c为聚类数;n为总样本数;ni为第i类样本数;vik为第i类样本第k个变量的聚类中心,k=1,2,…,p;vk为第k个变量聚类中心的平均值;xijk为第i类的第j个样本的第k个变量值。
由图4可知,当FMixed值最大时c=5,类内联系最紧密,即189名女大学生头面部最佳分类为5类。基于K-means聚类方法对头面部进行分类获得初始分类结果,然后经过9次迭代使聚类中心收敛获得最终聚类结果。
图4 不同分类数对应的Fmixed值
2.1.3 头面部号型归档
根据K-means结果将头面部形态进行号型分档,方便为后续使用MPL神经网络实现通过少量头面部特征尺寸精准预测其号型分类,本文依据各类别聚类中心值采用指数分型法把头面部进行量化分型。其中,形态指数=形态面高/面宽×100[11],将头面部分为5个号型(表3):第一类横向维度最小,形态指数>93,为XS型;第二类横向维度最宽,形态指数≤79,为XL型;第三类横向维度处于中等水平,形态指数∈(84,88],为M型;第四类横向维度较小,形态指数∈(88,93],为S型;第五类横向维度较宽,形态指数∈(79,84],为L型。
表3 头面部号型分档
覆盖率是不同被测人员的头面部号型占据的比例,本文按照覆盖率≥5%设置,若<5%则不设置号型。如表3所示,将头面部号型划分成5个号型:XS型覆盖率为12%、S型覆盖率为19%、M型覆盖率为37%、L型/覆盖率为26%、XL型覆盖率为6%,其中形态指数均值为85.6,M号型分布最广,可作为中间号型。
2.2 MLP神经网络模型
2.2.1 MLP神经网络模型设计
多层感知器(MLP)每层的神经元均相互连接,包含输入层、输出层及隐藏层,隐藏层既可为1层也可为多层[12]。本文使用的MLP模型只含一个隐层,其结构如下式所示。
f(x)=G(b(2)+W(2)(s(b(1)+W(1)x)))
(5)
式中:函数G是softmax,W表示偏重,b为偏置。
该模型主要是通过头围、容貌耳长、形态面长、容貌面长Ⅰ、两眼外宽、鼻高、口宽对头面部号型进行预测,使用R语言中的Sample()函数对样本进行编码;并从数据集中使用train <- sample(nrow(df),0.7*nrow(df))抽取各个号型的70%作为训练样本,即133个样本数据,用于对神经网络的训练,直到训练出较好的模型;再用剩余的56个样本数据对训练好的神经网络的性能进行测试。输入层有7个神经元分别为头围、容貌耳长、形态面长、容貌面长Ⅰ、两眼外宽、鼻高、口宽。MLP神经网络模型设计步骤如下:
1) 导入必要的python模块,主要包含numpy、theano及其自带的os、sy等模块。
2) 定义MLP模型,基本“构件”包括HiddenLayer和Logistic Regression两个主体部分。除此之外,还需要定义隐含层的连接系数W、偏置b及输入和输出,并使用梯度下降法确定求解最佳的参数解决最优化问题。完成后将它们“组装”在一起,如图5所示是MLP的基本结构。
图5 MLP模型结构
3) 将MLP应用于MNIST,即定义MLP模型后将其应用于MNIST数据集。需要定义mnist.pkl.gz的函数load_data()等数据,加载数据完成后可以进行训练,并设置batch_size为10,即每训练完10个样本后重新计算梯度与参数,完成更新,并使用梯度下降法来优化MLP模型。
2.2.2 预测结果分析
在实验MLP时,网络信息参数如表4所示,使用神经网络函式库Keras进行训练。输入层有7个因子分别为头围、容貌耳长、形态面长、容貌面长Ⅰ、鼻高、口宽、两眼外宽,协变量为身高与体重,隐藏层单位数为11,采用tanh激励函数,同时为了防止过拟合还需要在每个隐藏层后输入dropout的值。输出层为1个神经元的全连接层,采用Softmax激励函数,单位数5分别为五种号型归档XSSMLXL,并且在训练过程中使用具有自适应学习速率的梯度下降算法进行优化,模型结构如图5所示。
表4 网络信息参数
预测拟概率如图6所示,五种号型预测正确率分别为90.0%、92.2%、93.7%、96.2%、94.8%。模型号型预测ROC如图7所示,曲线下范围越接近于1说明验证的准确性越高。由图7可知,号型XS的曲线范围为0.998,号型S的曲线范围为0.992,号型M的曲线范围为0.998,号型L的曲线范围为0.997,号型XL的曲线范围为0.999,说明该模型的预测效益良好。
图6 预测拟概率
图7 ROC曲线
模型累计增益效果如图8所示,表5为模型的预测结果。由表5可知,MLP以各号型样本量的70.00%进行训练,在训练时的各号型平均正确百分比为98.62%,在测试时的各号型平均正确百分比为93.42%。
图8 累计增益效果
表5 模型预测结果
综上所述,MLP神经网络的预测模型预测精度达到93.42%,预测效果较好,可以满足头面部产品的设计、生产的需要。该模型结构简单,且当训练样本数据足够多时该模型则具有更强的非线性逼近功能,可应用于头面部号型更广泛的预测与分类,操作性强。
3 结 论
本文为提高头面部产品的适配性,运用马丁测量仪等对189名18~26岁在校女大学生进行头面部测量,通过因子分析提取了影响头面部形态的特征因子,采用K-means聚类对头面部形态分类,利用指数分型法把头面部进行量化分型,并提出基于MLP神经网络头面部号型预测模型。
1) 通过对189名实验对象的头面部特征进行分析,提取影响头面部形态的7个重要特征因子:头部轮廓因子、耳部因子,形态上面部因子、形态下面部因子、眼部因子、鼻部因子和口唇部因子。
2) 通过形态指数并且依据各类别聚类中心值把头面部进行量化分型,将头面部分为5个号型:XS型/形态指数>93、S型/形态指数∈(88,93]、M型/形态指数∈(84,88]、L型/形态指数∈(79,84]、XL型/形态指数≤79,并且将M型作为中间号型。
3) 通过MLP神经网络实现通过少量头面部特征尺寸精准预测其号型分类,生成的模型预测结果正确率达到93.42%,大幅提高了由于头面部尺寸过于繁杂、在进行号型分类或选择时参考依据过多而产生的生产工作效率低等问题。
本文为头面部特征研究提供了一种客观方法,但仍存在一定的局限性,可通过扩大实验对象的地域、年龄等进行比较研究,不断完善头面部形态分类并将其应用于头面部产品规格体系,可为研究当代中国人的头面部特征和面向中国市场的口罩、面具等头面部产品设计积累形态学资料。
《丝绸》官网下载
中国知网下载