男西装情感因子空间研究
2012-10-23张海波刘瑞璞莉b
张海波,刘瑞璞,刘 莉b,
(北京服装学院a.计算机信息中心;b.服装材料研究开发与评价北京市重点实验室;c.服装艺术与工程学院,北京 100029)
男西装情感因子空间研究
张海波a,b,刘瑞璞c,刘 莉b,c
(北京服装学院a.计算机信息中心;b.服装材料研究开发与评价北京市重点实验室;c.服装艺术与工程学院,北京 100029)
服装款式复杂多变,而目前服装情感描述大多是定性描述,对各类服装的情感描述词也未进行系统分析.建立服装情感空间是实现计算机对服装图像情感识别及量化评价的重要前提.通过对男西装情感描述词的筛选、投票、初步确定、相关性分析、因子分析等过程进行了研究,最后得出一个2维的男西装情感因子空间,这样每幅图像对应着该因子空间上的2维坐标值,使得在因子空间上定义男西装图像间的情感相似度和对男西装图像按情感相似性进行评估和索引成为可能,为下一步实现男西装图像情感的机器评估和图像情感语义识别、检索奠定了基础.该方法同样可以扩展到其他类别的服装.
男西装;服装情感;情感因子空间;因子分析
为了通过计算机对服装所带来的情感进行识别和理解,首先要对服装情感进行量化描述并建立情感空间.而由于对情感认识的主观性和模糊性,长期以来人们对服装情感的认识大多停留在定性阶段[1].
另外,服装款式和种类繁多,颜色复杂多样,面料成千上万,图案变幻无穷,配饰各具特色,而这些因素的不同组合又会带来千变万化的服装情感,因此,建立一个适用于所有类别服装的情感空间是不现实的,例如童装和中老年装的情感描述词就相差甚远.然而,同一类型的服装往往具有类似的服装情感,例如,西装一般穿着在比较正式的场合,因此它所带来的服装情感可能是正式、庄重、严肃等.本文以男西装为例,从情感的角度出发,通过网络调查的方式,选出可以代表男西装情感感受描述的情感词对,并运用统计分析的方法,建立了一个2维的男西装情感因子空间,为男西装图像情感的识别和理解奠定基础.
1 研究思路和步骤
从心理学角度看,情感是由刺激引起的主观的意识体验,有内心体验和外部行为表现,同时也有其生理机制.实验心理学测量方法中,主要有情绪的生理指标测量、情绪的行为表现测量和情绪的主观体验测量[2].根据实验心理学有关经验,本文选择情绪主观体验测量的方法来对图像库中的图像进行主观情感调查,期望从中寻找描述男西装情感的常用描述词.
在吸取和总结前人经验的基础上,本文采用语义差异法设计了调查问卷,通过网络进行男西装图像的情感主观调查,用情感形容词描述和量化图像情感语义,初步得到一个8维的男西装(图像)情感语义空间;对其进行相关性分析,消除情感形容词之间的相关性和冗余,得到一个5维男西装情感语义空间;然后通过因子分析得到一个2维的男西装情感因子空间.具体研究步骤如下所述.
(1)通过文献、字典、网页等资源搜集与男西装相关的情感描述,并进行筛选,选出最可以描述男西装情感感受的形容词75个.
(2)通过网络投票法或面对面调查投票法,投票的方式为“多选”,经过268人投票后按投票率统计出这75个情感词中最能反映男西装情感感受的24个词,然后结合服装领域专家,确定其中8对语义相反的描述词,即“正式的—休闲的”、“庄重的—活泼的”、“儒雅的—粗犷的”、“高贵的—朴素的”、“简洁的—复杂的”、“古典的—现代的”、“严肃的—轻松的”、“艳丽的—淡雅的”,这16个褒义的情感词作为男西装情感的初步情感描述词.
(3)调查方法采用语义差异法(SD法)[3],并采用李克特式量表(Likert-type scale),为了能产生中性点(neutral point),选用点必须是奇数(3,5,7,9或11),一般最常用的是5点和7点.最好需要对30名以上受测者进行测试,才能得到稳定的资料.本文选用点为7个,如图1所示.受测者通过网络或面对面两种方式对30种不同款式的男西装样本投票,最终获得360份有效问卷.
图1 服装图像情感网络调查问卷Fig.1 Questionnaire of clothing image emotions based on Internet
(4)每款男西装样本有8对情感描述词的8个平均得分,总计240个数据,系统采用数理统计的方法,对所得数据进行相关性分析.分析工具采用国际公认且标准的统计分析软件SPSS(statistical package for the social science)[4],删除与其他情感描述词对相关性特别强的描述词对3个,最后剩余的5对情感描述词组成了5维男西装情感语义空间,即“正式的—休闲的”、“儒雅的—粗犷的”、“简洁的—复杂的”、“古典的—现代的”、“艳丽的—淡雅的”.在此基础上可以定量描述人们对于男西装的情感感受.
(5)对男西装的上述5对情感词测试数据进行因子分析,建立男西装情感因子空间.
2 男西装情感词的调查和投票
本文建立了专门的网络投票系统[5],受测者大多为北京服装学院的教师和学生.测试前,对受测者需要了解的内容(如测试的目的、方法、过程等)通过网站或面对面讲解清楚,这样可以有效地减少无效投票.受测者首先通过网站注册成为正式的调查对象,之后进行投票操作.
通过图像主观调查,使用情感描述词对服装图像情感语义进行描述,得到了男西装图像的初步情感语义空间.在该空间上,每款男西装图像的情感语义可以用这些情感形容词的值进行定量表示.
然而,由于人们对情感语义理解的主观性以及对情感词理解的不完全一致性,以上各情感形容词在描述男西装情感感受时可能存在较大的相关性和冗余,在整个情感语义空间上,很难进行图像相似性的度量.因此,还需要进行相关性分析,以消除情感形容词之间的相关性和冗余.表1为删除相关性很强的3对情感词后,余下5对情感描述词对男西装情感投票的统计结果.
表1 男西装情感投票的统计结果Table 1 The voting results of men's suit emotions
3 男西装情感因子分析
在研究实际问题时,往往希望尽可能多地收集相关变量,以便对问题有比较全面、完整的把握和认识.但是,在实际数据建模时,这些变量未必能真正发挥预期的作用,反而会给统计带来许多问题.在大多数情况下,许多变量之间存在一定的相关关系,从而增加了问题分析的复杂性.人们希望探索一种更有效的解决办法,它既能大大减少参与建模数据的变量个数,同时也不会造成信息的大量丢失.因子分析正是这样一种能够有效降低变量维数的多元统计分析方法[6],它以最少的信息丢失为前提,将众多的原有变量综合成较少的、彼此不相关的几个综合指标,这些指标即为因子.
3.1 因子分析的前提条件分析
对表1进行Pearson相关分析结果见表2所示.表2中数据为5对男西装情感词对之间的相关性数据,测验样本为30张不同类别的男西装图像.表中带两个星号(**)的数据表示显著性水平α为0.01时可拒绝零假设,带一个星号(*)的数据表示显著性水平α为0.05时可拒绝零假设.因此,两个星号比一个星号拒绝零假设犯错误的可能性更小.
表2 5对男西装情感词指标Pearson相关分析结果Table 2 Pearson correlation analysis results of man suit's with five pairs of emotional words
经Pearson相关分析后,显示以上相关系数普遍大于0.3,说明这些变量间有较强的相关性,适合做因子分析.
仍采用SPSS软件,对表1的数据进行KMO(Kaiser-Meyer-Olkin)和 巴 特 利 特 球 度 检 验(Bartlett Test of Sphericity)检验,结果显示:KMO值为0.696(>0.6),表示可以进行因子分析;Bartlett球度检验的值为113.442(自由度为10),达到显著水平,表明相关矩阵有共同因素存在,适合进行因子分析.
3.2 因子分析
首先进行尝试性分析.根据原有变量的相关系数矩阵,采用主成分分析法提取因子,并列出其特征根值.图2所示为因子碎石图,根据特征根大于或等于1的判断准则,以及考虑累计贡献率为70%~85%的准则,碎石图显示第3个因子开始特征根很小,对解释原有变量的贡献很小,成为可以被忽略的“高山下的碎石”,因此在计算中取2个因子.
图2 因子碎石图Fig.2 Scree plot
取2个因子时,因子解释原有变量总方差的情况如表3所示.由表3可以看出,当取2个因子时,可以解释原有变量总方差的86.201%(>85%),总体上原有变量的信息丢失很少,因子分析效果较理想.
取2个因子,经过方差最大法正交旋转后得到的因子载荷矩阵和因子协方差矩阵分别如表4和5所示.对该旋转后的载荷矩阵,根据各共同因素中形容词项的因子负荷量的大小进行排序,便于考查各个因子所解释的词义变量.由表4可知:“正式的—休闲的”、“儒雅的—粗犷的”、“古典的—现代的”、“简洁的—复杂的”这4个词义在第一个因子上的载荷都很高,意味着它们与第一个因子的相关程度高,第一个因子能较好地解释这4个词义;第二个因子在情感词对“艳丽的—淡雅的”有较高的载荷,主要解释了这1个变量.
表3 因子解释变量总方差的情况Table 3 Total variance explained
表4 因子载荷矩阵Table 4 Rotated component matrix
表5 因子协方差矩阵Table 5 Component score covariance matrix
因子分析中,每个因子所关联的词义之间都具有很大的相关性,而每个因子之间却是相互独立的.根据因子载荷矩阵,可以把每对情感变量表示为2因子的线性组合,得出因子分析模型如式(1)所示.
其中:f1和f2为因子.同时,采用回归法估计出因子得分系数,得到的因子得分系数矩阵见表6.
表6 因子得分系数矩阵Table 6 Component score coefficient matrix
根据表6写出的因子得分函数如式(2)所示.
根据因子得分系数矩阵,可以由每个男西装图像样本的5对形容词评估值,计算得出2个因子的值.作为共同因子,各因子分别对应着不同的情感语义.这2个因子之间是相互独立的,且对初始5对情感语义形容词的解释程度高达86.201%,表明可以使用这2个因子来概括描述5对情感词,且信息损失较小.
4 男西装情感因子空间的建立
男西装图像库中的每个图像样本,在完成主观情感调查,并经过初步相关性分析后得到了5对情感形容词的主观评估值,从而可以建立男西装图像情感语义(形容词)空间,每一幅图像的情感语义可以用这些情感形容词对的值进行定量表示.然后,通过因子得分系数矩阵,可以计算出图像的2个因子的值,即可以将5维的情感语义(形容词)空间转换为新的相互独立的2维情感语义空间,称其为情感因子空间,见式(2).由于这个2维的情感因子空间可以在很大程度上解释和描述初始的5对情感语义的总体意象,且信息损失较小,这样的转换一方面大大降低了情感语义的维度;另一方面,该2维空间是一个各维度之间相互独立的正交语义空间,每个图像样本所对应的各个语义分量是正交独立的,在这样的空间上定义的样本点之间的距离将更为紧凑和合理,有利于对男西装图像样本进行识别、分类、检索、评价等工作.
通过因子分析,对于男西装图像而言,可以将5维的情感语义空间简化为2维正交的情感因子空间,这个变换可以通过因子得分系数矩阵实现;同时,通过因子载荷矩阵,明确了每个因子所对应的情感语义形容词,为以后直接由图像特征推导2个公共因子打下了基础,使用因子载荷矩阵,还可以完成2维因子空间到5维原始情感语义(形容词)空间的转换.
5 结 语
本文借鉴了实验心理学对情感的研究方法,以男西装为例,采用语义差异法进行了服装图像情感主观调查,采用情感形容词组对图像情感语义进行了描述和量化.在已经得到8对男西装情感描述词的基础上,通过相关性分析删除相关性特别强的情感词对.然后对剩余的5对男西装图像情感词数据的相关系数矩阵进行因子分析,得到了一个独立正交的2维男西装图像情感因子空间,其中,每个因子分别与几对情感词主要对应,实现了由男西装的情感语义(形容词)空间到情感因子空间的转换,使下一步在该因子空间上定义男西装图像间的情感相似度和对男西装图像按情感相似性进行评估和索引成为可能.该方法同样可以扩展到其他类别的服装.
[1]张海波.服装情感学[J].针织工业,2010(6):52-55.
[2]王伟凝.基于情感语义的图像特征提取、检索与分类研究[D].广州:华南理工大学电子与信息学院,2005.
[3]OSGOOD C E,SUCI G J,TANNENBAUM P H.The measurement of meaning[M].Illinois,US:University of Illinois Press,1957.
[4]卢纹岱.SPSS统计分析[M].4版.北京:电子工业出版社,2010.
[5]ZHANG H B,HUANG T J,LIU R P.Image database system of clothing emotion[C]//The 2nd International Conference on E-Business and E-Government.Shanghai,2011:6116-6119.
[6]李静萍,谢绑昌.多元统计分析方法与应用[M].北京:中国人民大学出版社,2008.
Study on the Emotion Factor Space of Men's Suit
ZHANG Hai-boa,b,LIU Rui-puc,LIU Lib,c
(a.Computer Information Center;b.Beijing Key Laboratory of Clothing Material Research Development and Assessment;c.School of Fashion Art and Engineering,Beijing Institute of Fashion Technology,Beijing 100029,China)
Clothing style is complex and full of change,but the current description of clothing emotions is mostly qualitative characterization,and the words to express which have no systemic analysis until now.To establish the clothing semantic emotions space is the important prerequisite for computer recognition of clothing images from emotion mode and quantitative evaluation.The clothing emotions of men's suit are investigated from the choice of description words,voting on the web,initially selection,correlation analysis,and factor analysis,etc.A 2-D space is got for the emotional factors finally,so each image will possess a corresponded 2-D coordinates in the space,which can make it possible to define emotion similarity between images in the factor space,as well as to evaluate and index images of men's suit from the point of clothing emotion in the future.It is the basis to achieve machine evaluation,semantic identification and retrieval of image emotion for men's suit in the next work.The method can also be extended to other types of clothing.
men's suit;clothing emotion;emotion factor space;factor analysis
TP 391;TS 941
A
2011-05-16
北京市自然科学基金资助项目(4102023);服装材料研究开发与评价北京市重点实验室开放课题资助项目(2011ZK-03)
张海波(1970—),男,河北邯郸人,副研究员,博士,研究方向为服装情感、服装计算机应用.E-mail:hbdmzhb@126.com
1671-0444(2012)03-0292-05