电商网站中面料商品的情感语义自动识别和分类
2017-04-15张春艳张海波
张春艳+张海波
摘要:图像中蕴含着丰富的情感,根据图像所表达的情感进行分类是非常有必要的。针对面料情感在电商网站中的自动识别进行研究,提出了一种自动识别面料图像情感的方法,进而实现在电子商务网站中面料商品按情感进行分类和排序。在面料图像情感因子空间以及支持向量机的情感语义识别研究基础上,通过对图像特征提取及分类算法和动态链接库技术研究,开发了基于Web的面料图像情感语义识别模块,实现上传面料图像自动识别其情感,并将其应用到了电子商务网站中。
关键词:面料图像;情感语义;电商网站;自动识别
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2016)34-0290-03
Abstract: Image contains a wealth of emotion, according to the image expressed by the emotional classification is very necessary. Aiming at the automatic recognition of fabric emotion in electronic commerce website, this paper presents a method to automatically recognize the emotion of fabric goods, and then realize the classification and sorting of fabric goods according to emotion. Based on the research of emotion semantic space of fabric image and the recognition of emotion semantics based on support vector machine (SVM),and the research of image feature extraction and classification algorithm and dynamic link library, a web-based emotion image semantic recognition module is developed to automatically recognize the emotions of fabric images. Then apply it to the e-commerce site.
Key words: fabric image; emotional semantic; automatic identification
1 研究目的和意义
基于语义的图像检索研究领域中,情感语义检索是其重要的一个部分[1]。现有的图像分类方法大多依据图像的视觉特征的相似性进行图像分类,大多没有考虑情感的影响和作用,这不能满足用户的真正需求,将图像按照情感语义进行合理的分类,会大大提高基于语义的图像检索性能[2]。
不同的服装有不同的情感表达,服装面料也有自己的情感,消费者在购买服装时会根据自己的情感需求选购商品,服装设计师在设计服装时,也需要考虑面料所表达的情感 [3]。电子商务的迅猛发展,使人们越来越多地选择线上购物,人们通过电子商务网站可以轻松购买千里之外的商品,大大缩短了消费者与商家的距离,消费者可以方便地通过网络与商家进行交流,而在网络上从大量的信息中筛选出自己想要的商品则需要对商品进行合理的分类[4]。
本文针对面料情感在电商网站中的自动识别进行研究,提出一种自动识别面料商品情感的方法,进而实现面料商品按情感进行分类和排序。在之前的研究中[5-8],我们已经将面料的情感分为七对语义相反的情感词,通过对面料图像的颜色、纹理等底层特征提取,采用SVM支持向量机技术进行机器学习,得到情感因子值,再根据公式计算出情感的定量描述值。本文的主要研究内容就是对面料图像的情感自动进行识别,并将这一识别技术应用到电商网站中,使人们可以方便的根据自己的情感选择面料。通过提取图像的底层特征以及研究分类算法,本文最终开发了一個能够对面料商品自动识别并按情感值大小进行排序的电商网站,经过试验,达到了不错的效果,论证了本文研究的实用价值。证明对面料图像进行情感分类这一研究是可行的,该课题有着重要的理论意义和实用价值。
2 情感识别模块的设计与开发
通过对这60张图像测试数据和模型计算出的数据对比,获得较好的识别效果。在此基础上,我们想要实现对任一面料图像的情感自动识别,并将其应用到电商网站中。
2.1 设计思路
要实现对面料图像的情感识别,首先我们需要对面料图像的情感语义进行分类,在之前的研究中,我们已将面料情感分为七对语义相反的情感词,分别是“强烈的—柔和的”、“温暖的—凉爽的”、“华丽的—简约的”、“高雅的—朴素的”、“张扬的—文静的”、“厚重的—飘逸的”、“丰富的—纯净的”。针对任一面料图像的情感进行机器识别和预测,我们得到三个情感因子的预测值,通过计算能得到七对情感词的定量描述值(值的范围为负3到正3),分别对应一对语义相反的情感词,数据的值在-3到0之间,说明该图像的情感越偏向左边的情感词,数据值在0到正3,说明该图像的情感越偏向右边的情感词,这个值的绝对值越大,所包含的情感程度越高。
通过大量面料图像的识别和入库,我们可以将某个情感词的定量描述值从大到小进行排序,比如将“温暖的—凉爽的”对应的定量值进行从小到大排序,得到面料图像情感词“温暖的”由强到弱的图片依次排序,将“温暖的—凉爽的”对应的定量值进行从大到小排序,得到面料图像情感词“凉爽的”由强到弱的图片依次排序。
2.2 功能设计
上传面料商品图片时自动识别该张图片的三个情感因子,并自动计算这张图片的七个情感定量值,显示在图片右侧。
原来系统设计仅支持BMP格式,并且大小是一定的,修改原有代码,实现上传面料图片任意格式如BMP、GIF、JPEG、PNG等格式以及任何尺寸大小均可识别。识别出来的情感定量值按从大到小顺序排列,这样能很清晰地看出某张图片表达情感最为强烈的是那种情感。
2.3 开发实现
文献[3]建立了基于Web的面料图像情感语义主观測试系统,其中选择了60张不同种类的面料图像作为测试样本图像;文献[6]通过数理统计的方法建立了面料图像情感语义的因子空间;文献[7]对面料的颜色和纹理等低层特征与情感因子空间中因子之间的关系进行了分析;文献[8]实现了基于支持向量机的面料图像情感语义识别。在此基础上,使用Visual Studio 2010为开发工具,修改代码,建立动态链接库,实现网页识别面料图像的情感语义。
由于之前识别面料图像情感语义的代码是用C++程序编写的,我们首先需要修改这段代码实现代码重用,这里我们选择建立动态链接库。
2.3.1 建立动态链接库
DLL(Dynamic Link Library)就是动态链接库,DLL是一个包含可由多个程序同时使用的代码和数据的库,是重要的代码重用技术之一。由于DLL独立于编程语言,可以被C++或任何支持DLL的语言调用,因此这里我们对原有的C++代码进行修改,设计合理的入口和出口,使之可以被C#等其他编程语言调用。程序的入口用来处理需要进行情感识别图像的路径,通过对面料图像样品的颜色、纹理低层特征(饱和度、色相冷暖、对比度、灰度图、灰度矩阵、平均色调等)的提取和计算,结合支持向量机技术实现识别图像的情感,程序的出口输出三个情感因子的值。
2.3.2 使用VS2010调用
使用DllImport函数导入上一步建立的动态链接库DLL文件,调用DLL中的函数,得到三个因子的值,使用文献[6]中公式计算7对情感词的描述值。设计网页实现上传图片对情感自动识别,并将值的大小进行排序,图片右侧显示识别的七对情感词的描述值。
选择一张面料图片,上传成功后自动识别该张图片的情感界面如下:
如上图所示我们可以看出这张图片情感值最大的是“丰富的”,在显示界面中我们将七个情感值按从大到小进行了排序,用户可以方便地看出情感值的大小。每上传一张图片,数据库里就会记录一张图片的情感数据,经过对数据库中情感值的大小排序,用户可以方便的对比任意图片所包含的情感,选择更符合自己需求的面料图像。经过测试,本模块可以实现对BMP、GIF、JPEG、PNG等格式图片进行识别。
3 电商网站的应用与实现
实现电商商品的情感分类无非有两种方式,一是人工标注,就是商家上传商品时候标注商品的情感分类,由于情感的主观性,和上传者的知识水平和个性,难免会带有片面性;二是让计算机去自动识别商品的情感分类,然而当前的图像情感识别分类存在不足,实现图像的情感检索对于消费者以及需要通过识别图像情感来进行设计的设计师有很大的意义。消费者在购买商品时往往希望挑选符合自己的主观情感需求的商品,而实现对图像的情感检索可以大大方便消费者进行挑选。
我们在前面已经实现情感识别模块,将这一模块应用于电商网站无论对消费者还是商家来说都很方便,商家上传图像时实现自动识别,不需要花费人力一张一张添加标签,对于消费者可以方便的对面料产品进行情感词检索,挑选时更加方便快捷。
3.1 设计开发
在一个开源.Net+ MS SQL SERVER的B2C电商网站系统中,设计了新的商品数据库表,这里我们给每个面料商品添加七个列,分别用来存放七对情感词的描述值。对“温暖的—凉爽的”描述值进行升序排列,得到“温暖的”程度由高到低的面料图像,对其进行降序排列,得到“凉爽的”程度由高到低的面料图像。由此,我们可以实现对面料情感的排序。
3.2 商品上传页面
上传面料商品时,可能会上传多张图片,我们选择其中最能表现面料图案与特征的一张作为主图,对这张图片的情感进行识别。如下图所示:
3.3 商品筛选界面
如下图所示,在面料分类里添加情感词分类,分类里添加十四个情感词,点击其中一个情感词,下面的面料商品按这个情感词的定量描述值从大到小排序。
3.4 排序实现
如下图,为点击情感词“温暖的”对现有面料商品排序的结果:
3.5 商品界面
点击面料商品,进入商品内部,显示商品的属性价格,同时显示该面料的情感值,如下图所示:
4 结束语
本项目所开发的软件系统,客户端采用Win7操作系统,服务器端采用WINDOWS 2008 SERVER,以Visual Studio 2010为底层开发平台,结合一个.NET+MS SQL SERVER的开源B2C电商网站系统,利用动态链接库技术实现了对任一服装面料商品的情感语义自动识别和分类,为网购者希望购买具有一定情感语义的面料提供了一种辅助的分类和检索手段。本研究结合电子商务网站,将面料图像的情感识别应用到电商网站中,方便消费者在挑选商品时按照自己的情感需求进行选择。本次研究证明了图像情感语义识别的理论可行,在这方面的研究还需要进一步的探索和发展。
参考文献:
[1] 贺静. 基于特征融合的服装图像情感语义分类研究[D]. 太原:太原理工大学,2007.
[2] 陆泉,丁恒.基于情感的图像检索研究综述[J].情报理论与实践,2013,36(2): 119-124.
[3] 张海波,黄铁军,万飞飞. 基于Web的服装面料图像情感测试系统[J]. 针织工业,2012(8):55-58.
[4] 高彦. 语义分类方法在淘宝评论文本中应用研究[D].保定: 河北大学,2015.
[5] 张海波.服装情感论[M].北京:中国纺织出版社,2011.
[6] ZHANG Haibo,HUANG Tiejun,LIU Li. Study on the emotion factor space of fabric [C]//International Conference on Kansei Engineering and Emotion Research. Taiwan,2012:1174-1178.
[7] 张海波,黄铁军,修毅,等. 基于颜色和纹理特征的面料图像情感语义分析[J].天津工业大学学报,2013(4).
[8] 张海波,黄铁军,刘莉,等.基于支持向量机的面料图像情感语义识别[J].天津工业大学学报,2013(6).