APP下载

基于本体的连衣裙款式检索研究

2021-09-22王赛赛陈敏之

丝绸 2021年9期
关键词:连衣裙本体款式

王赛赛 陈敏之

摘要: 服装款式丰富多样,服装属性语义复杂。针对关键词难以表述消费者检索需求的问题,文章以款式复杂的连衣裙为例,提出了一种基于本体的连衣裙款式知识库构建方法,对其他类别服装语义检索具有普遍适用指导意义。通过汇总和归纳连衣裙款式概念及其关系,利用Protégé工具,建立款式关键词的关联性,构建连衣裙款式本体模型。并结合本体语义扩展方法,提出了基于语义信息的连衣裙款式检索模型,实现基于语义的连衣裙款式智能搜索,提高款式检索的查全率和查准率。

关键词: 本体知识库;连衣裙款式;相似度;语义检索;语义扩展

中图分类号: TS941.717.82

文献标志码: A

文章编号: 1001-7003(2021)09-0067-06

引用页码: 091111

DOI: 10.3969/j.issn.1001-7003.2021.09.011(篇序)

Research on ontologybased retrieval of onepiece dress style

WANG Saisaia, CHEN Minzhia,b

(a.Fashion Design Academy; b.Institute of International Education, Zhejiang SciTch University, Hangzhou 310018, China)

Abstract: Garment styles are abundant and various, and the semantics of clothing attributes are complex. To solve the problem that keywords are difficult to indicate consumers retrieval needs, an ontologybased clothing style knowledge base construction method is proposed by taking onepiece dress with complicated style as the example, hoping to provide universally applicable guidance for semantic retrieval of other categories of clothing. After summarizing the concepts of onepiece dress styles and their relationships, the relevance of style keywords is established using Protégé tool and an ontology model of onepiece dress styles is constructed. The retrieval model of onepiece dressstyles based on semantic information is proposed through ontology semantic extension method, and semanticbased intelligent search of onepiece dressstyles is implemented, thereby enhancing the recall ratio and precision ratio of the retrieval.

Key words: ontology knowledge base; onepiece dress style; similarity; semantic retrieval; semantic extension

收稿日期: 20210107;

修回日期: 20210823

基金項目: 浙江省自然科学基金一般项目(LY17E060007)

作者简介: 王赛赛(1996),女,硕士研究生,研究方向为服装智能化推荐。通信作者:陈敏之,副教授,cmz_m@163.com。

随着服装领域信息化的发展,消费者通过网络就能进行服装的查询,服装款式检索成为服装行业研究的重点。服装款式具有服装品类多、款式丰富、服装属性语义复杂等特征,但目前服装领域的检索引擎大多是基于关键词检索的方式,而简单的关键词检索无法在语义层面通过几个关键词完全理解用户特定的需求[1],信息检索结果通常广泛而不精确,因此将信息检索系统进行细分,针对专业领域构建信息检索系统是近几年的研究趋势。

本体作为一种建模工具,提供了一种恰当的概念表示方式,通过构建语义模型,充分地表达领域内概念的层次结构和概念间的关系,精确地描述领域内的知识。本体在语义信息检索系统的语义标注、基于本体的索引、基于本体的查询扩展等多个方面都有很重要的作用。目前本体已广泛分布于各个行业,从早期在语义Web中的推理研究[2],到如今医疗领域[3]、家具个性化定制[4]等智能检索方面的应用。在服装行业中如服装智能制造[5]、服装加工服务[6]、纺织服装领域检索[7]等也多有研究,但将本体引入款式领域的检索尚未进行深入研究。

连衣裙因春夏可单穿,秋冬可内搭为四季常青类目,且连衣裙款式复杂,覆盖多种廓形、领型等款式类型,具有广泛代表性。因此本文以连衣裙为例,提出了基于语义层面上的连衣裙款式语义检索模型,对其他类别服装的语义检索具有普遍适用指导意义。通过分析连衣裙款式知识及概念层次,利用连衣裙款式领域概念之间的语义关联,构建连衣裙款式本体模型。并结合本体语义扩展算法,将本体数据库在连衣裙款式信息检索中进行语义推理应用,实现连衣裙款式语义检索。

1连衣裙款式领域本体设定原则及流程

连衣裙款式本体是定义连衣裙款式领域、可以被计算机理解且被该领域所共同接受的一些概念,通俗地说,是建立检索连衣裙时所用的正式的词汇表,包含了连衣裙款式领域内的概念、实例、概念之间的关系及概念的属性等。领域本体结构如图1所示。

连衣裙款式本体在“七步法”建模方法基础上,结合服装产品的特点及款式检索的需求,形成的具体构建过程如下:1) 确定连衣裙款式本体的领域和范围,即本体构建的应用目标;2) 收集领域相关信息;3) 列举领域内最核心的概念,一般取自教科书或者专家知识;4) 核心概念词汇层次化;5) 核心概念同义词扩展;6) 确定概念之间的关系和属性;7) 利用本体工具构建连衣裙款式本体。

2连衣裙款式本体的构建

本文构建的连衣裙款式本体主要面向检索应用领域,一般在款式检索时需要对款式进行标注,而标注的过程就是获得描述款式的语义概念的过程,因此构建连衣裙款式领域本体最主要的任务是收集款式领域的概念词汇。本文概念词汇

的获取方法如图2所示。服装款式领域本体概念一方面由文献查阅和领域专家访谈获取款式知识的构成及分类,形成连衣裙款式领域本体的核心层次概念;另一方面通过对消费者问卷访谈进行概念同义词扩展。

2.1连衣裙核心概念层次体系建立

本文通过查阅及整理相关文献[8-10],整合了连衣裙款式领域内所有基础概念及其实例,选取影响款式造型较为明显的廓形、领型、袖型、色调、面料、图案、裙长、袖长、合体度等服装款式因素来分析连衣裙款式。

按照常见的服装款式分类,本文将连衣裙款式分为廓形、领型、袖型、面料、色調、图案、袖长、裙长、合体度9类一级概念,其下又分为21个二级概念,三级为二级概念的实例,如图3所示。如概念无领的实例有圆领、方领、V领等6个实例;概念光泽型面料的实例有绸、缎;概念柔软型面料的实例有丝绸、麻纱等。本文共收集74个实例。

2.2连衣裙款式概念的同义词获取

服装款式领域的一个检索障碍是词汇的多样性,主要是连衣裙款式的廓形、领型、袖型,不同地区不同人的叫法不同,导致用户的检索词汇与本体中的概念语义描述不尽相同。为了解决用户检索同义类型词时信息不足的问题,需要对本体中的词汇进行同义词扩展。例如,“H形”的同义关系概念有“直身形、直筒形”,当用户在领域本体模型中检索“H形”时,通过本体语义扩展,检索词将扩展为检索集“H形、直筒形、直身形”,以此提高用户检索的准确性。

2.2.1问卷访谈数据采集

为了使问卷结果更具科学性和有效性,本文从淘宝、京东等常用购物网站收集了图3中廓形、领型、袖型的20个概念实例的图片进行问卷访谈,如图4所示。

经查询,25岁~35岁为连衣裙消费主力军,因此确定调查目标人群为25~35岁。地区选择石家庄、北京、郑州等北方城市,杭州、南京等南方城市及成都、重庆等西南城市进行调研,每个地区选择5个访谈对象,每个款式类别分别让各地区的访谈对象指认类别名称。

2.2.2问卷访谈结果统计

本次问卷调查共收集了750张问卷,通过对问卷调查得到的结果进行统计分析整理,共得到225个同义概念,分别将之与层次概念中的概念对应,部分关键词的同义扩展汇总如表1所示。

2.3基于本体的连衣裙款式本体构建

服装款式概念划分具有的结构性和层次性特征,使得它可以建立知识本体模型。前文确定了连衣裙款式本体的概念,而概念在领域本体中是通过相互之间的关系连接起来的。本文利用Protégé工具构建连衣裙款式本体,主要涉及的概念之间的基本关系如表2所示,主要有组成关系、继承关系、实例关系、属性关系、同义关系5种[11]。Partof表达概念之间部

分与整体的关系,例如“廓形”是“服装款式”的一部分。Kindof表达概念之间的继承关系,例如“廓形”继承了“服装款式”的所有属性。Instanceof表达概念的实例和概念之间的关系,例如“H形”是“廓形”的一个实例。Attributeof表达概念之间的属性关系,例如“裙长”和“合体度”均是“连衣裙款式”的数据属性;“袖长”是“袖型”的数据属性。另外,使用“owl:Equivalent to”这一特定属性表达概念的同义关系,如“H形、直身形、直筒形”之间的关系。

至此,服装款式领域本体中的概念、实例及其属性在语义层面上建立了联系,得到部分语义本体框架如图5所示。

3基于本体的连衣裙款式检索

3.1基于本体的连衣裙款式概念语义相似度计算

领域本体中概念之间的语义相似度是语义信息检索研究的重点[12]。本体概念相似度计算是指在计算概念的相关度时参考了概念间的层次结构信息,如节点关系、语义邻居关系等。在款式检索中使用语义相似度来代表这些关系,连衣裙款式领域本体可以看成一本体层次概念语义树,如图6所示。其中结点N1、N2、N3等表示本体中的概念词,结点之间的边表示本体中概念与概念之间的语义相似度,如S(N1,N2)。

本文采用概念语义相似度的计算方法,用S(x,y)表示两个概念之间的相似程度。如果连衣裙款式本体中概念Ni和Nj是同义关系,则两者的语义相似度为1,即S(Ci,Cj)=1;如果是两个非同义的概念Ni和Nj,则两者之间的语义相似度按下式计算。

S(Ni,Nj)=(Dist(Ni,Nj)+θ)×θ(d(Ni)-d(Nj))CE(Ni,Nj)×2×Dep×max(|d(Ni)-d(Nj)|)(1)

式中,d(Ni)和d(Nj)分别是概念Ni和Nj对应的节点在概念树中的层次,d(Ni)-d(Nj)表示概念Ni和概念Nj的层次差,Dist(Ni,Nj)表示从概念Ni结点到概念Nj结点所经过的路径上相似度的和。θ是一个可调节参数,用于调节概念层次差对语义相似度的影响,一般大于等于0。CE(Ni,Nj)表示从概念Ni结点到概念Nj结点所经过的路径长度,每条边记数为1,当Ni和Nj不连通时,路径长度为∞。Dep为概念所在本体中的层次深度。

以此可以构造表示连衣裙款式本体中的所有概念的语义相似度矩阵[13]。本文经实验确定θ取值为0.2时,语义相似度结果与领域专家经验值相吻合,实验结果如表3所示。

3.2基于本体的连衣裙款式检索流程

将建立的连衣裙款式知识本体结构连接到款式检索的系统中。基于本体的连衣裙款式检索流程如下:用户发出语义检索请求,首先关键词进入本体进行关键词扩展,包括在领域本体的基础上对用户的检索语言进行同义和相似扩展(如果是单关键词也直接进行语义相似度扩展),生成新的语义检索扩展集合,然后在款式库中检索匹配的款式,最后将相似性款式检索结果推荐给用户。基于本体的连衣裙款式检索系統流程如图7所示。

3.3检索效果分析

本文以检索请求“q=H形、泡泡袖”为例,来验证基于本体检索系统的优越性。如果基于关键词的检索系统进行检索,结果只能是含有“H形、泡泡袖”这两个关键词的款式。而基于本体的检索,参照连衣裙款式本体,“H形”与“直身形”“直筒形”为同义词,相似度为1.0,“泡泡袖”与“公主袖”的相似度为10,与“灯笼袖”的相似度为0.811 0,这样原始的检索请求q经本体推理后表示为:q=(H形〈1.0〉,直身形〈1.0〉,直筒形〈1.0〉,泡泡袖〈1.0〉,公主袖〈1.0〉,灯笼袖〈0.8〉)。

图8为6个连衣裙款式,d1=(H形、泡泡袖),d2=(H形、公主袖),d3=(H形、灯笼袖),d4=(直筒形、泡泡袖),d5=(直筒形、公主袖),d6=(直筒形、灯笼袖)。

如果按照关键词检索,则与检索请求相匹配的相似度S结果为S(q,d1)>S(q,d2)=S(q,d3)=S(q,d4),而d5和d6不会被检索出来;如果按照基于连衣裙本体的检索方式,则相似度结果为S(q,d1)=S(q,d2)=S(q,d4)=S(q,d5)>S(q,d3)=S(q,d6),显然后者更符合检索语义上的需求。

目前常用两个指标来检验一个检索系统的检索效果,即查全率(Recall)和查准率(Precision)。公式如下:

P/%=nN×100(2)

R/%=nM×100(3)

式中:n指查询结果中与检索请求标注相同的款式数量,N指查询结果中所有款式数量,M指系统中所有相关的款式数量。

为了验证基于本体的款式检索模型的有效性,本文从淘宝、京东等常见购物网站选取80件已标注产品关键词的连衣裙款式,分别按传统简单关键词检索方式和基于本体的语义检索方式进行检索。通过结果比较分析,两种检索方式得到的查准率和查全率两项性能指标对比如表4所示。

将表4的查准率、查全率对比数据通过Excel转换成折线图,如图9、图10所示。

由表4、图9和图10可以看出,若待检索关键词无同义词时,如“圆领”“羊腿袖”,基于本体的检索和基于关键词的检索查全率结果不相上下,而前者查准率较高;但在检索同义词较多的关键词时,如“O形”“方领”等,基于本体的检索模型明显比基于关键词的查准率和查全率高。因此,基于本体的连衣裙款式检索模型得到了更好的检索效果,在查全率和查准率上得到了明显提高。

4结论

本文通过建立连衣裙款式领域本体,提出了基于语义层面的连衣裙款式检索模型。通过建立连衣裙款式本体,将连衣裙款式方面的概念进行汇总与整理,结合相似度算法,将用户的检索词进行同义扩展与相似扩展,有效提高了检索的查准率与查全率。与关键词检索方式相比,基于本体的连衣裙款式检索模型能更好地理解用户语义,为用户提供更为精确的检索结果,今后可与图像识别、自动添加标签等技术结合,实现更智能的服装款式检索。

参考文献:

[1]厉颖. 基于本体的服装领域知识表示的建模研究[D]. 青岛: 山东科技大学, 2010.

LI Ying. Based on Ontology about Field Knowledge Representation of the Clothing Modeling Study[D]. Qingdao: Shandong University of Science and Technology, 2010.

[2]李永超, 罗钧旻. 语义Web中的本体推理研究[J]. 计算机技术与发展, 2007(1): 101-103.

LI Yongchao, LUO Junmin. Research on reasoning on ontology in semantic Web[J]. Computer Technology and Development, 2007(1): 101-103.

[3]NASKAR D, DAS S. HNS ontology using faceted approach[J]. Knowledge Organization, 2019, 46(3): 187-198.

[4]李文靖, 胡书山, 余日季. 基于语义网的数字化家具模型本体设计与检索[J]. 软件导刊, 2019, 18(8): 136-139.

LI Wenjing, HU Shushan, YU Riji. Design and retrieval of digital furniture model ontology based on semantic web[ J ]. Software Guide, 2019, 18(8): 136-139.

[5]王倩. 基于本体的服装制造过程信息上下文建模研究[J]. 软件导刊, 2015, 14(12): 118-121.

WANG Qian. Research on ontologybased garment manufacturing process information context modeling[ J ]. Software Guide, 2015, 14(12): 118-121.

[6]伊恩弟. 面向云制造的服装加工服务本体模型及其描述[J]. 硅谷, 2012, 5(23): 189-176.

YI Endi. Clothing processing service ontology model for cloud manufacturing and its description[J]. Silicon Valley, 2012, 5(23): 189-176.

[7]梁道雷, 姚亮, 陈巩静. 基于本体的纺织服装主题搜索引擎系统研究[J]. 丝绸, 2014, 51(11): 28-31.

LIANG Daolei, YAO Liang, CHEN Gongjing. Research of ontologybased textile and clothing topic search engine system[J]. Journal of Silk, 2014, 51(11): 28-31.

[8]刘晓刚. 服装设计元素论[J]. 东华大学学报(自然科学版), 2003(2): 23-26.

LIU Xiaogang. Theory of fashion design elements[J]. Journal of East China University(Natural Science Edition), 2003(2): 23-26.

[9]XAVIER A, SOPHIE G, JEREMY H. VetiVoc: a modular ontology for the fashion, textile and clothing domain[J]. Applied Ontology, 2015, 11(1): 128.

[10]张韩. 连衣裙的造型要素与感性意象关联量化及款式推荐研究[D]. 杭州: 浙江理工大學, 2017.

ZHANG Han. Research on the Correlation Quantification and Style Recommendation of Dress Modeling Elements and Perceptual Images[D]. Hangzhou: Zhejiang SciTech University, 2017.

[11]罗仕鉴, 董烨楠. 面向文化创意设计的器物知识集成与管理[J]. 计算机集成制造系统, 2018, 24(4): 964-977.

LUO Shijian, DONG Yenan. Integration and management method of cultural artifacts knowledge for cultural creative design[J]. Computer Integrated Manufacturing System, 2018, 24(4): 964-977.

[12]张乃静, 鞠洪波, 纪平. 基于本体的林业领域语义查询扩展模型[J]. 计算机系统应用, 2016, 25(03): 151-156.

ZHANG Naijing, JU Hongbo, JI Ping. Modeling semantic query expansion of the foresty domain based on ontology[J]. Computer System Application, 2016, 25(3): 151-156.

[13]张志武. 基于本体的Web图像语义标注与检索模型[J]. 情报科学, 2015, 33(4): 121-124.

ZHANG Zhiwu. Web image semantic annotation and retrieval model based on ontology[J]. Informatics, 2015, 33(4): 121-124.

猜你喜欢

连衣裙本体款式
眼睛是“本体”
Dream Bag
一种新型水平移动式折叠手术床
长袍连衣裙
长袍连衣裙
长袍连衣裙
最火的单品款式
连衣裙之廓形对比战
Care about the virtue moral education
初为人母的着装困扰