APP下载

基于相似度匹配的定制衣柜模块组合方法研究∗

2021-05-06王思航陈星艳彭思立

林产工业 2021年4期
关键词:柜体衣柜分区

王思航 陶 涛 陈星艳 彭思立

[1.中南林业科技大学,湖南 长沙 410004;2.美宅科技(北京)有限公司,北京 100089]

随着消费者个性化需求的不断提升,定制家具越来越受到消费者的青睐。由于市场竞争激烈,行业受疫情影响严重,实现引流并获得订单是企业生存的前提。对于定制衣柜企业,解决衣柜模块组合工作复杂且重复度较高的问题,提高设计效率,确保短时间、高效率为消费者设计出符合其需求的衣柜,是未来成功的关键[1-4]。

目前,推荐系统已广泛应用于普通电子商务平台和学术网站。在推荐系统中,相似度是最常见的计算推荐度的指标之一[5-7]。本文采用相似度匹配的推荐方法,即将用户信息与柜体数据进行匹配,以实现快速精准地推荐定制衣柜模块组合方案。

1 数据处理

1.1 研究内容

模块化定制衣柜的分区处理,是一项重复性高且难度系数偏低的工作,在衣柜设计过程中占据较长时间。为实现快速出单并减少设计师的重复性工作,从而提高生产效率,节约企业成本,本文将推荐系统与衣柜功能设计相结合,根据用户画像快速推荐符合用户需求的模块组合方案[8-10]。模块化定制衣柜组合方案推荐可以描述为:某厂家有一定数量的单元柜模块,每个模块都具备不同的储物功能。用户所表达的信息为用户画像,这些信息与衣柜功能有一定的映射关系。通过相似度匹配,选取符合用户需求的最优模块组合方案。

1.2 模块数据化

推荐系统包含2 种:一种是基于协同过滤的推荐,另一种是基于内容的推荐[11-12]。在无数据积累的情况下,本文选用基于内容的推荐,因此需对每个单元柜体模块进行数据化标注。单元柜模块间的差异主要体现在功能分区上,为此需根据单元柜模块的功能特征对模块赋予数据化标签,并录入数据库[13-14]。本文以10个单元柜模块为样例(见图1),依据衣柜储物功能进行关联推荐。

图1 定制衣柜模块单元柜示例Fig. 1 Example of customized wardrobe module unit cabinet

衣柜主要功能分区有叠放区、被褥区、裤架区、长衣区、短衣区、抽屉区六类。将每个区所在单元柜的空间体积占比作为此功能分区向量的长度。以B单元柜为例,当无顶柜时,初定柜体高度为2 100 mm,其中被褥区所在区域高度尺寸为400 mm,体积占比约为20%;叠放区所在区域高度尺寸为600 mm,体积占比约为30%;短衣区所在区域高度尺寸为1000 mm,体积占比约为50%。B单元柜中没有裤架区、长衣区、抽屉区,因此B单元柜数据化处理结果为(0.30,0.20,0,0,0.50,0)。当有顶柜时,顶柜承担了被褥区功能,因此单元柜模块中的被褥区变为叠放区,此时应当去掉单元柜模块中的被褥区数据维度,则B单元柜叠放区空间占比变为50%,短衣区空间占比变为50%,此时B单元柜数据化处理结果变为(0.50,0,0,0.50,0)。对于顶柜,不同厂家会有不同的标准。本文以2 350 mm高度为标准,在柜体超过2 350 mm时作加顶柜处理[15]。通过计算,以上10 个单元柜模块数据化处理结果如表1、2 所示。

表2 定制衣柜单元柜模块结构化数据示例(有顶柜)Tab.2 Example of structured data of customized wardrobe unit cabinet module (with top cabinet)

一个衣柜往往是由多个单元柜体组成,因此每个衣柜模块组合方案的单元柜个数及单元柜体积占比会随着整体衣柜尺寸的变化而变化。柜体宽度方向尺寸对单元柜个数及尺寸比例的影响如表3 所示。

表3 柜体宽度分区比例示例Tab.3 Example of partition proportion of cabinet width

1.3 用户分析

用户在定制衣柜时会与设计师进行沟通交流,在设计衣柜模块组合方案前,设计师同样需要获得用户的需求信息,这在推荐系统中被定义为用户表达。影响模块组合方案的用户画像涵盖四个方面:衣柜尺寸、衣柜使用人数、使用人员的年龄性别、功能分区需求。用户输入信息如表4 所示。

表4 用户输入信息表Tab. 4 User input information table

将以上用户信息与衣柜功能分区建立映射关系,根据映射关系进行衣柜组合方案的匹配,实现符合用户需求的衣柜模块组合方案推荐。

2 推荐方法

2.1 映射关系建立

相似度匹配的前提是统一用户输入层与模块数据层的维度[16]。模块数据层为标注在单元柜模块上各个功能分区(叠放区、被褥区、裤架区、长衣区、短衣区、抽屉区)的空间占比。在用户的输入信息中,使用者和功能分区需求影响衣柜模块种类,衣柜尺寸影响衣柜模块个数。本文根据调研分析获得的不同使用者对功能分区的不同需求,将使用者与功能分区建立映射关系,如老年男士对叠放区和短衣区需求较大,其次为存放小件衣物及药物的抽屉区和放置过季衣物被褥的被褥区,再次为存放裤子的裤架区。将数据合理化处理,即得到老年男士与功能分区之间的映射关系(0.30,0.10,0.10,0,0.30,0.20),每个向量代表的是此功能分区下的空间占比。以此得到使用者与功能分区的映射关系如表5 所示。这些数据在推荐系统中被定义为专家意见,可作为网络平台初期冷启动的基础数据[17]。当平台的用户数据不断累积增加到一定量后,可针对用户数据进行机器学习训练,从而使得映射关系更加客观准确[18-19]。

表5 使用者与功能分区的映射关系Tab.5 The mapping relationship between users and functional partitions

上述使用者与功能分区的映射关系是基于对设计师及不同年龄层次的消费者调研结果总结所得,不同用户对功能分区会有个性化需求。因此为用户提供的功能分区需求输入包含多、正常、少、无4 个选项,利用这4 个选项对功能分区需求的影响,建立基础规则。根据网络平台冷启动及相似度匹配数据相关性规则,选项多、正常、少和无分别表示在表5 体积占比的基础上+0.10、+0、-0.10 和清零。每一个功能分区的加或减均对应其余功能分区空间占比的平均加减,并最终保持体积占比总和为1,如老年男士在无顶柜柜体尺寸下选择无裤架区,则向量(0.30,0.20,0,0,0.50,0)变化为(0.32,0.12,0,0.02,0.32,0.22)。以上仅完成了用户信息输入与模块数据维度的数据结构化统一。当平台积累了一定量的用户数据后,再针对此基础规则继续进行调参优化,以提高客观性和准确性[20-21]。

2.2 相似度匹配

相似度包含余弦相似度、欧氏距离、皮尔森相似度等。对于不同的样本数据,可采用不同的计算方式。基于本研究处理的是多维度数据,因此优先采用余弦相似度计算方式。余弦相似度是通过测量两个向量夹角的余弦值来评估它们的相似度,最终得到的数值位于[-1,1]区间,数值越大说明两个向量相似度越高,数值越小则相似度越低。其余弦相似性θ由点积和向量长度给出[23-25],计算公式如下:

式中:A、B分别代表用户向量和模块向量;Ai、Bi分别代表A和B的各分向量。

由于对可能性的搭配是采用笛卡尔积的结果,因此会出现多个相同单元柜重复使用的情况。设组成柜体的单元柜总个数为t,重复的单元柜个数为r,则最终柜体组合方案的单元柜重复率L为:

将单元柜重复率以及功能分区相似度作为推荐的两个维度,并分别设置权重w1、w2,则最终的相似度(Similarity)公式如下:

将组成整个柜体的各个单元柜所占比例设为mi,比例总和设为x,单元柜个数设为n,组成整个柜体的单元柜叠放区、被褥区、裤架区、长衣区、短衣区、抽屉区的占比分别设为ai、bi、ci、di、ei、fi,则整个柜体的各个功能分区的组合向量Bi为:

对用户输入转化的向量Ai与不同柜体个数及样式组合而成的向量Bi进行相似度计算,最终得出与用户需求相似度最高的柜体组合方案。

3 应用实例

在确定用户输入项,设计并存储单元柜模块及其所标注的数据,并建立映射关系后,推荐系统所需的基础数据准备就绪。下面选取两个用户信息,将其输入系统,进行推荐流程的应用测试。

3.1 用户画像数据化处理

两个用户模拟输入表6 信息。

表6 用户画像Tab.6 User portrait

根据既定规则,数据化转换结果为A1=(0.15,0,0.30,0.15,0.20);A2=(0.27,0.17,0,0,0.38,0.18)。根据柜体宽度方向尺寸,求得用户画像1的单元柜个数n=3或4或5,而用户选择无裤架,则将含有裤架区的单元柜过滤掉;用户画像2的单元柜个数n=2或3。两个用户画像下定制衣柜单元柜模块组合方案的所有可能性如表7所示。

表7 用户柜体尺寸所对应的单元柜个数与比例Tab.7 The number and proportion of unit cabinets corresponding to the size of user's cabinet

3.2 相似度匹配

图2 成年夫妻的模块组合方案Fig. 2 Modular combination scheme for adult couples

图3 儿童的模块组合方案Fig. 3 Module combination scheme for children

将以上组合方案转化为输出向量Bi,并与Ai进行余弦相似度计算。如图2所示,求得在成年夫妻用户画像下,单元柜选择D、D、G、F 4个模块组合时,相似度值最大为0.94,此时所得输出向量B1=(0.19,0,0.36,0.24,0.21);如图3所示,求得在儿童用户画像下,单元柜选择D、G、H 3个模块组合时,相似度值最大为0.97,所得向量B2=(0.24,0.15,0,0.23,0.2,0.18)。

3.3 结果分析

由图2、3可见,在较少单元柜模块情况下,最终的柜体基本匹配了用户画像,满足了用户的功能需求。数据库的单元柜模块得到进一步丰富,在收集大量用户数据后,对上述基础数据进行更新迭代,推荐方案将会更加丰富,更加贴合用户需求。

4 结语

本文基于定制家具设计与营销现状,将基础研究与新技术融合,对定制衣柜模块化设计及数据化处理进行了深入研究。在无用户数据基础的情况下,探索了定制衣柜组合方案的推荐方法。随着数据的积累,机器学习可不断提高推荐的准确性,大大提升企业效益。在不久的将来,人工智能新技术将与传统家居行业深度融合,更好地为产业赋能,推动行业发展。

猜你喜欢

柜体衣柜分区
贵州省地质灾害易发分区图
上海实施“分区封控”
自动化柜体组装线设计与分析
早秋畅想
珠藏韫柜
妈妈衣柜里的珊瑚橙
天然橡木书桌
高低压开关柜的安装要点分析
街头风格“入侵”衣柜
大型数据库分区表研究