APP下载

基于文本挖掘的速卖通平台女性消费者连衣裙偏好分析

2021-11-26聂爽爽王维红

现代纺织技术 2021年6期
关键词:文本挖掘连衣裙跨境电商

聂爽爽 王维红

摘 要:产品的开发设计是企业开展跨境电商的第一步,也是跨境电商能否成功的最重要因素。在网络销售平台中,连衣裙作为女装的一个主要类目,在各销售平台的搜索量和销售量都占据了重要比例。客户评论数据是客户对于产品最直接的反馈,差评更是线上抱怨言语行为的最好体现。选取连衣裙为研究对象,通过爬取速卖通平台上销量前60的连衣裙,研究其产品属性,并对其评论数据及差评数据进行文本挖掘,从而分析得出速卖通平台上女士连衣裙消费者偏好,为开展跨境电商销售的商家进行连衣裙产品的选品和开发设计提供参考,同时为企业开展跨境电商业务提供思路。

关键词:文本挖掘;跨境电商;消费者偏好;评论数据;连衣裙

中图分类号: TS 941.71

文献标志码:A

文章编号:1009-265X(2021)06-0113-09

Research on Female Consumers' Dress Preference on AliExpressBased on Text Mining

Nie Shuangshuang1, Wang Weihong2

(1.Fanli Business School,Shaoxing Vocational and Technical College, Shaoxing 312000, China;

2.Glorious Sun School of Business and Management, Donghua University, Shanghai 200051, China)

Abstract: The development and design of products are the first step for enterprises to carry out cross-border e-commerce, and also the most important factor for the success of cross-border e-commerce. In online sales platforms, dresses are a major category of women's wear, which accounts for a large proportion in the search and sales volumes of various sales platforms. Customer review data is the most direct feedback of customers to products, and bad reviews are the best embodiment of online complaint speeches and acts. This article selects dresses as the research object. By crawling top 60 dresses sold on AliExpress, this paper investigates their product attributes, and conducts data mining on their review data and bad review data, so as to analyze and find out consumers' preferences for women's dresses on the AliExpress, and provide references for the design of dress products by cross-border e-commerce merchants and also provide ideas for enterprises to develop and design products on cross-border e-commerce platforms.

Key words: text mining; cross-border e-commerce; consumer preferences; review data; dress

收稿日期:2020-09-21 网络首发日期:2021-04-16

基金项目:2020年度绍兴哲学社会科学十三五规划重点研究课题(135532)

作者简介:聂爽爽(1984-),河南新乡人,硕士,副教授,主要从事纺织企业跨境电商、网络营销方面的研究。

跨境电商高速增长,成为中国传统企业转型升级的一个重要途径,可以帮助中国制造更好地走到

全世界。发展跨境电商,第一步就是要做好自己的产品定位以及产品设计,使得产品能够满足跨境电商消费者的需求和喜好。2018年中国出口跨境电商卖家品类分布上,服装服饰类销售额占比12.4%,仅次于3C电子产品类,位居第二[1]。服装服饰里的连衣裙类目无论从流量还是销售额上都占据了重要比例,因此本文以连衣裙类目为例,研究跨境电商平台消费者的偏好,为企业开展跨境电商销售的产品设计提供借鉴意义。

跨境电商后台的行业和消费者数据还是比较直观的,但是如何通过平台前端去挖掘消费者的偏好?目前国内外有些学者也有相应的研究。对产品销售数据和热销特征数据分析方面,吴艳等[2]、宋莹等[3]提出了通过网络数据找出产品的热销特征及消费者喜好参考,从而对款式的流行趋势进行总结和分析。从目前的研究来看,对于热销特征数据的研究基本都仅限于国内平台,跨境电商平台的研究较少。Salehan等[4]研究发现在线评论数据比从其他来源(如用户调研等)获取的用户数据更加可靠。消费者评论中可以获取有价值的信息[5]。Dave等[6]对观点抽取和语义分类进行了系统性的研究,实验效果要优于其他方法。在对消费者评价数据分析方面,Fucimi等[7]、Zhou等[8]通过对网络平台上评论数据的进行采集,并使用文本挖掘方法找出客户满意的因素。刘敏等[9]用八爪鱼采集器采集了手机的网络评论数据,分别使用社会语义网络构建和情感分析两种方法,从不同维度对评价数据进行了挖掘,结果表明可以提高挖掘效果。从国内外学者的研究看,文本挖掘被很好地用在对评价数据的分析上,文本挖掘主要是针对非结构化数据进行数据挖掘,主要可以進行词频分析、语义网络分析、情感分析[10]等。

结合国内外学者的分析,热销产品的特征以及热销产品的评论数据都可以挖掘消费者的偏好,本文选取速卖通平台连衣裙类目为研究对象,分析速卖通的整体发展情况以及连衣裙类目整体情况;对热销产品的销售情况、消费者评价数据、差评数据等进行数据挖掘分析,挖掘出消费者对连衣裙的偏好以及所关注的特征等潜在信息,从而为跨境电商平台产品选择和设计提供思路。

1 跨境电商平台连衣裙行业情况分析

跨境电商零售平台发展迅速,速卖通作为仅次于亚马逊平台的跨境零售出口平台,整体运营环境非常有利于跨境新卖家[11]。和亚马逊相比,速卖通平台上产品的价格竞争比较激烈,主要面对的客户是俄罗斯、美国、西班牙、法国、巴西等国家。

本研究选取速卖通平台的连衣裙类目为研究对象。调用速卖通后台行业分析的数据,如图1所示,32天(2019.12.18—2020.1.18)女装大类目金额成交占比24.27%,其中连衣裙类目访客指数达到1 277 682,客单价达到总之25.21,商品加购和收藏人数分别达到4 052 121和3 328 249。通过对平台数据的分析,发现俄罗斯访客指数远远高于其他国家,占比23.85%,其次是美国11%;但是从客单价数据看,俄罗斯是这些国家中最低的,其次是西班牙,都远低于平均值;巴西的客单价最高,其次是美国,英国、意大利国家的客单价都在平均值以上。

2 连衣裙在速卖通平台的销售情况分析

2.1 数据采集

首先利用GooSeeker集搜客采集速卖通平台(www.aliexpress.com),搜索“women dress”关键词,按照销量排行前60名,即PC端第一页的产品数据信息,包含产品基本信息、销量数据、价格数据等;其次逐条收集销量前60名产品的特征属性信息;最后再次利用GooSeeker爬取速卖通平台连衣裙销量前60名产品的全部客户评价信息以及差评信息。

2.2 连衣裙销售整体情况分析

图2是在速卖通买家首页搜索“women dress”关键词,按照销量排行前60的产品最近6个月的交易成功的订单数,不包括产生冻结、纠纷、全额退款的订单,其中近6个月销量最高的产品高达16000多个订单。

从图3中60个产品的产品评分数据情况看出,评分主要集中在4.7和4.8分,只有4个产品的评分处于4.5分以下,说明速卖通平台消费者对于中国制造的产品整体还是比较满意的。

从图4销量前60名产品的定价情况来看,10~20美元的产品数量最多,其次是5~10美元,20美元的产品有4个,5美元以下的产品仅为6个,可以看出速卖通销量比较好的产品单价并不是特别高,15美元美元左右的产品比较好卖。88%的产品对于俄罗斯、美国、西班牙等地运输方式都是包邮,即“free shipping”。

2.3 连衣裙特征属性的网络销售情况分析

速卖通平台连衣裙类目特征属性信息有品牌(Brand)、材质(Fabric)、裙长(Dresses Length)、袖型(Sleeve style)、领型(Neckline)、腰线(Waistline)、裙型(Silhouette)、图案类型(Pattern Type)、风格(style)、装饰(Decoration)、季节(Season)等10个属性。为了挖掘速卖通平台消费者对于产品特征属性的偏好,对收集的60个产品按照特征属性分别进行统计分析,如表1所示。

季节(Season):夏季(Summer)占比50%以上,春季(Spring)和秋季(Autumn)加起来24个产品,占比40%,而冬季(Winter)仅2个产品,这样的分布和连衣裙本身的特征比较接近。

材质(Fabric):速卖通平台销售商品的材质共有棉(Cotton)、涤纶(Polyester)、莫代尔(Modal)、羊毛(Wool)、亚麻(Linen)、尼龙(Nylon)、莱卡(Lycra)等36种选项,但是60个热销产品的材质大多选择的是涤纶(Polyester)。材质是组成服装的最基本元素,但是部分国内卖家对商品的描述也没有十分精确;产品的材质选项属于多选,很多材质中都或多或少会含有涤纶(Polyester),因此涤纶材质占比最高,达65%。

风格(Style):休闲(Casual)占比44%,性感&夜店(Sexy & Club)占比38%,波西米亚(Bohemian)占比7%,街头系列(Streetwear)占比4%,通勤(Office Lady)占比3%。休闲和性感类型占比较大,说明速卖通平台消费者更倾向于休闲和性感类的连衣裙。

裙长(Dresses Length):迷你裙(AboveKnee, Mini)占比38%,及小腿肚裙(Mid-Calf)占比25%,及膝裙(Knee-Length)占比22%,及踝裙(Ankle-Length)占比10%,及地裙(Floor-Length)占比5%。速賣通平台的消费者对于裙型的选择上,最倾向迷你裙。

裙型(Silhouette):紧身式(Sheath)占比最高,38%,A字型(A-Line)占比27%,直筒型(Straight)和上身紧下身宽松(Fit and Flare)各占比12%,铅笔裙(Pencil)占比5%,宽松型(Loose)占比3%。可以看出速卖通平台的消费者更倾向于紧身式的连衣裙。

图案类型(Pattern Type):纯色(Solid)占比63%,印花(Print)占比20%,花朵(Floral)和豹纹(Leopard)各占比5%,圆点(Dot)占比3%。在图案类型上,可以看出速卖通平台消费者更喜欢纯色,其次是印花,而豹纹也是他们喜欢的一种元素。

领型(Neckline):V领(V-Neck)占比38%,圆领(O-Neck)占比23%,高领(Turtleneck)占比10%,立领(Stand)占比7%,一字领(Slash neck)占比7%。与国内圆领更受欢迎不同的是,速卖通平台消费者更倾向于V领设计。

腰线(Waistline):自然(Natural)占比55%,高腰(Empire)占比45%。

袖型(Sleeve style):常规型(Regular)占比58%,吊带(Spaghetti Strap)占比22%,蝙蝠袖(Batwing Sleeve)占比5%,剩下的为其他几种类型。速卖通平台消费者除了常规型(Regular)的袖型外,吊带也非常受欢迎。

袖长(Sleeve Length):长袖(Full)占比52%,无袖(Sleeveless)占比28%,短袖(Short Sleeve)和七分袖(Three Quarter)占比比较少,说明速卖通平台消费者更偏好长袖和无袖类型。

装饰(Decoration):无(None)占比53%,其他占比都比较分散,说明速卖通的客户更倾向于无装饰、比较简单的连衣裙类型。

3 速卖通平台连衣裙网络评价数据分析

为了深层次了解速卖通平台消费者对于连衣裙的消费偏好,进一步探索消费者对于连衣裙的网络评论中所蕴含的信息,采用词频分析、社会网络和语义网络分析[12]进行可视化分析。

下载销量排行前60的评价数据,共计87397条数据,剔除“默认好评”无效数据后,共计41128条数据。

3.1 词频分析

使用ROST Content Ming System 6文本挖掘软件,首先对词频进行分析。提取前300词频,剔除一些“the/is/are/very...”等无效数据后,得到以下词频表,如表2所示。

3.2 所有评价数据的语义关系分析

对有效的41128条评论数据进行网络语义可视化分析[13]。得到表3和图5。

所有评论数据的语义关系如图5所示,由图5可知,在有效评论文本集中出现频次比较高的词“dress”、“size”、“fabric”、“like”、“height”、“quality”构成了整个网络图中的重要节点,其他的词如果和这些节点越靠近,则表明关系越密切。

因为“dress”就是连衣裙的类目词,因此它成了网络的中心,基本上与所有词都有相关。如名

词尺寸“size”、材质“fabric”、质量“quality”、面料“material”、长度“length”、袖子“sleeve”、身高“height”、体重“weight”、胸围“waist”“chest”、颜色“color”、尺码表“parameter”、价格“price”、物流“delivery”、 圖片“photo”等。表示结果的词漂亮“beautiful”、喜欢“like”、推荐“recommend”、大“big”、小“small”、很好“well”、合适“fit”、好“good”、闪耀“shine”、一样“same”、可拉伸“elastic”、喜爱“love”等。其中关系最密切的词是材质“fabric”和尺码“size”,表明速卖通平台消费者对于连衣裙,最关注的是材质和尺码。

尺码“size”这个节点也是除了连衣裙“dress”这个节点外最受关注的一个节点。密切关联的评价词不仅有身高“height”、体重“weight”、腰围“waist”、尺码表“parameters”、长度“length”、合身“fit”,还与一些评价字眼如小“small”、很好“well”、建议“recommend”、完美“perfectly”等有强烈的网络语义关系,说明速卖通平台消费者主要是从身高、体重、胸围、长度、尺码表、合身来衡量尺码是否相符,而尺码是否相符又构成了消费者是否能够认可这个产品的重要因素。另一方面小“small”出现了1779次,短“short”出现了1092次,紧“tight”出现了958次,无论出现的频次还是关系上,说明产品容易让速卖通平台消费者穿着“小”、“短”、“紧”,究其原因,速卖通平台的客户体型较丰满和高大,而速卖通平台的卖家大多还是国内商家,大多都还按照国内的经验设计连衣裙,导致连衣裙的尺寸出现偏小、偏短、偏紧的问题。

同时身高“height”也作为了重要节点,与身高“height”关联的评价词有质量“quality”、尺码表“parameters”、喜欢“like”、胸围“waist”、长度“length”等,和“size”这个节点基本也一致,再次说明了速卖通平台消费者对于尺码是非常看中的。因此如果要做跨境平台,一定要准确给出连衣裙的胸围、臀围、长度等尺码表,最好还能够给出不同尺码的身高体重建议区间,方便消费者进行挑选。

与材质“fabric”关联的评价词有质量“quality”、好“good”、舒适“pleasant”、喜欢“like”等词,其实在前面对60个产品属性值进行描述性统计分析时,大部分产品的材质都是涤纶“Polyester”,从国外的评价数据分析结果看,速卖通平台消费者在评价数据中,并不关注产品到底涤纶含量多少,棉含量多少,更看中的是质量、舒适或喜欢。

与喜欢“like”关联的评价词有看起来“looks”、尺码“size”、身高“height”、质量“quality”,可以看出,这些因素都可以激发消费者的“like”评价字眼。因此,“看起来喜欢”、“质量好”,“尺码合适是”速卖通平台消费者对于连衣裙最关注的三个因素。

从语义图中还有一些较分散的,如价格“price”、快“fast”、周“weeks”、物流“delivery”等与尺码、材质没有明显相关的结点,通过分析这些词的语义关系表以及原评论数据,这些词主要和价格、物流有关,可见价格、物流也是速卖通平台消费者关注的因素。

3.3 差评数据的语义关系分析

近年来,抱怨言语行为[14]逐渐引起了国内外学者的关注,曹娅琴[15]采集e-Bay网上的200条差评作为研究对象,对在网上购物平台上发生的抱怨语进行了深入探讨。皮常玲等[16]采用网络语义分析对民宿顾客抱怨信息进行分析,研究民宿顾客抱怨的主要问题。在线评论是用户评价产品优劣的重要依据,差评是线上抱怨言语行为的最好体现,因此可以从抱怨言语行为中挖掘消费者关注的产品特征[17]。

速卖通平台中,对关于的产品的评价时,可以打5颗星到1颗星,其中,5颗星和4颗星说明消费者对产品很满意、较为满意,3颗星、2颗星、1颗星说明对产品较不满意、不满意、非常不满意。因此本文将对产品评价3颗星及以下的认为是差评数据。

采集速卖通平台销量排行前60名的连衣裙,评价为3颗星、2颗星、1颗星的评价数据,共提取了5284条差评数据,差评率达到6.05%,说明对于平台热销产品,消费者整体还是满意的。通过对差评数据的词频分析、并进行语义网络分析,得出差评语义网络关系图,如表6所示。

从图6中可以看出,差评文本集中出现频次比较高的词尺码“size”、卖家“seller”、材质“fabric”、质量“quality”构成了整个网络图中的重要节点。

尺码“size”这个节点是最重要的节点,与此节点相关的词有身高“height”、小“little”、大“big”、小“small”、胸围“chest”、适合“fit”、不“not”、不同“different”、匹配“match”、可拉伸“elastic”、宽度“wide”、袖子“sleeve”等,基本都是和尺寸相关的,而通过研究相关评论内容,同样一个产品的差评中,有人说偏大,有人说偏小,说和描述不匹配。因此再次证明面对全球不同国家的消费者,体型不同,尺码描述有差异的情况下,能够准确用不同长度单位标注清晰,如用厘米、英寸、英尺分别标注,以引起不必要的差评和纠纷。

与卖家“seller”关联的评价词有坏“bad”、包裹“parcel”、钱“money”、想“want”、纠纷“dispute”、材质“fabric”等相关,而通过研究对应的差评内容,主要表现在“卖家人坏”、“未收到包裹”、“产品与图片或者描述不符”、“不是想要的”、“已经提纠纷了”等。与质量“quality”关联的评价词有材质“fabric”、面料“material”、很差“poor”、差“bad”、想“want”等,细读相关差评后,评价主要集中在“产品质量差”、“不是想要的”等观点上。材质“fabric”关联的评价词有薄“thin”、坏“bad”、面料“material”等,这些差评普遍认为“材质薄”、“面料差”等。还有一些关联比较紧密但是又相对较分散的词是包裹“parcel”、从未“never”、纠纷“dispute”、钱“money”、退回“return”、开“open”等词,这些词主要是和“包裹未到达”、“提纠纷”、“退款”相关的,可以归为是“物流”方面的原因。

通过这些差评的结点,可以看出,消费者的差评主要围绕质量差、物流方面两大块问题。质量差,主要表现在材质面料差、和描述不相符等;物流主要表现在未收到货、物流退回等。可见质量和物流是速卖通平台连衣裙类目差评的核心因素。

4 结论与建议

在速卖通平台开展销售时,掌握客户的偏好至关重要。对于销售连衣裙类目产品,应该从以下3点考虑:

a)在产品特征上,裙型是“紧身式”,长度是“迷你裙”,领型是“V领”的,类型“休闲”类和“性感”类型,袖型最好是“常规型”或者“吊带”类型,“长袖”或者“无袖”,装饰少点,简单大方的类型更加满足速卖通平台消费者的偏好。在速卖通平台选品时,可以参照这些产品特征。

b)在产品质量上,主要涉及产品的尺寸、材质。在尺寸方面,在跨境电商平台销售的产品,要参照主要目标国家消费者的體型,也可以参考国外品牌的一些尺码设计;产品尺寸要能够满足国外大部分女性消费者,经从速卖通经营者了解,身高最好能够满足155~180cm,体重能够满足50~90 kg;在产品描述页面要尽可能同时用厘米、英寸、英尺等单位准确地描述产品的肩宽、胸围、腰围、臀围、袖长、长度等关键部位信息,并给出身高、体重范围建议,方便消费者选择合适的尺码。在材质方面,消费者不太关注产品的具体材质,消费者收到货后对产品材质好坏的主观判断起着更大的作用,对于产品薄、材质差的非常容易引起抱怨情绪,因此要尽可能优选材质。除尺寸和材质以外产品制作工艺、包装问题等细节也要做到位,让消费者感知到产品的好品质。

c)在物流以及卖家的服务上,尽可能对俄罗斯、美国、西班牙、法国等地选择“包邮”的运输方式,这就要求企业要研究各地性价比最高、运输速度最快的运输方式,以防因为运输方式的问题引起客户的不满。对于客户不能在规定时间里收到货的情况,要通过告知客户、重新发货或者退款等方式及时和客户沟通,减少客户的抱怨,同时让客户感受到企业的“诚信”。

通过研究速卖通平台连衣裙类目的消费者偏好,帮助企业在速卖通平台迅速打开市场。希望研究思路能为企业开展跨境电商业务时的设计、选品、销售方面提供一些借鉴意义。

参考文献:

[1]电子商务研究中心. 2018年度中国跨境电商市场数据监测报告[EB/OL].[2019-06-05].http://www.100ec.cn/detail--6512462.html.

[2]吴艳,洪文进,吴小艺.基于大数据时代下的网络男装产品开发模式探究[J].毛纺科技,2015,43(8):66-70.

[3]宋莹,滕洪军,陈智.基于淘宝网销售数据的丝绸连衣裙流行趋势分析[J].辽东学院学报(自然科学版),2019,26(1):28-33.

[4]SALEHAN M, KIM D J. Predicting the performance of online consumer reviews: A sentiment mining approach to big data analytics[J]. Decision Support Systems, 2016, 81:30-40.

[5]李少波,全华凤,胡建军,等.基于在线评论数据驱动的产品感性评价方法[J].计算机集成制造系统,2018,24(3):752-762.

[6]DAVEK, LAW RENCE S, PENNOCK D M. Mining the peanut gallery: Opinion extraction and semantic classification of product reviews[C].Proceedings of the 12th international conference on World Wide Web. New York: ACM, 2003: 519-528.

[7]LUCINI F R, TONETTO L M, FOGLIATTO F S, et al. Text mining approach to explore dimensions of airline customer satisfaction using online customer reviews[J]. Journal of Air Transport Management, 2020, 83(3): 101760.

[8]ZHOU YUSHENG,YANG SHUIQING,LI YIXIAO.et al. Does the review deserve more helpfulness when its title resembles the content? Locating helpful reviews by text mining[J]. Information Processing & Management,2020,57(2):102179.

[9]刘敏,王向前,李慧宗,等.基于文本挖掘的网络商品评论情感分析[J].辽宁工业大学学报(自然科学版),2018,38(5):330-335.

[10]李少波,全華凤,胡建军,等.基于在线评论数据驱动的产品感性评价方法[J],计算机集成制造系统,2018,24(3):752-762.

[11]卢东亮. B2C跨境电商平台运营模式研究[D]. 北京:北京邮电大学,2017.

[12]张幸芝,雷润玲,杨超.文本挖掘:基于ROSTCM和NetDraw的内容分析[J].科技文献信息管理,2017(1):17-21.

[13]汪会玲,吴梦颖.基于社会网络分析的我国家庭旅馆评价模型构建[J].管理学报,2015(3):433-438.

[14]王伟.顾客抱怨行为及处理的研究综述[J].商业时代,2009(7):24-25.

[15]曹娅琴. 网上购物抱怨语的语用分析[D]. 兰州:兰州理工大学,2019.

[16]皮常玲,郑向敏.基于在线评论的民宿顾客抱怨研究:以厦门鼓浪屿民宿为例[J].旅游论坛,2017,10(3):35-44.

[17]杨程,谭昆,俞春阳.基于评论大数据的手机产品改进[J/OL].计算机集成制造系统:1-19[2020-01-21].http://kns.cnki.net/kcms/detail/11.5946.TP.20190606.1053.008.html.

猜你喜欢

文本挖掘连衣裙跨境电商
长袍连衣裙
长袍连衣裙
长袍连衣裙
数据挖掘技术在电站设备故障分析中的应用
基于LDA模型的95598热点业务工单挖掘分析
从《远程教育》35年载文看远程教育研究趋势
跨境电商与电子商务以及传统外贸电商的对比分析
河南郑州港区跨境电商发展的相关问题分析
“互联网+”背景下温州传统外贸制造业转型研究
慧眼识璞玉,妙手炼浑金