基于在线评论的邮政物流服务创意挖掘研究
2024-06-26李浩洋张瑞军周瑜
李浩洋 张瑞军 周瑜
摘要:在线评论聚集了海量意见与建议,可以为物流企业的运营管理提供方向性参考。文章提出基于情感分析的用户创意挖掘方法,帮助物流运营管理获得具有创新性的用户反馈,以提升运营效率。文章以邮政快递为研究对象,以抖音和快手短视频物流评论为数据源,通过爬虫获取数据;其次利用改进的LSTM情感分析模型Bi-LSTM实现情感分类;最后以词云聚焦话题点,以语义网络分析图并结合Apriori关联规则分析算法可视化出话题背后最后一公里的服务问题,以便资源调整与服务经营的改进。实验结果表明,用户对于快递员很少送货上门转而放入快递柜不满;在物流末端的偏远地区配送服务一般集中在乡镇地区,农村配送难以实现;用户对于贵重物品损坏丢失以及快递员服务态度反映强烈。
关键词:物流评论;服务改进;创意挖掘;情感分类;关联分析
中图分类号:F618文献标志码:A
DOI:10.13714/j.cnki.1002-3100.2024.11.016
Abstract:Useronlinereviewsgatherahugeamountofopinionsandsuggestions,whichcanprovidedirectionalreferencesfortheoperationandmanagementoflogisticsenterprises.Thispaperproposesausercreativityminingmethodbasedonsentimentanalysistohelplogisticsoperationmanagementobtaininnovativeuserfeedbackandimproveoperationalefficiency.Thisstudytakespostallogisticsastheresearchobject,takesTiktokandKuaishouvideocommentsasthedatasource,andobtainsdatathroughcrawlers;thentheimprovedLSTMsentimentanalysismodelBi-LSTMisusedtoachievesentimentclassification;finally,wordcloudisusedtofocusontopicpoints,andthenetworksemanticgraphiscombinedwithAprioriassociationruleanalysisalgorithmtovisualizetheserviceproblembehindthelastmileofthetopic,inordertoadjustresourcesandimproveservicemanagement.Theresultsoftheexperimentshowthatusersaredissatisfiedwiththefactthatcouriersrarelydelivertotheirhomesandputtheminthedeliverylockersinstead.Distributionservicesinremoteareasattheendoflogisticsaregenerallyconcentratedintownshipareas,andruraldistributionisdifficulttoachieve.Usersstronglyreflectonthelossofdamagedvaluablesandcouriersserviceattitude.
Keywords:logisticsreviews;serviceimprovement;creativitymining;sentimentclassification;associationanalysis
0引言
随着电商市场发展趋于饱和,物流同质化愈加严重,德邦、极兔被收购都在证明物流市场逐渐开始大洗牌,尤其是像邮政有着悠久历史的物流企业如何提升用户满意度值得深思。当用户参与物流企业的选择权日渐交给商家时,在线获取用户生成内容(UserGeneratedContent,UGC)是获得用户反馈,让用户参与企业经营与决策必经的一步。传统电话热线,问卷调查等数据分析方法存在用户涉及面窄、样本量不足等问题,无法满足物流需求爆发下了解客户诉求变化、提升运输端服务质量的诉求。建立企业开放社区,如花粉社区、开源社区虽保证了流量和数据样本量,用户反馈可靠性高,但对于传统制造企业来讲维护成本较高。当前能更好弱化时效性且初具数据规模的及时数据为产品服务在线评论,短视频评论在稳定数据量下还可以很好地聚焦于物流以及其他话题。以邮政物流为例,该主题单个短视频评论量大多维持在500~1000条左右,可作为数据获取的途径。
1文献综述
通过在线评论进行物流数据分析与质量评价已经极为普及。王洪伟等基于情感分析的方法深入研究快递服务质量评价体系,提出了影响快递服务质量的主要因素,为快递服务的改进提供针对性参考[1]。张志坚等构建了由制造商和零售商组成的博弈模型,研究零售商是否提供在线评论服务的策略选择,分析在线评论对供应链成员与消费者的影响[2]。夏名首利用中文分词、RFM改进模型对天猫碧根果买家在线评论的分析表明,各类型买家关注的因素大体相同,但关注度不一;各类型买家购后情感聚焦点基本一致,但参与程度不同[3]。张海道等采用特征提取、主体挖掘与事件构建等方法,对消费者网购在线评论进行分析,探究电商平台物流服务质量的主要影响因素[4]。
如上研究,传统物流领域研究更多还只停留在对物流评论进行粗粒度分析,诸如情感分析、影响因素的分析,很少有对物流评论进行挖掘隐含且有直接价值的信息。创意挖掘做为文本挖掘的一个分支,它通过机器学习或深度学习等手段从在线评论中挖掘有价值的信息,可以为物流细粒度研究提供新的思路。如程斌等通过细粒度情感分析模型构建评价指标,对多款手机进行综合评价与可视化分析,帮助生产者进行工艺改进和发展方向调整[5]。李琰等借助文本挖掘技术提取不安全行为及其诱因特征词,运用Apriori算法进行关联规则挖掘,搭建不安全行为及其诱因关联网络。发现6类核心诱因与关联因素会对不安全行为产生直接影响[6]。姜早龙等应用文本挖掘技术提取出改造认知、改造需求、改造施工等主题中不同热点词汇的关联信息,深入研究公众的关注热点与讨论内容,据此提出针对性的老旧小区改造推进策略[7]。阴艳超等针对用户个性化文本需求,提出一种应用于汽车外观造型设计的改进微粒群算法的混合启发式挖掘方法,有效指导了产品创新的实施[8]。
2基于机器学习的邮政创意挖掘流程
本文在文献研究以及方法综述的基础上,聚焦于用户对于物流企业的创意性评价。这里基于神经网络及其他机器学习算法构建评论挖掘模型,具体研究框架如图1所示,主要由三个部分组成:数据准备、情感分析、物流创意挖掘。
2.1邮政评论获取与预处理
本文选择主流的抖音和快手作为物流评论的数据源,利用Python库伪装成浏览器发送请求实现爬取物流数据。在进行繁转简、错别字纠正、短句去除等清洗后需要对数据进行预处理。汉语不同于机器语言,一个含义可以有多种表达方式,这就需要分析前在不改变原义的情况下尽可能词语统一表达。在自定义词典与百度停用词进行自定义增删调整后,分词效果如图2所示。
2.2基于神经网络的文本情感分类
数据集标注与词向量训练。本文采用以LSTM为基础改进的Bi-LSTM有监督的情感分类算法,采用维基百科语料库对评论进行预训练[9]。为保证标记的客观性,负向标记为-1,中性或者正向统一标记为1的规则分类模型,利用Word2vec进行词向量训练。不同于满意度分析,创意源于痛点,创意挖掘的观点应该更多在物流负面评论中产生,即将正面评论或者中性评论视为一类过滤出去,其中文本分类处理简化过程如图3所示。
2.3创意挖掘分析
2.3.1词云与语义网络分析
本文以Python的WordCloud库进行可视化分析,以预处理的词语为基础,根据词频的不同,词语大小不同,从而凸显各个词语在文本中的不同重要性[10]。
2.3.2关联规则分析
本文使用ROST-CM6软件绘制可视化的语义网络图来分析出各个特征词之间的联系,比较出词语彼此之间依存关系[11]。利用Apriori算法对物流负面评论预处理词语进行关联分析,它是用一种称作逐层搜索发现词语关系的迭代方法[12]。如图4所示,K个项的集合为k项集,如果某项集满足最小支持度,则称它为频繁项集,k项集用于探索k+1项集。首先,找出频繁1项集的集合记做l,l用于找出频繁2项集的集合l,再用于找出l,如此循环下去,直到不能找到频繁k项集。如图4为一个简单的分析过程,items为项集,sup为支持度计数,c为候选集i,l为频繁项集i[13]。
3邮政物流实例研究
3.1数据介绍
邮政数据评论时间集中在2019—2022年9月份,评论量为50000条左右,主要集中在10~25个字符长度,如图5所示。通过构建Bi-LSTM对邮政评论进行学习,模型准确率如图6、图7所示,预测准确度维持在85%以上,Loss下降并趋于平稳,效果比较理想。最终得出23988条负面评论用于接下来的创意挖掘分析。
3.2创意挖掘结果分析
3.2.1词云分析
如图8所示,通过词云发现用户对于邮政的负面话题可以聚焦在丢件问题、速度慢问题、取货节点三个方面。丢件话题中与其相关的词语有贵重物品、赔偿、保价、丢失等。速度话题中与其相关的词语有多天、没到、路上等。配货话题则是自提、送货上门、乡镇、农村等词语。
3.2.2语义网络与关联分析
(1)从图9看出与“丢失”密切相关的词语有“保价”、“赔偿”、“贵重”,用户通常在发货前对商品进行保价来降低损失。从表1中的关联分析表看,“丢失”出现的情况下“赔偿”出现的概率达80%,说明商品损坏或者丢失的情况下消费者关注的问题之一是赔偿。在“运费”出现时“赔偿”一词出现概率为74.7%,结合文本来看消费者不满于解决方案多是3倍运费,小于商品本身的价值。“贵重物品”出现的情况下,“保价”出现概率为53.1%,说明通过保价方式来减小损失是消费者普遍接受的一种解决赔偿方式。
(2)图9中与速度密切相关的词语有:“多天”、“没到”、“三天”等,文本对于速度的界定多以3~4天到货为准,而负面评论表示收货多在一周左右甚至更久。从置信度来看“邮寄”、“没到”词语出现的情况下主要词语为“多天”,其概率分别均高于40%,说明用户在运输速度上不满,结合词云和文本发现爆仓、门店营运时间、快递员服务意识对于速度产生一定影响,说明邮政物流需要在这几个节点上进行改进。
(3)在取货问题上,与取货问题相关的词语有“打电话”、“乡镇”、“送货上门”等,邮政配送网点难以覆盖所有区域,且多以电话或者短信形式直接通知用户去自提点取货。“放”出现的情况下“自提点”出现的概率为76.47%,即快递小哥多在未征得用户意见的情况下放到自提点,加之驿站距离较远,下班时候驿站已经关门给消费者带来了极大的不便利性。“送货上门”59%概率表明用户诉求是送货上门。从支持度来看“农村”、“乡镇”词语出现概率较大,结合上文分析发现邮政物流在上述行政区域网点覆盖率低,配送范围止于乡镇,农村等偏远地区难以进行配送。
4结论与展望
本文通过创意挖掘分析发现邮政物流存在的诸多问题。上述这些问题与其内部人员管理、组织结构以及组织战略相关,但不是单个原因造成的,而是环环相扣交错影响所带来的结果。通过上述分析总结出如下建议:
(1)加强对自提点的管控。早期市场竞争时期,为了加快市场布局,物流多采用加盟方式推进市场布局,虽然在速度上取得了优势,但是也导致管理的困难,诸如疫情防控难以落实、员工素质低、安全性差、不服从总部管理等问题。中国邮政的自提点为中邮驿站,其主要集中在一线城市。进行扩充中邮驿站市场,在加强驿站自营比例的同时,加强和完善经营制度以及严格的经营流程是一种比较好的方向。
(2)注重员工成长,提升员工待遇。当前分拣效率提升下,一线员工作业强度也不断加大,且越加机械,员工的岗位认同感也逐渐降低。快递员不愿送货上门的原因,不单是责任心问题,还有配送员个人利益问题,每单利润过于稀薄。放到驿站可以减少配送量,利润进一步分割也是无奈之举。不难发现德邦、顺丰在价格上高于市场但在服务上可以做到送货上门。邮政之所以难以下沉到村级配送,也是由于参与农村配送的企业与员工利润太少,也是造成快件丢失,服务差的主要原因。
(3)完善公司作业服务规章制度。制定公司各项规章制度,严格按规章制度办事,奖惩分明有章可循,有法可依,才能改变公司的面貌职工才有归属感。另外在运输、仓储、搬运、装卸、流通等环节作业流程应标准化与规范化,比如在产品寄件时提醒顾客贵重货物保价问题以及赔偿标准事宜等,不仅可提升服务质量,也可减少后期投诉频率。监督仓库作业人员、配送员在包装、分拣、贴标、搬运、质检时,严格按作业规范进行操作,保障服务质量。比如邮政物流仓库环节中对于临时工的作业规范,服务外包的管控。
本文仍有不足之处可以在未来研究中进行完善,诸如针对短文本话题分析可以利用针对性算法研究,或者采用多种组合算法进行研究。
参考文献:
[1]王洪伟,宋媛,杜战其,等.基于在线评论情感分析的快递服务质量评价[J].北京工业大学学报,2017,43(3):402-412.
[2]张志坚,王鹏,郭军华,等.基于在线评论服务策略的电商供应链决策[J].系统工程学报,2021,36(2):227-239.
[3]夏名首.基于买家在线评价的购后评价特征数据挖掘[J].中国流通经济,2017,31(7):30-38.
[4]张道海,杨晨.基于语义的电商平台物流服务质量主题分析[J].物流科技,2023,46(1):36-40.
[5]程斌,高圣国.基于细粒度情感的文本挖掘及可视化分析[J].应用数学进展,2021,10(1):128-136.
[6]李琰,张祎,侯涛,等.基于文本挖掘的不安全行为诱因关联网络分析[J].煤矿安全,2023,54(4):251-256.
[7]姜早龙,李荷.老旧小区改造的公众关注热点及推进策略研究——基于文本挖掘技术[J].建筑经济,2023,44(1):29-36.
[8]阴艳超,孙林夫,郭成.基于模糊物元PSO混合优化算法的客户创意挖掘[J].计算机应用研究,2008,25(8):2309-2311,2318.
[9]SIAMI-NAMINIS,TAVAKOLIN,NAMINAS.TheperformanceofLSTMandBiLSTMinforecastingtimeseries[C]//2019IEEEInternationalConferenceonBigData(BigData).LosAngeles,CA,USA:IEEE,2019:3285-3292.
[10]NINGW,LINS,ZHOUJ,etal.WocEA:Thevisualizationoffunctionalenrichmentresultsinwordclouds[J].JournalofGeneticsandGenomics,2018,45(7):415-417.
[11]杨雯丹,曹国忠.基于依存句法和语义网络的用户需求识别方法[J].机械设计,2022,39(10):154-160.
[12]李英,汤庸.基于关联规则与相似度的数据挖掘算法研究[J].华南师范大学学报(自然科学版),2021,53(5):121-127.
[13]PAPIR,ATTARCHIS,BOLOORANIAD,etal.KnowledgediscoveryofMiddleEastdustsourcesusingApriorispatialdataminingalgorithm[J].EcologicalInformatics,2022,72:101867.
收稿日期:2023-06-07
基金项目:武汉科技大学研究生创新创业基金项目(JCX2021039);湖北省高等学校省级教学研究项目(2020369);湖北省高等学校哲学社会科学研究重点项目(21D014)
作者简介:李浩洋(1997—),男,河南漯河人,武汉科技大学管理学院硕士研究生,研究方向:自然语言处理、物流管理;张瑞军(1972—),男,湖北仙桃人,武汉科技大学服务科学与工程研究中心,教授,博士,研究方向:自然语言处理;周瑜(1999—),男,湖北鄂州人,武汉科技大学管理学院硕士研究生,研究方向:供应链管理。
引文格式:李浩洋,张瑞军,周瑜.基于在线评论的邮政物流服务创意挖掘研究[J].物流科技,2024,47(11):64-67.