基于在线评论情感分析模型的鲜果动态定价研究
2023-01-03江亿平夏争鸣郑德俊
江亿平 张 婷 夏争鸣 郑德俊
(南京农业大学信息管理学院)
1 研究背景
中央网络安全和信息化委员会印发的《“十四五”国家信息化规划》提出,将“提升数据资源开发利用水平”作为重大任务之一[1]。开展数据资源应用也是信息资源管理学科的前沿交叉科学问题,其中用户评论是较为成熟的数据资源应用领域,对其进行情感分析,有利于提升数据开发应用水平[2]。目前,居民鲜果采购渠道逐渐由线下门店转向线上平台,消费者在线上购买决策过程中,会综合考虑产品价值、在线评论等因素,同时产品价值等信息会通过在线评论的形式传递给其他消费者。零售商忽视在线评论,会导致定价决策过程中出现偏差,从而减少可获得的利润,阻碍长期发展,甚至可能会对整个生鲜电商行业造成消极影响[3]。因此,开展鲜果在线评论的情感分析与零售商定价决策管理的交叉研究,促进信息管理学科理论方法与电商运营管理实践的交叉融合,是电商平台可持续发展需要解决的重要科学问题,更是信息管理驱动的交叉科学研究热点。
然而,基于在线评论情感分析的鲜果动态定价研究是一个复杂的问题。主要包括以下几个方面:①在线评论情感分析。高效准确地进行在线评论情感分析需要综合考虑评论数量、评论分类和评论有效性等因素。②鲜果易腐特性。线上零售商需要考虑鲜果腐烂程度对消费者价值估值的影响,合理调整鲜果的价格波动,以增加销量。③决策间耦合关系。线上销售的鲜果两阶段动态定价受零售商和消费者共同决策,两者互相影响。
现有文献中,不少学者从线上零售商角度出发,综合考虑生鲜农产品特性、产品评论以及消费者行为等因素,进行相关研究[4,5]。已有针对在线评论的研究侧重于固定参数的场景,较少结合电商平台的实际应用场景。关于在线评论的研究方法,现有的半监督学习方法主要依靠训练单一分类器来实现样本的分类训练,当面对大数据量的用户评论时,往往会出现分析时间较长等问题[6]。
本研究的创新工作包含3个方面:①构建融合边缘采样和Tri-training算法的在线评论情感分析模型,为分析在线评论中包含的消费者情感提供新的方法;②提出了基于在线评论情感分析的鲜果动态定价模型,为促进信息系统与定价问题的交叉科学研究提供新的探索;③运用融合高斯回代的交替方向乘子法求解线上鲜果动态定价问题,为考虑消费者和零售商的多主体动态定价研究提供新的策略。
2 文献综述
目前,在线评论情感分析主要有基于情感词典、基于语义及基于机器学习3种方法。具体而言:①基于情感词典的分析方法准确率高,但泛化能力不强[7,8]。LI等[9]引入社会学理论的八要素对在线评论中的情感概念进行归纳;包乾辉等[10]对鸡蛋在线评论文本进行消费情感倾向分析。②基于语义的分析方法虽然有一定的泛化能力,但处理句法信息简略、结构性不强的短文本时准确率较低[11,12]。ZHANG等[13]将输出连接成类感知向量,获取用于情感预测的跨模态非线性关联;WANG等[14]提出句子-句子多路注意力网络方法来降低句子序列带来的复杂性。③机器学习已逐渐成为情感分析的主流方法。最常用的机器学习方法是监督学习[15,16]。史达等[17]采用机器学习方法对酒店评论进行情感分析;ZHU等[18]结合人工智能技术来制定可识别关键在线消费者评论的机制。
近年来,国内外学者通过对生鲜属性的刻画,对生鲜农产品动态定价问题展开相关研究。目前,针对生鲜农产品品质随时间逐渐衰减特征,生鲜零售商通常以最大化货架期内收益为目标,通过调整定价策略来吸引消费者。KAYIKCI等[19]提出数据驱动下的农产品多阶段最优定价策略;闻卉等[20]探讨了考虑绿色度的不同销售模式下生鲜农产品最优定价问题。在生鲜农产品销售过程中,库存政策和定价策略相互作用。FANG等[21]研究随机动态规划模型决策多周期下的定价与库存问题;FAN等[22]制定了多批次联合动态定价和补货计划。分析消费者购买偏好成为零售商制定定价决策的重要环节[23~25]。VAHDANI等[26]研究零售商如何根据消费者评分的变化来调整易腐产品定价策略;周玉等[27]构建两制造商均不回复差评、单一制造商回复差评,以及两制造商均回复差评的定价决策模型。
通过以上文献综述可知,基于情感词典和文本语义的两类方法在应对海量、繁杂的在线评论时,泛化能力与准确率难以兼顾,现有基于机器学习方法的研究较少考虑半监督学习方法。本研究在已有的半监督学习方法研究的基础上,从初始集构造和分类器集成规则两个角度,对协同训练算法进行优化改进,促进了半监督学习方法在评论情感分析领域的研究发展。其次,结合在线评论情感分析对该领域的定价策略展开研究仍然是热点问题。因此,本研究以实际评论数据为基础,运用评论情感分析结果,构建两阶段动态定价模型,得出合理的定价策略,旨在促进信息资源管理理论方法与电商运营管理实践的交叉融合,丰富数字中国建设的实践应用场景。
3 鲜果动态定价模型
鲜果动态定价示意图见图1。该定价问题包含零售商和消费者两个主体、预售和现售两个阶段,需要同时考虑零售商成本和收益、鲜果货架期、消费者效用、平台在线评论等多种因素。由图1可见,以线上销售为主渠道的鲜果零售商从供应商处进货并制定初始价格,消费者在平台购买产品时还没有评论参考,所以消费者比较产品估值与产品价格来决定是否购买;购买者相继在平台上发表评论,通过对已有评论的分析,未参与购买的消费者可以从中了解到产品信息和服务质量,从而更新对产品的价值估值;零售商可以从评论中挖掘问题,进一步调整价格。因此,本研究首先从零售商视角出发,建立消费者在线评论情感与消费者价值估值之间的关系;然后综合鲜果易腐与配送时效特征,厘清在线评论和线上渠道定价决策的耦合性,构建基于在线评论情感分析的鲜果动态定价模型;最后,设计融合高斯回代的交替方向乘子法对模型进行求解,并通过数值仿真和灵敏度分析,得出零售商最优定价决策。
图1 鲜果动态定价示意图
3.1 在线评论情感分析对消费者价值估值的影响函数
本研究通过分析不同零售商鲜果的线上评论信息,计算在线评论对消费者价值估值的影响因子,为零售商及时调整价格策略提供帮助。关于在线评论的研究方法,现有的半监督学习方法主要依靠训练单一分类器来实现样本的分类训练,当面对大量的在线评论时,往往会出现分析时间较长等问题。基于此,本研究提出了融合改进边缘采样和Tri-training的分类算法,以下简称IMS-Tri-training,并以此为基础构建在线评论情感分析模型,模型分为数据准备、改进边缘采样和Tri-training 3个部分。
(1)数据准备令s={s1,s2,…,si,…,sn},其中s表示在线评论数据集中的文本。利用在电商平台评论文本中训练好的词向量模型Vec对si进行向量化表示,ai=Vec(si),ai∈RL×dw,L为句子长度,dw为词向量的维度,本研究将a={a1,a2,…,ai,…,an}作为电商在线评论文本的表示。
(1)
比较各个样本点到分类超平面的距离,从中选出该SVM分类边缘之内的候选样本点,目标是从大量的未标记样本集U(有n个未标记样本,且n≫m)中找到距离分界面最近的所有样本点,则该样本点满足的距离条件为
x*=argmin|d|。
(2)
找到样本点x*后人工标记其类别。边缘采样易出现多个样本点信息量相似的情况,从而造成“扎堆”选择与信息冗余,与所追求的初始集信息尽可能丰富的目标相悖。在文本特征空间中,两个样本越相似,则它们越趋向于平行,余弦值也就越大。本研究将余弦相似度定理和边缘采样相结合提出改进的边缘采样,任意两样本间的相似度为
(3)
(3)Tri-training该算法在对未见样本进行预测时,使用集成学习中的硬投票规则,将3个分类器进行集成,来实现对未标记样本的分析预测;通过判断3个分类器的预测一致性,来隐式地对不同未标记样本的标记置信度进行比较,使得算法不需要频繁地使用耗时的统计测试技术。但与显式估计标记置信度相比,这一隐式处理往往不够准确。因此,本研究采用软投票的方式,要求集成的每一个分类器{hi,hj,hk}都能估计概率,将所有分类器预测样本为某一类别概率的平均值作为标准,概率最高的分类类别为最终的预测结果(result),则有
(4)
(5)
(6)
最后,本研究基于在线评论情感分析的结果,并依据罗汉洋等[28]的研究,选择3个数据信息较好的鲜果在线评论样本集,提取评论总数、负面评论比例、正面评论比例以及“价格”关注度4个指标数据的平均值。评论总数是某个产品评论集数据清理后的评论总数;负面评论比例是将评论按照“很好”“较好”“一般”“较差”“很差”进行多类分类后,包含“较差”和“很差”类别的评论个数占总数的比例;正面评论比例同理;“价格”关注度为涉及“价格”属性评论数量在所有产品属性评论数量中所占的比重,产品属性包括新鲜度、甜度、价格、水分、口感等。对评论集的指标数据实施标准化处理,然后综合多个评论集的指标信息进行消费者价值估值影响的评价,则有
(7)
(8)
3.2 构建鲜果动态定价模型
本研究对模型设置以下假设前提:
(1)鲜果潜在消费者群体为固定群体,不存在可替代竞争品。
(2)通常鲜果交付使用的是冷藏运输车,假设供应商按时将鲜果运给零售商且无损耗。
(3)不考虑鲜果异质性,当该阶段鲜果货架期结束时停止销售,剩余鲜果丢弃处理。
(4)假设零售商每阶段只进货一次,可进行任意数量的进货,且每次进货的品质一样。
(5)消费者在认为价格不高于价值估值的情况下会进行一个单位的购买,且购买者都会进行有效评论。
(6)不考虑同一阶段中评论的先后顺序,即同一阶段后购买的消费者看不到前面消费者给出的评论。
3.2.1目标函数
(9)
(10)
(11)
(12)
3.2.2消费者决策约束
(13)
(14)
(15)
(16)
(17)
(18)
(19)
3.2.3零售商决策约束
(20)
(21)
假设零售商进货时,鲜果为100%新鲜,则有
(22)
(23)
s.t.
(24)
(25)
(26)
(27)
(28)
(29)
(30)
(31)
(32)
(33)
(34)
式(23)是化简后的决策目标函数;式(24)~式(27)为保证零售商收益的成本需求约束;式(28)~式(32)为消费者决策约束;式(33)为零售商的定价约束;式(34)是鲜果易腐属性约束。
3.3 基于ADMM-GBS的模型求解算法
考虑到模型目标函数为两个阶段的总收益,可分离成两个独立的目标函数,且其中存在离散0-1变量,因此可采用考虑高斯回代的交替方向乘子法(ADMM-GBS)对模型进行求解。将式(28)~式(30)代入式(31)、式(32)进行简化,得到
(35)
式中,M是个充分大的数。为了使消费者价值估值函数更具有泛化性,将式(34)和式(35)进行合并,得到
(36)
(37)
(38)
将决策目标函数系数转化为矩阵形式QC,即
(39)
因此,基于在线评论情感分析的鲜果动态定价模型可转化为
(40)
(41)
3.4 案例分析
图2 火龙果新鲜度变化过程
图3 火龙果各阶段动态定价最优决策
由图3可知,不同货架期火龙果的价格呈下降趋势,且与图2的鲜果品质变化曲线相似,说明零售商对火龙果的新鲜度变化有较清晰的了解。此外,第一阶段零售商采取保守定价,在火龙果货架期临近结束前2天以低于进货成本的价格4.76元出售;第二阶段零售商了解到产品评论较好,认为即使上调价格,依然可以保证销量,临近货架期结束也不会低于成本价出售。
3.4.1第二阶段有无调整定价策略对比分析
为进一步讨论动态定价策略对零售商利润的影响,对比第二阶段有无调整价格策略下零售商的销量和利润(见表1)。为了排除进货量不同对利润的影响,两次实验第二阶段初期进货量均为5 180个。由表1可知,第二阶段调整价格后比未调整情况下火龙果销量减少了2.18%,但零售商利润提高了25.47%。说明第二阶段零售商调高价格后减少了火龙果的销量,但在线评论的良好口碑对于消费者价值估值起到了积极的影响,抵消了提价对零售商销量造成的损失。从整个销售情况出发,零售商减少了1%左右的销量,总利润增加了约13%。通过对比分析可知,准确高效地进行在线评论情感分析,对于线上生鲜零售商增加盈利具有重要作用。因此,如何经营自身产品口碑,并以此为基础合理调整产品价格以创造更大的收益,是线上销售需研究的关键问题。
表1 第二阶段有无调整价格策略下销售结果对比分析
3.4.2不同在线评论集对火龙果动态定价策略的影响分析
考虑到不同在线评论对消费者具有不同程度的购买决策影响,对多个在线评论集进行情感分析,并计算相对应的消费者价值估值影响因子,对比分析不同影响因子下零售商的最优定价决策(见表2)。由表2可知,在线评论对消费者价值估值的影响因子与火龙果销量呈正相关,现有评论越好,火龙果销量越高。当在线评论影响因子μ≥0时,第二阶段零售商会抬高价格来获取更高的利润;当μ<0时,零售商在第二阶段会降低价格来抵消第一阶段的差评造成的客户流失。综上可知,在线评论对零售商销售的影响具有“雪球效应”。
表2 不同在线评论影响因子下的最优销售结果
3.4.3重要参数灵敏度分析
为了验证不同参数对火龙果动态定价决策的影响,选择单位火龙果每日库存成本(c1)、消费者收入水平(β)和零售商承诺配送期限(t0)为重要参数指标,通过设置参数的不同取值范围进行实验分析。
设置单位火龙果每日库存成本(c1)为0.01~0.10,研究零售商销量与利润的变化情况(见图4)。由图4可知,单位火龙果的库存成本升高会导致零售商利润减少,但库存成本提高可以反映出鲜果零售商对于鲜果贮藏水平的改善,有利于降低鲜果腐烂速率,保证鲜果品质,从而吸引更多的消费者。因此,单位火龙果的库存成本与销量呈正相关。
图4 单位库存成本与销售结果的关系
消费者收入水平(β)越高,说明消费者能接受的心理价格越高,对产品价值估值的下限越高。为了分析收入水平对零售商销售决策的影响,消费者收入水平分别设置在(0,1)之间(见表3)。由表3可知,各阶段平均定价为已出售火龙果的总收入与数量之比。随着收入水平的增加,消费者可接受产品心理价格不断提高。当消费者收入水平普遍较低(β<0.5)时,零售商在第二阶段可调整价格的幅度较小,且消费者更倾向于量多价低的火龙果;当消费者收入水平较高时,零售商能够较大幅度上调价格以获取高额利润,且消费者偏好量少质优的火龙果。
表3 收入水平对零售商动态定价决策的影响分析
图5 零售商承诺配送期限与销售结果的关系
3.4.4对比ADMM-GBS算法与ADMM算法迭代结果
为进一步说明ADMM-GBS算法在收敛性上的优势,对比分析两种算法下的迭代收敛效果(见图6)。由图6可知,ADMM-GBS可以较快收敛到最优策略,即迭代次数到19次时,已经取得最优解组合,第二阶段初始单价调整为12.22元时,两个阶段总销量达到10 004,总利润为26 311元;而ADMM算法虽然随着迭代进行具有一定的收敛性,最优利润也在不断增加,但由于每次迭代缺乏对最优解的修正,导致收敛速度缓慢。结果证明,ADMM算法与高斯回代有机结合可以有效地优化算法的收敛性,从而快速收敛到最优解。
图6 算法迭代收敛效果比较
4 结语
本研究面向数字经济背景,以提高线上鲜果零售商经济效益为研究目标,探讨了以线上销售为主渠道的鲜果零售商动态定价问题。研究发现:①考虑在线评论情感分析的鲜果动态定价有助于增加线上生鲜零售的利润,从整个销售情况出发,动态定价策略下零售商的总利润增加了约13%。②单位鲜果的库存成本与销量呈正相关。库存成本提高可以反映出鲜果零售商对于鲜果贮藏水平的改善,有利于降低鲜果腐烂速率,保证鲜果品质,从而吸引更多的消费者。③当消费者收入水平普遍较低时,零售商在第二阶段可调整价格的幅度较小,且消费者更倾向于量多价低的鲜果;当消费者收入水平较高时,零售商能够较大幅度上调价格以获取高额利润,且消费者偏好量少质优的鲜果。
本研究结论可以为以线上渠道为主的鲜果零售商提供可行的销售管理建议,管理启示如下:①准确高效地进行在线评论情感分析,对于线上生鲜零售商增加盈利具有重要作用,以线上销售为主的零售商应当注重初始阶段的价格决策与口碑树立,为长期发展奠定坚实的基础;②零售商决策承诺配送期限时,需综合考虑承诺配送期限与服务范围、配送成本之间的耦合关联以做出最优决策;③零售商应针对不同收入消费群体选择合理的动态定价策略。
本研究已对在线评论情感分析及其影响的鲜果动态定价问题开展了学科交叉的探索性研究,然而在该领域还存在很多问题有待深入探讨。未来研究可以从以下3个方面展开:①在分析方法方面,可以从方法融合的角度出发,综合运用图像、音频、视频处理技术,以提高方法的适用性和可行性;②在销售决策方面,可以从完整销售周期出发,综合考虑零售商补货、消费者退货等环节,从市场供需和消费者需求角度进行考虑,提出更适用于实际应用场景的销售策略;③在需求函数方面,可以将多个参与主体及相关需求约束引入到需求函数构建中,使得零售商定价研究工作更加全面。