Best—Worst Scaling方法综述
2018-09-17张芳
摘 要:关于测量市场和消费者行为的方法,现有的研究大都是用李克特量表直接测量,然而这种方法有很多弊端,据此得到的调查数据质量并不高。基于此,有学者发明了一种更加准确的方法——Best—Worst Scaling。文章主要介绍了Best—Worst Scaling方法的背景与内涵、该方法的具体操作步骤、后期数据分析的方法以及该方法在各个领域的具体运用。
关键词:市场;消费者行为;Best—Worst Scaling方法
中图分类号:F713.5 文献标识码:A 文章编号:1008-4428(2018)05-66-02
一、 Best—Worst Scaling方法的背景与内涵
Best—Worst Scaling方法是对成对比较法的一种改进,早在20世纪20年代Thurstone博士就建立了一套关于测度的理论方法,他将其称为“比较性判断准则”(Law of Comparative Judgement)。这套准则是让被调查者将所有的对象进行两两比较,最终计算出每个对象的测量分数,后来的学者根据这种方法的特点将其命名为“成对比较法”,但是这个方法实施起来效率比较低。
当时Thurstone博士任教于芝加哥大学,彼时芝加哥犯罪频发,学者们开始研究应该如何减少犯罪,如何量刑。Thurstone博士就非常关注量刑方面的问题,他选择了19种当时比较常见的犯罪行为,以此来调查人们对这19种犯罪行为的严重程度的看法。一般来说,大多数人会选择打分的方式进行测评,但Thurstone博士认为通过打分得到的结果往往差异化程度不够,而且容易受到被调查者自身习惯的影响,因为有些被调查者倾向于打高分,有些则倾向于打低分。同样,如果采用排序的方法,被调查者很难准确地完成排序。一般来说,当需要排序的对象超过7个时,被调查者就很难做出准确的判断了,何况这里有19种犯罪行为。最终,Thurstone博士采用了成对比较法,将这19种犯罪行为进行两两比较,总共有171(19×(19-1)÷2=171)次成对比较。尽管这意味着需要花费更多的时间完成更多的问题,但被调查者并不会觉得乏味和困难,而且依此得到的数据分析会更加有效和准确,能获得更有意义的具有显著差异性的结果。
在此基础上,Finn & Louviere于20世纪90年代初发明了Best—Worst Scaling方法,简称为BWS,又称为Maximum Difference Scaling,被翻译为最大差异测量。这种方法是让被调查者分别从多组备选选项中指出“最好的”和“最差的”,然后研究者对其进行赋值,计算出每个对象的所得分数并进行排序,便可得出相应的结果。Best—Worst Scaling这种方法就不需要将所有对象进行两两比较,被调查者需要回答的问题数量也大大减少,这样既保留了成对比较法的优点,又极大程度地提高了成对比较法的效率。
二、 Best—Worst Scaling方法的具体操作步骤
在开始进行操作之前,首先需要下载一个辅助软件,将需要比较的多个对象k进行分组。在此可以利用例如SAS、R等软件,但其中最权威、功能最丰富、最容易使用和速度最快的软件是Sawtooth Software。使用Sawtooth Software的MaxDiff模块时,只需要输入需要比较的对象列表,设置好相关参数,软件就会自动生成问卷。
下一步就是设置相关参数,首先列举出多个需要比较的对象k,由多个对象k组成“最好/最差”任务。一般来说,一个任务中包含3—5个需要比较的对象m,且要保证每个对象至少出现了3—5次。据此可以推导出一套MaxDiff问题中任务个数t的公式:3×k/m≤t≤5×k/m,根据这个公式,便可以快速确定所需要的任务数量。当然,BWS方法对于样本量n也有要求,一般来说,必须保证各个对象出现的总次数不少于500次,即(n×m×t)/k≥500。假设在单个被调查者层面上每个对象出现至少3次((m×t)/t=3),那么需要的最小样本量n为167(500÷3)。从实际角度来说,如果能够保证每个对象出现3次的话,样本量n设为200是一个比较可行的选择。如果为了进行一些分组分析或人群细分分析,需要满足每个组别或每个细分人群都能满足上述条件。举个例子来说,假设最终的细分人群为4—5个,且需要比较这些细分人群之间计算结果的差异,那么相应的样本量应该是800—1000。最后,还有一个参数需要注意,就是MaxDiff问题的版本数。版本数越多,获得的比较信息就越全面。但是,过多的版本数也没有必要。一般来说,版本数控制在4—10左右。同时,每个版本对应的样本数量不需完全一致。因为每个受访者完成的Maxdiff版本是随机派发的,这样就可以保证每个版本对应的样本数都非常接近。设置好以上参数后,Sawtooth Software会自动生成问卷。
在生成问卷之后,可以通过以下四个原则来判断MaxDiff实验设计的优劣:①每个对象出现的次数均等;②两两对象同时出现的次数均等;③对象出现在每个任务中每个位置的频率相等;④所有对象均可相连接。以上这4个条件实际体现了两个核心要素——公平和效率。保证公平是为了测度结果准确,保证效率是为了节省时间和精力。如果不满足“每个对象出现的次数均等”这个条件,将会导致“出镜率低”的对象的测量误差增大。“两两对象同时出现的次数均等”,这也是为了公平起见。“对象出现在每个任务中每个位置的频率相等”,是为了消除位置因素导致的影响。因为人在观察事物时,眼睛扫描对象存在一定的方向倾向,第一眼看到的内容给人留下的印象往往更加深刻。所以,排在不同位置的对象往往会受到这种被关注次序的影响。“所有对象均可相连接”,这实际指的是成对比较信息的可传递性问题。假设只有2个Maxdiff问题,题目一需要在A/B/C/D中指出“最具影響/最没有影响”的对象,题目二需要在“E/F/G/H”中指出“最具影响/最没有影响”的对象。这时无论如何也无法推算这两个题目的比较信息,因为第一题中4个对象的比较关系无法和第二题中4个对象的比较关系建立任何“连接”。
三、 Best—Worst Scaling方法的后期数据分析
谈到数据分析,分层贝叶斯算法是目前被采用最多的方法,但这种方法比较耗时,且原理不太容易理解。相对来说,最简单的分析方式是计数分析,该方法不仅容易理解,而且计算方便、简单。因为分层贝叶斯算法和计数分析这两种方法最后得到的结果并没有显著差异,所以使用计数分析方法进行数据分析会更加方便。
计数分析是指统计每个对象被选择为“最好的”和“最坏的”的次数,然后把前者的数值减去后者的数值就可以得到每个对象的偏好分数。比如:某个对象在其所出现的4个任务中均被选为“最好的”,则其偏好分数被记为最高分4分,如果在其所出现的4个任务中均被选为“最坏的”,则其偏好分数被记为最低分-4。一般来说,最后得到的偏好分数的分布会是正态分布,也就是说总会有少数几个对象获得高分,少数几个对象获得低分,尽量拉开最好和最差的区别,也即Maximum Difference。这也是为什么这种测度方法最终被命名为Maximum Difference Scaling的原因。
四、 Best—Worst Scaling方法在各个领域中的运用
BWS方法在全世界范围内得到了广泛认可,最近由Marley & Louviere(2005)对其进行了详细阐述。此后,该方法得到了广泛推广,多被运用在医疗保健、社会科学等多个领域(Cohen,2009)。
Auger、Devinney、Louviere(2007)采用了BWS方法,调查了超过600位来自六个国家的消费者对社会和道德问题态度的差异,结果表明,这六个国家的消费者对社会和伦理问题的态度确实有一些差异。但是总的来说,被调查者最看重的是:人权、童工、安全的工作环境、良好的生活环境;最不看重的是:回收包装、使用动物副产品、使用可回收的材料、使用转基因材料。
Lusk(2009)利用BWS方法来确定消费者的食品价值系统。文章编制了一个内含十一种食物价值的表格,通过实证结果表明,在消费者看来,食品的安全性、营养、口味和价格是最重要的,而公平、传统和原产地等食品价值是最不重要的。
Sun et al.(2009)在研究中运用了BWS方法,在北京的各大超市门口随机采访了超市购物者以及大学生,调查影响消费者购买葡萄酒的因素,调查结果表明,事先品尝、葡萄酒产地和品牌是影响消费者购买决策的三个最重要的因素。
Louviere et al.(2013)在文章中举了两个运用BWS方法的实证案例,其中在第一个案例中,被调查者是420名悉尼、澳大利亚的居民,让他们从6个备选旅游地中选出周末最想去度假和最不想去度假的地方,最终根据每个旅游地的得分将其进行排序,从而得出被调查者对这6个备选旅游地的偏好。
Costanigro、Deselnicu、McFadden(2016)列出了牛奶生产企业的九个维度的CSR活动,使用BWS的方法来评估消费者对牛奶生产企业的CSR活动的看重程度,最终发现消费者最看重的CSR活动是动物福利和可持续农业实践,而水资源的消耗与社区活动是最不看重的CSR活动。
总的来说,Best—Worst Scaling方法的应用非常广泛,尤其是在企业社会责任的研究领域,克服了打分法、排序法、李克特量表在多个对象的比较方面的弊端,希望通过文章的介绍能为相关领域的研究提供一定的参考和指导。
参考文献:
[1]MARLEY A A J, LOUVIERE J J. Some Probabilistic Models of Best,Worst, and Best. Worst Choices[J]. Journal of Mathematical Psychology,2005,49(6):464-480.
[2]COHEN E. Applying best.worst scaling to wine marketing[J]. International Journal of Wine Business Research,2009,21(1):8-23.
[3]AUGER P, DEVINNEY T M, LOUVIERE J J. Using Best—Worst Scaling Methodology to Investigate Consumer Ethical Beliefs Across Countries[J]. Journal of Business Ethics,2007,70(3):299-326.
[4]LUSK G. Food Values[J]. American Journal of Agricultural Economics,2009,91(1):184-196.
[5]SUN H, GOODMAN S, YU Y, et al. Chinese Choices:A Survey of Wine Consumers In Beijing[J]. International Journal of Wine Business Research,2009,21(2):155-168.
[6]LOUVIERE J, LINGS I, ISLAM T, et al. An introduction to the application of(case 1)best—worst scaling in marketing research[J]. International Journal of Research in Marketing,2013,30(3):292-303.
[7]COSTANIGRO M, DESELNICU O, MCFADDEN D T. Product differentiation via corporate social responsibility:consumer priorities and the mediating role of food labels[J]. Agriculture and Human Values,2016,33(3):597-609.
作者簡介:
张芳,女,湖南衡阳人,广州工商学院工商管理系教师,硕士,研究方向:市场营销、企业管理。