实验研究方法在旅游研究中应用的系统回顾与展望
2021-09-23黄潇婷王志慧
黄潇婷 杨 威 王志慧
(1.山东大学管理学院,山东济南 250100;2.山东大学旅游行为实验室,山东济南 250100)
0 引言
实验,是科学研究的基本方法之一,是根据科学研究的目的,尽可能地排除外界的影响,突出主要因素并利用一些专门的仪器设备,人为地变革、控制或模拟研究对象,使某一些事物(或过程)发生或再现,从而去认识自然现象、自然性质、自然规律的研究方法;实验是测量干预X(自变量)对结果Y(因变量)的因果影响的研究方法(冯契,2001;Cook et al.,2002;Viglia et al.,2020)。人类最初的实验活动是和探索自然的尝试一起产生的,因此它和人类的起源有着同样久远的历史(林定夷,1986)。德国著名历史哲学家斯宾格勒曾经说过“科学,作为从精神上占有世界的一种形式,是建立在实验基础之上的;它在18世纪急剧发展的时期,是测试自己的方法;在19世纪,是测试自己的力量;而在20世纪,则是开始领悟自己的历史作用,是自我意识”(马晓俊,2007)。在自然现象的研究领域中,实验作为一种经验认识方法,是自然科学最直接、最重要的认识基础,自然科学每一项理论的发现或检验无不借助科学实验(嘎日达,2002)。20 世纪初,作为自然科学研究支柱的“实验”开始被大量应用于社会科学研究领域,至今已被公认为社会科学研究技术中不可忽视的一部分,为社会科学理论与假说的测试和预测提供了强大支持,为社会科学理论的创造提供了重要的源泉(徐丹,2013)。实验研究方法被社会科学所接受比自然科学领域晚了很多,而且过程中充满了争论。比如,以实验心理学为标志的科学心理学直到19 世纪才出现,此前的心理学研究者主要由哲学家、医生或生理学家兼任,研究方法则是思辨(郭秀艳,2007)。再如,虽然经济学实验最早可追溯到1738年伯努利所进行的圣彼得堡悖论实验,但现代意义上的经济学实验直到20世纪中叶才兴起。主流经济学一直认为经济学是不可实验的,经济学家“不能从事化学家或生物学家控制下的实验,因为他们不易控制其他重要因素,像天文学家和气象学家一样,他们一般只能限于观察”(萨缪尔森,1992)。然而,历史再次见证了那些已经奉实验为标准方法的学科中曾经出现过的一幕,正如现在再没有人去怀疑伽利略在物理学中引入实验手段来探寻自然规律一般,经济学似乎也正在走向实验化(罗卫东等,2010):2002年将心理学融入经济学研究的心理学家丹尼尔·卡尼曼不仅荣获了诺贝尔经济学奖①其核心贡献是将心理学实验分析方法引入经济领域,研究人类的判断和决策行为,使传统经济学受到了有力的冲击,丰富了经济学理论。,而且还发展出了实验经济学;2017 年诺贝尔经济学奖获得者理查德·塞勒创立了心理账户理论,为个人决策的经济分析和心理分析之间搭建了一座桥梁;2019 年诺贝尔经济学奖授予阿比吉特·巴纳吉、埃丝特·迪弗洛和迈克尔·克雷默时官方的颁奖词为“表彰其在全球扶贫问题研究中使用了实验研究方法(for their experimental approach to alleviating global poverty)”②罗雨翔.2019 年诺贝尔经济学奖得主到底做了什么?[Z/OL].https://www.huxiu.com/article/322362.html.。
实验研究方法,看起来是研究的“方法”问题,实际上却是与研究者对研究的本体论、认识论和方法论的理解都密切相关的一整套研究范式。因此,实验研究方法被引入不同学科时都要经历一个广泛讨论和争论的过程。Viglia 等(2020)在对旅游领域实验研究的文献综述中按照Rossiter(2001;2002)的研究将知识划分为3 种类型:第一类知识是指对构念的描述和命名,第二类知识是对构念之间非因果关系的理解,第三类知识则是对构念之间因果关系的理解(通常表述为:如果我们做X,就会产生结果Y);并以2018年Annals of Tourism Research 刊发论文为例,指出实验研究的成果只有7 篇,在总发文量(88 篇)中的比重低于8%。Dolnicar 等(2014)对旅游营销领域研究的综述表明,87%的研究属于上述第二类知识的生产,而不是因果关系。而市场营销领域研究消费者行为的方法则多是实验法,且自1974年第一本消费者行为期刊Journal of Consumer Research 诞生至今,发表在JCR、JMR、JM 等营销领域重要期刊①JCR(Journal of Consumer Research)、JMR(Journal of Marketing Research)、JM(Journal of Marketing)为营销领域三大期刊,均为UTD24列表收录期刊。上的绝大多数消费者行为研究都采用了实验室实验来考察消费者的感知、认知、态度、偏好、决策和行为(柳武妹等,2020)。发表在JCR 创刊号上的文章就用实验室实验探究了消费者行为自身的非理性(Katona,1974)及儿童消费者对广告的态度(Robertson et al.,1974)等主题。实验研究方法虽然也有自身的适用性和局限性等问题,但是由于采取了外部变量控制、被试随机分配,能够很好地测量干预X(自变量)对结果Y(因变量)的因果影响,在生产第三类知识的研究中展现出了强大的方法论力量,推动了很多学科的知识生产和理论创新。近几年来,实验研究方法在旅游研究中的应用开始引起旅游学界的广泛关注和讨论,表明旅游学科也由第一类知识和第二类知识生产的阶段发展到了第三类知识生产的阶段。本文尝试通过文献检索与回顾梳理实验研究方法在旅游研究中的应用现状,重点探讨旅游实验研究的分期、具体应用的主要实验类型、研究主题与因变量、样本与容量、分组设计等方法应用层面的问题,以期描绘出旅游实验研究发展演进的过程、应用于哪些旅游问题及如何应用的概况。
1 研究方法
1.1 检索方法
围绕“系统回顾实验研究方法在旅游研究中的应用”这一研究目标,我们设定了3 个文献搜索标准:(1)属于旅游研究的范畴;(2)使用了实验研究方法;(3)发表于SSCI 或CSSCI 收录的期刊②限于篇幅,本文未展示最终纳入统计分析的期刊列表和每本期刊对应的实验研究论文数量,如有需要,请与作者联系。。在英文文献的检索中,最终选定Tourism Management、Annals of Tourism Research、Journal of Travel Research 等52 本旅游、休闲、接待业及运动领域的SSCI 收录期刊,将“tourism/tourist/tour/tourist industry/visit/visitor/trip/tripper/hospitality/hospitalities/leisure”等旅游领域研究的相关术语和“experiment/experimental/lab/laboratory”等实验法相关术语两两配对组合,分别依次在Web of Science 数据库的主题、摘要和关键词的栏目框中输入并进行检索。在中文文献的检索中,使用“旅游”“会展”“酒店”等主题词,并与具体实验的技术用语如“实验”“准实验”“现场实验”“自然实验”“眼动”“VR(虚拟现实)”“虚拟仿真”“脑电”等相关表述两两配对组合,在中国知网数据库(www.cnki.net)展开论文检索,同时仅勾选CSSCI来源期刊。然后,通过阅读检索到的中英文献,采用“滚雪球”的方式找到其参考及引证的相关论文。最后,对于使用实验研究方法发文较多的论文作者,按照作者进行再次检索。经过以上3 个步骤,共检索获得英文论文643 篇和中文论文182篇。
1.2 筛选方法
通过对论文原文的阅读,核实是否属于旅游研究、是否采用了实验研究方法,将不符合这两个标准的论文剔除。具体操作方法:首先,由两位研究人员分别独立开展每一篇论文的阅读,比照论文选择标准进行判别。然后,对于两位研究人员判断不一致的论文,由本研究组第三位研究者参与并共同讨论是否剔除。最终,初步检索获得的英文论文643 篇中,458 篇被剔除,用于后续分析的英文论文185 篇;初步检索获得的中文论文182篇中,99篇被剔除,用于后续分析的中文论文83篇。
1.3 统计概况
确定了用于分析的中英文论文之后,首先对旅游实验研究论文发表的期刊分布做了统计。总体上,旅游类头部期刊表现出对实验研究方法在旅游研究中应用的鼓励和重视。如表1所示,英文旅游实验研究论文发表于Tourism Management的最多,发文数量50篇,占到英文旅游实验研究论文总量的25.13%;中文旅游实验研究论文发表于《旅游学刊》的最多,发文数量42 篇,占到中文旅游实验研究论文总量的50.60%。此外,鉴于SSCI收录的旅游类期刊数量比CSSCI 收录的旅游类期刊数量多,因此,英文的旅游实验研究论文数量总体上也多于中文,接近中文旅游实验研究论文数量的两倍。旅游实验研究论文发表数量前20位的学术期刊排序中,只有4 本中文期刊,在一定程度上表现了国际旅游学界对于实验研究方法在旅游研究领域的应用接受度更高的现状。
表1 旅游实验研究论文在学术期刊发文数量统计(前20位)
2 旅游实验研究的阶段分期
本文对采用实验研究方法的旅游研究论文进行了全面检索,并按照发表时间进行整理,尝试从时间维度梳理实验研究方法引入旅游研究领域的过程和发展的基本脉络。如图1所示,将旅游实验研究发表论文的数量按照年度进行统计,并在时间轴上绘制一条折线图,可以发现英文论文和中文论文的发表呈现出较为一致的阶段分期特征。图2呈现中英文代表期刊旅游实验研究论文占当年期刊总发文量的百分比,同样按照时间轴绘制折线图,与图1呈现相同的分期规律。根据折线图体现出来的波动规律和相关文献的主题,本文将旅游实验研究划分为实验研究引入旅游应用阶段(1972—2010 年)、旅游实验研究范式形成阶段(2011—2017 年)和旅游研究实验化转向阶段(2018—)3个阶段。
图1 中、英文期刊发表旅游实验论文的年份统计
图2 2002—2020年中、英文代表期刊中旅游实验研究论文占期刊当年总发文量的比重
2.1 实验研究引入旅游应用阶段(1972—2010年)
第一阶段的特征是英文旅游实验研究论文零星发表,中文旅游实验研究论文尚未发表于旅游类期刊。这个阶段主要是有心理学知识背景的研究者在研究旅游问题时自然而然地将心理学实验研究方法引入到旅游研究中的阶段,概括为“实验研究引入旅游应用阶段(1972—2010 年)”。本文检索到的第一篇使用实验研究方法的旅游研究论文是1972 年Robert 发表于Cornell Hotel and Restaurant Administration Quarterly 的题为“The Army’s New Cafe(军队的新餐馆)”的论文。第一篇中文旅游实验研究论文是邱扶东等(2005)发表在《心理科学》的题为《认知方式与消极情绪对旅游决策影响的实验研究》,该文对之后的研究颇有启发,截至本文撰写时该文献被引次数达到83次。
2.2 旅游实验研究范式形成阶段(2011—2017年)
与第一阶段零星发表的特征不同,第二阶段虽然总体规模大幅增长但是呈现较大的波动特征。这一阶段共计发表中英文旅游实验研究论文85篇,平均每年12篇,与第一阶段相比较相关成果规模出现了较大幅度的增长。85 篇论文中,英文论文47篇,中文论文38篇,中英文的比例逐渐呈现均衡态势。
2011年,英文论文从2010年前的每年1篇左右增长为7篇,2012—2014年又回落到每年2篇,然后2015年和2016年分别增长为12篇和14篇,2017年再次回落至8 篇,呈现波动上涨的趋势;2011 年,中文论文发表量仅为1 篇,之后开始呈现逐年平稳增长的态势。7 年有85 篇论文发表,表明旅游学术界对于能否使用实验研究方法,如何使用实验研究方法研究旅游问题,使用实验研究方法可以研究哪些旅游问题等已经达成了共识。发表数量年度波动,表明旅游实验研究学术共同体规模还不够大、研究产出尚不稳定,同时也表明了国内外旅游学术界对于实验研究作为方法论的价值、规范等还存在认同上的反复和徘徊。综上,本文将2011 年至2017年称为“旅游实验研究范式形成阶段”。2011 年不仅年度实验研究论文数量出现了规模增长,而且英文期刊Tourism Management、International Journal of Hospitality Management、International Journal of Tourism Research、Scandinavian Journal of Hospitality and Tourism 均发表了旅游实验研究论文。《旅游学刊》刊载的第一篇中文旅游实验研究论文(李凯等,2011)也发表于2011年。
2.3 旅游研究实验化转向阶段(2018年—)
比较心理学、经济学等人文学科引入并接受实验研究方法的历史过程,本文将2018年之后的第三阶段称为“旅游研究实验化转向阶段”。2018年至今,旅游实验研究论文年度发表数量呈现迅速攀升的态势。近4年发表的旅游实验研究论文数量为172篇(英文论文129篇,中文论文43篇),占总量的64.42%(2018年1月1日至2021年4月30日)。这表明自2018年以来,实验研究已成为旅游学术研究中的一股新兴力量,研究问题的范围进一步扩大,采用实验研究方法的研究者和团队不断增加。2020 年,Annals of Tourism Research、Asia Pacific Journal of Tourism Research 等SSCI 期刊以专栏形式集中发表了多篇旅游实验研究方法的研究论文,《旅游学刊》也刊发了“旅游心理研究实验方法的认识论问题”笔谈专栏。2019年和2020年,山东大学文化和旅游学系连续主办第一届和第二届旅游实验研究方法研讨会,均引起了旅游学界的广泛关注。尤其是第二届旅游实验研究方法研讨会采取了线上会议形式,会议注册人数2000余人,线上同时参会人数最高时突破6000人,表明关注并开始学习实验研究方法的研究者和团队在不断增加。
3 旅游研究中实验方法的研究设计
范式的概念和理论是美国著名科学哲学家库恩(1962)提出并在《科学革命的结构》一书中系统阐述的。在库恩看来,范式是一种对本体论、认识论和方法论的基本承诺,是科学家集体共同接受的一组假说、理论、准则和方法的总和,这些东西在心理上形成科学家的共同信念。具体来说,研究范式包括研究问题、研究方法和行为准则等方面。在回顾旅游实验研究的发展历程之后,本文认为经历了近50年的发展,旅游实验研究范式已经初步建立,需要进一步厘清旅游实验研究主要研究哪些主题和因果关系,具体使用了怎样的实验研究方法,如何进行实验设计和实施实验研究等问题,以廓清旅游实验范式究竟是什么。
3.1 旅游实验研究的主题与因变量
本文对检索并筛选的282篇旅游实验研究论文的研究主题和因变量的选择进行了统计分析。研究主题的统计结果概括了研究问题和研究方向,因变量的选择则体现了具体的研究假设和实验设计。
3.1.1 研究主题编码和分类
将83篇中文旅游实验研究论文用于研究主题的分析,通过对论文关键词词频进行统计发现,出现频次最高的为“旅游体验”(11 次),第二位是“旅游服务”(10次),接下来依次是“旅游决策”(8 次)、“旅游者”(7 次)、“实验法”(6 次)、“旅游产品”(5次)、“在线旅游”(5次)、“交互效应”(4次)、“目的地营销”(4次);词频为3次的包括“旅游广告”“负面口碑”“眼动”“营销建议”“决策行为”“旅游决策”“熟悉度”“目的地选择”“旅游网站”“品牌个性”。然后,剔除“实验法”“眼动”这类表达研究方法的关键词,根据中文语义和学术概念体系,将关键词按照研究主题进行归类,最终提炼出旅游体验、旅游决策和行为、旅游目的地管理和旅游营销四大类研究主题。将185 篇英文旅游实验研究论文用于研究主题的分析,对英文论文的关键词采用编码的方法进行主题提炼,最终归纳出旅游营销(41.84%)、旅游决策和行为(28.80%)、旅游体验(18.48%)、接待业(7.61%)和旅游目的地管理(2.71%)五大类研究主题。
通过中英文旅游实验研究论文的主题类型对比可以看出,旅游实验研究的研究问题趋于一致,聚焦于以“旅游者”为核心的体验、行为、决策、营销等领域。将中、英文论文的主题按照语义进行合并,结果显示(见表2),各类研究主题占总发文量的比重依次为39.32%(旅游营销)、33.33%(旅游决策和行为)、16.85%(旅游体验)、7.12%(接待业)和3.00%(旅游目的地管理)。
表2 旅游实验研究论文主题编码提炼统计表
3.1.2 因变量编码和分类
由于实验研究方法的运用,旅游实验研究的论文一般都会清晰地表述研究问题中的因变量,并围绕因变量提出一个或多个自变量与因变量关系的假设。因此,本文对267 篇论文中的因变量进行了编码和分类,以期更加细致地描述旅游实验研究关注的科学问题。因变量初级编码直接来源于论文,本文在此基础上进行了两级编码,将旅游实验研究的因变量归纳为态度(26.97%)、评价(19.10%)、行为(18.35%)、意愿(16.48%)、决策(9.73%)和体验(9.36%)6个范畴。因变量的编码和分类结果与研究主题词的分类结果基本一致,再次证明旅游实验研究者在选择科学问题层面基本达成共识。这个共识就是,尝试围绕着旅游活动主体“旅游者”的决策、体验和评价等旅游行为的不同阶段问题开展因果关系的研究,以期构建解释旅游者行为和旅游体验的理论和模型,从而获得对旅游者行为进行解释和预测的理论和知识。
表3 旅游实验研究中因变量的编码分析
3.2 旅游实验研究中采用的实验类型
旅游实验研究在研究问题的选择上初步形成了统一的认识,但在实验研究方法的具体应用层面则存在较大的分歧。目前,旅游学术界关于实验研究方法的讨论和疑虑集中于方法运用的有效性和规范性。通常实验研究的科学效度分为内部效度和外部效度。实验研究的主要目的是探索因果关系,内部效度是指结果是否真的由自变量的操纵引起,而外部效度是指因果关系的结论是否可以在个体和环境中推广(Cook et al.,2002)。对实验研究的规范性进行讨论,需要先明确实验研究的类型,因为不同类型的实验研究遵循的规范和标准不完全一致。Campbell 等(1966)根据实验的控制程度和内外效度将实验分为真实验、准实验和前实验。由于前实验实际上不属于实验研究方法,因此按照控制程度和效度对实验类型进行分类时,本文主要讨论真实验和准实验。另外一种比较常用的分类,是按照实验进行的空间进行划分,分为实验室实验(laboratory experiment)和田野实验(field experiment)。本文在Viglia 等(2020)和Fong 等(2016)所做的两篇综述的基础上整理出了英文旅游实验研究中运用的实验类型(见表4)。需要说明的是,两种分类方法划分依据不同,真实验与准实验都可以在实验室中或在田野中完成;同样,实验室实验或田野实验既可以是真实验,也可以是准实验。
表4 旅游实验研究运用的实验类型
3.2.1 真实验(true experimental)和准实验(quasi-experimental)
Patrick(1980)认为判定一个研究是不是真实验有两个关键标准,一是研究者能否很好地控制(control)、操纵(manipulation)(干预)自变量;二是,研究者能否在将研究参与者(被试)分配到不同控制和实验条件的分组中时实现严格的随机分配(randomization)。Thompson等(2006)则按照实验设计要素、前瞻性和科学效度3个标准对真实验与准实验进行了划分(见表5)。准实验的内部效度低于真实验,但与观察法、访谈法等其他研究方法相比,仍然具有实验研究方法操纵自变量揭示因果关系的方法优势。大量文献中准实验同时也是田野实验,因此实际上准实验叠加田野实验在效度方面通常表现为内部效度较低但外部效度较高。
表5 真实验与准实验
(1)真实验
采用真实验的研究有很多,例如,Huang 等(2016)在《框架理论使旅游者更加环保》中汇报了其在实验室完成的实验,采用组间设计,随机分配样本,并对不同分组给予不同框架水平的框架信息(framing message)干预,结果具有较高的效度。Pera等(2019)在完成定性研究的基础上,开展了两个实验研究,均为真实验同时也是实验室实验。虽然Pera 等(2019)的实验是在实验室进行,但是在选择样本时明确要求“过去两年中,在booking.com 和Airbnb 平台有预订经验并至少发布过一次评论”,以保证样本了解在线评价并具备完成真实在线评价行为的能力,从而为提升实验研究结果的效度提供了保证。
当然,由于旅游研究问题的特殊性,在对自变量的理解和操纵控制问题上真实验也还存在争议。比如,有些旅游情境实验,研究者对于不同组给予不同的“旅游情境”作为刺激材料,往往会被质疑不同旅游情境刺激材料过于“复合”,不像心理学实验那样可以抽象为单纯的颜色、音符等变量。但是,从实验类型的定义上来讲,是否进行了很好的控制和操纵应该跟研究问题、研究变量匹配起来理解,这也是形成旅游学实验研究范式的基础。按照真实验的标准,实验设计中包含了操纵、控制和随机3个要素,是前瞻性研究,科学效度高,就是真实验。
(2)准实验
准实验设计的内涵提出者Campbell等(1966)认为准实验设计是介于真实验设计和非实验设计之间的一种实验设计,准实验设计不需要采用随机化的方法来分配被试,但是能够严格地操纵自变量和控制无关变量,适合更广泛的研究目的。举例来说,KAPUŚCIŃSKI 等(2016)调查恐怖主义事件对全球范围内旅游需求的影响就采用了准实验,研究者利用每个人对真实发生的恐怖主义新闻事件的信息处理,来观察风险感知等级等自变量对因变量旅游需求的影响;再如,Heere 等(2019)研究媒体宣传推广对赛事举办地形象的国际影响,研究者借助真实发生的环法自行车赛中舞台的宣传信息,选择在比赛正式开始的前5 个月,测量来自9 个不同国家的3500 名参与者对于主办城市目的地形象的感知;还有Zavattaro 等(2019)利用自然的准实验设计,研究美国关于国家旅游品牌的营销是如何达到预期的。由于自然“事件”的发生不是研究者可以操控的,因此对于实验组和对照组,无法实现对被试者的随机分配。准实验适用于旅游实验研究的另外一种情况,跟医学中的准实验有着类似的制约条件,那就是受到伦理道德的制约,不能将被试者随机分配到不同的实验条件组中。比如,Dolnicar等(2017)测试在自助早餐时用回收纸餐巾替换棉餐巾是否会减少棉餐巾的使用。这种现场实验不允许将真正的顾客分配至不同的餐巾使用数量标准组,因此研究人员只能采取准实验的研究设计。
3.2.2 实验室实验和田野实验
另外一种划分实验类型的维度就是实验发生的空间,按照空间类型可以划分为实验室实验和现场实验。劳斯(2004)指出科学实验具有建构、介入(操纵)和控制3个基本特征,科学实验就是要建构一个微观的世界,这个世界一方面把实验对象予以隔离,另一方面也是对于整个世界的局部模仿以保证其真实可靠,实验室就是建构现象之微观世界的场所;介入,不是被动的介入,而是以一种特定的方式操纵建构起来的微观世界;控制就是对于被建构起来的微观世界进行全程的控制。实验室实验的优势是人工控制环境带来的实验结果高内部效度,备受质疑的同样是人工环境带来的外部效度降低(马晓俊,2007)。因此,田野实验以“真实”情境和“真实”参与者高外部效度逐渐受到研究者的重视,但是田野实验需要克服难以随机分配参与者到不同分组,以及难以控制混杂变量等问题,实验结果的内部效度低于实验室实验。
(1)实验室实验
与田野实验相比较,实验室实验可以很好地实现对实验环境、参与者、干预变量等全过程的操纵和控制,还可以按照实验设计随机分配样本到不同干预水平的分组,使得实验室实验具有所有实验类型中最高的内部效度。此外,实验室环境还为各种仪器设备(比如眼动仪、脑电、心电、皮肤电等)的运用提供了条件,这些仪器设备为获取高精细度生理指标等直接测量数据提供了硬件基础。不少研究者都采用过实验室实验法,例如:Huang 等(2020)开展了一项以餐厅为背景的实验室实验,研究网络评论中的表情符号如何影响评论内容的价值;Bogicevic等(2019)在实验室实验中操纵3种交互式水平不同的酒店预览方式(图像、360度游览和VR),以测试它们如何影响消费者的体验和购买意愿;Yin等(2020)研究了与目的地相关的流行歌曲对游客访问目的地意图的影响,他们将操纵音乐诱发的心理意象、情感意象、整体意象作为自变量,探究其如何影响旅游者目的地的访问意图。
(2)田野实验
柳武姝等(2020)梳理了多位研究者关于田野实验的定义,提出田野实验的5个标准:①在实验室之外的真实田野环境中开展;②自变量是真实田野环境中的各类刺激,涉及研究组和对照组;③自变量涉及实际行为;④实验者在整个实验过程中对被试的行为表现不做任何干预;⑤实验设计不严密,允许干扰因素和噪音存在。相应地柳武姝等(2020)也提出了4 条不符合田野实验的标准:①在非田野环境中开展;②自变量不是真实的刺激,而是一些问卷测项;③因变量不是行为,而是态度、偏好等主观报告;④实验者在实验过程中对被试的行为表现进行了人为干预。田野实验是在实际旅游情境中进行的一种实验,不仅要求实验情境是旅游情境,而且要求参与实验的“被试者”是与旅游相关的人员而不是为了参加实验而来的“被试者”。有一些旅游研究问题高度依赖于特定的旅游情境,这种情况下采用田野实验就成为更加适用于这类研究问题的实验方法。比如,旅游者绿色消费行为及亲环境行为的研究,Gössling 等(2019)在西班牙7 家酒店中进行田野实验,研究酒店毛巾外形设计如何影响酒店毛巾再利用和减少毛巾消耗;Kallbekken等(2013)研究餐盘尺寸是否能够帮助酒店减少餐盘浪费也是采用的田野实验;再如,Kang 等(2012)研究旅游过程中所包含的声音对国家公园游客体验的影响,则是在国家公园中完成的田野实验。此外,田野实验还经常用于检验实验室实验结论的外部效度。
3.3 旅游实验研究的样本、容量与分组
研究对象的选择必然要与研究问题相适应,旅游实验研究在研究对象的选择和容量方面,也已经达成了某种程度的共识。具体来说,“旅游者”成为旅游实验研究范式最常见的研究对象。值得讨论的地方在于,实验研究中采用的是正在旅游过程中的真正的旅游者,有过旅游经历的“真正”的旅游者,未来可能出游的“真正”的“潜在旅游者”,还是在某种旅游情境设定下拥有了信念感的“旅游者”。与传统的问卷调查法、访谈法等一样,旅游实验研究也逐渐探索出了适当的样本容量作为“准则”。
3.3.1 旅游实验研究的“参与者”
“参与者”(participant)一词展现出的是一种更加主动而非被动的角色。过去在质性研究里,通过访谈、观察等与对象互动的方式获得数据,当中经常使用“参与者”这个词来描述研究的对象,体现出研究者与研究对象是一种相对平等和合作的关系。而如今在各个研究人的实验学科中“参与者”一词得到了广泛的应用,并在逐渐替代“被试”一词。目前旅游实验研究主流的参与者(被试)可以大致划分为社会人和学生两种类型。社会人主要指已经离开(或未进入过)校园环境,拥有职业背景(或处于失业/无业状态)的非学生身份的个体;学生,常见于旅游实验研究论文中的是大学生,具体指无固定收入的全日制大学生或研究生。中英文旅游实验研究论文中使用社会人作为实验参与者的有194篇,约占总量的72.66%;使用大学生作为实验参与者的有73 篇,约占总文献的27.34%。其中,英文旅游实验研究论文中使用社会人作为参与者的有163篇,约占英文文献的88.59%,而中文旅游实验研究论文使用大学生作为参与者的有52篇,约占中文文献的62.65%。
大学生群体之所以受到实验研究者的青睐,除了配合度高、方便原则等因素之外,部分研究者从样本纯净的角度认为大学生群体具有较高的同质性,所处环境和来源背景较为相似,可以降低社会人在人口统计特征差异及复杂的社会背景上对实验结果的影响,能够有效保证研究的内部效度,实验研究结果较为可靠(Shen et al.,2011)。也有一部分研究者认为大学生作为参与者会降低实验研究结果的外部效度,原因是大学生对于很多社会问题的真实情境没有经历过,对于实验中设定的情景和给予的操纵条件停留在想象层面,从而怀疑大学生群体作为参与者给出的反馈是否真实(Kantowitz et al.,2010)。更为重要的是,大学生群体被质疑不能代表旅游者,研究结果不适用于真正的旅游者(Ok et al.,2008)。目前,旅游实验研究参与者的选择虽然存在分歧,但是选择的标准基本已经达成共识。大量的旅游实验研究论文表明,实际操作中实验室实验采用大学生样本的居多,田野实验采用社会人(真实游客)样本的居多(Fong et al.,2016;Viglia et al.,2020)。
3.3.2 旅游实验研究的样本容量
旅游实验研究论文中样本容量的取值范围较大,但是按照实验类型进一步划分,则很容易发现不同实验类型的样本量区间基本形成了共识,大部分旅游实验研究的样本量介于100~300。具体来说,样本容量要求最小的是真实验,往往几十个样本就可以完成,比如最小的样本量是27,出现在Barreto(2020)将在线目的地品牌体验和品牌可信度与旅游者对目的地的行为意图相联系的研究中。而样本量大于500的绝大多数出现在准实验和在线实验中。比如最大的样本量甚至超过了2000,出现在Gibson(2014)采用准实验设计做的南非大型赛事所产生的整体社会影响和旅游形象传播研究中。实际上,样本量的多少取决于具体实验设计和统计方法的要求,限于篇幅本文不展开讨论。G*power是一款专门用于统计功效(包括样本量)计算的免费统计软件,可以帮助研究者估计最小样本量(Erdfelder et al.,1996)。
3.3.3 旅游实验研究的控制与分组
实验之所以被认为是检验理论最好的方法,就是因为它给予了研究者最好的控制检验条件并通过随机分配而剔除可能假变量的机会,为说明理论所能应用的边界条件、确证或否证理论提供了最纯粹的证据,从而为理论的发展与修改指明方向(罗卫东等,2010)。实验研究最大的特点,也是作为研究方法最有力的地方,在于实验的控制与干预。控制,主要指对整体实验环境、实验对象、实验过程的全过程全方位控制。干预,则是要对不同分组的研究对象给予不同的干预或者不同程度的干预。可以说,控制和干预是实验研究中最具技术含量的环节。而样本是否被随机分配,通常被认为是真实验与准实验的重要差别(见表5)。因此,分组看起来是实验研究中的一个操作环节,实际上真实验的三大要素干预、控制与随机都与分组操作直接相关。换言之,分组是整个实验设计的具体体现。本文主要从分组设计的角度梳理旅游实验研究的主要做法。
(1)组间设计
组间设计是指每个参与者(被试)只接受一种自变量水平的实验处理,不同组别的参与者接受不同自变量水平的实验处理的实验设计(Myers et al.,2012)。在这种设计中由于参与者是随机取样并随机安排接受不同的实验处理的,因而又称完全随机化设计;各实验处理组之间没有相关,因而又称独立样本设计。通常认为,组间设计的实验研究结果相较于组内设计更具可信度和说服力。由于组间设计每个参与者只接受一种自变量水平的实验处理,相对组内设计而言需要更多的样本量,这往往受到经费和时间等成本制约(Viglia et al.,2020)。目前不少旅游实验研究采用了组间设计(粟路军等,2020;钟科等,2019;张军等,2018)。
(2)组内设计
组内设计是指每个或每组参与者接受所有自变量水平的实验处理的实验设计,又称“重复测量设计”(Myers et al.,2012)。与组间设计相比,组内设计在统计学意义上效率更高,节省样本量。组内设计的局限则是由于每个参与者都接触到了所有的X(自变量)干预处理,存在学习效应和顺序效应干扰实验结果的风险。参与者根据他们在第一次实验干预中的经验和学习,可能会在面对第二次干预时改变他们的行为。针对组内设计容易出现的学习效应或顺序效应,通常在给予不同干预条件的顺序上进行操纵,采取顺序全随机法、对抗平衡法(ADuA)、拉丁法等方法予以消除。因此,组内设计在旅游实验研究中也被广泛应用。例如,Nguyen(2016)在分析新加坡游客的风险和时间偏好时就采取了组内设计,让参与者接触所有的干预措施。再如,朱竑等(2020)在关于微信软件的互动行为是如何建构旅游者旅游体验的研究中,两项实验都运用了组内设计。规范的组内设计,不仅可以节省样本量,还能将参与者的个体差异从参与者(组)内部变异中分离出来,从而提高实验结果的可信度。
(3)混合设计
组间设计和组内设计的结合称为混合设计,组内设计增加了统计效力,而组间设计有助于排除学习效应和顺序效应(Myers et al.,2012)。混合设计通常出现在多于一个自变量的实验设计中(Fong et al.,2016)。具体操作举例来说,在一个有甲乙两个自变量的实验中,一个被试接受甲变量的每一种情况,但只接受乙变量的一种情况。根据组内设计和组间设计的特征,这时的甲变量是组内设计的自变量,乙变量则是组间设计的自变量(郭秀艳,2007)。Viglia等(2016)向实验参与者展示了一系列过去酒店的价格,每个参与者都看到一系列完整的价格,研究者还操纵了这些价格的信息来源——网络或者参与者之间的人际互动,这就是旅游实验研究中采用混合设计的一个典型例子。Kim 等(2020)在关于旅游者选择旅游产品套餐时旅游目标是如何激活其消费决策的研究中同样采用了混合设计。
4 旅游实验研究未来展望
本文尝试溯源第一篇旅游实验研究论文,并在此基础上系统回顾了迄今为止的旅游实验研究的发展历程,将旅游实验研究阶段划分为实验研究引入旅游应用阶段(1972—2010 年)、旅游实验研究范式形成阶段(2011—2017 年)和旅游研究实验化转向阶段(2018年—)3个阶段。借鉴实验研究方法在相关学科运用的演变历程,未来旅游实验研究可能将呈现从模仿应用到范式建构,从理论证伪到理论建构,从单一实验到混合方法,从模拟仿真到因果预测等特征。
4.1 从模仿应用到范式建构
虽然,本文将1972—2010 年称为实验研究引入旅游应用阶段、将2011—2017 年称为旅游实验研究范式形成阶段,但是,实际上,进入到旅游研究实验化转向阶段的当下,旅游实验研究范式的建构过程并不会停止,而是会不断演变为更加成熟的多元化、体系化的旅游实验研究范式。在这个演变过程中,依然会尝试对不同实验研究方法的应用,尝试模仿不同学科应用实验研究方法的做法。但是,总体上经历了数十年的积累,无论是已经学会并采用实验研究方法的旅游研究者,还是学会读懂实验研究论文的旅游研究者都需要经历对新研究方法引入旅游领域从最初的兴奋到质疑、争论、肯定再到反思的过程。实验研究方法适用的旅游研究问题会进一步增多,在每探索一个新问题是否适用于实验研究方法及如何使用实验研究方法的过程中,旅游实验研究范式的系列假说、理论、准则和方法,以及这些成果在心理上推动旅游学术共同体共同信念的形成也在不断建构中。
4.2 从理论证伪到理论建构
实验研究应用旅游研究中,研究假设的提出通常是基于基础理论对研究问题的理解,研究结果则是对某个理论的证实或证伪。通常发现不一样,更有利于对现有理论提出修正和创新贡献。劳斯(2004)认为科学实验三大特征中,第一就是“建构”,科学实验就是要建构一个微观的世界。这个微观的世界建构既要基于现有的理论,也要求研究中创新性地提出对“世界”的理解从而建构新的理论。发表见刊的旅游实验研究多实现了“理论证伪”功能,未来旅游实验研究有潜力从理论证伪转向理论建构,并回归价值与意义的理论思辨。
4.3 从单一实验到混合方法
需要特别指出的是,研究人员不必在实验室实验和田野实验之间做出选择。有较高内部效度又同时具备较高外部效度的研究结论往往来自于多种实验方法甚至是多种研究方法的组合。在管理学UTD24 目录收录期刊上发表的采用实验研究的论文,已经出现了一篇论文中呈现10 个以上实验的情况,通过多个实验室实验和田野实验构建证据链,反复验证以提高研究的信度和效度。未来研究者可以从一个实验室实验开始系统地探索产生某些行为背后的原因,然后通过田野实验二次验证以确保在实验室中观察到的结果可以有效推广到现实生活中;或者可以先进行一个田野实验来测试干预是否有效,然后再开展一个实验室实验来确保自变量与因变量之间因果关系的内部效度。最近,随着互联网技术的发展和应用出现了“在线实验”的新实验类型。线上实验的优势是实验样本量可以得到超乎想象的扩大,并通过样本量的扩大抵消“控制”和“随机”方面的不足。实验研究方法与其他实证研究方法或质性研究方法的混合研究也将成为未来研究的趋势。
4.4 从模拟仿真到因果预测
Viglia 等(2020)比较了实验研究方法相对于观察法、调查法的优势(见表6)。在旅游实验研究的初级阶段,主要解决如何将复杂的旅游现象和旅游问题抽象成实验设计,设计出来的实验如何模拟仿真现实的旅游世界,从而证明实验研究的结果与其他研究方法的研究结果同样具有可信度。当实验研究的认识论和方法论在哲学层面得到广泛认同之后,旅游实验研究者将不再执着于模拟仿真之时,则能够更加规范并通过高水平的实验设计探索确定的因果关系,从而解决旅游科学中的预测问题。
表6 实验研究方法的比较优势