利用网络进行心理学研究：西方与中国概况

2015-02-26王娱琦余震坤陈杰明蔡华俭

心理科学进展 2015年3期

王娱琦余震坤罗宇陈杰明蔡华俭

(1中国科学院心理研究所人格与社会实验室, 北京 100101)(2揭阳职业技术学院思想政治理论教学部, 广东揭阳 522000)

1 前言

“弹指一挥间, 世界皆互联。”这句经典的互联网广告词形象地揭示了互联网对世界产生的巨大影响。在自诞生以来的短短40余载里, 互联网以不可阻挡的势头飞速发展, 如今已走进千家万户,渗透到了我们工作生活的各个角落, 深刻改变着人们的思维与行为方式。对于心理学来说, 网络不仅是一个需要研究的对象, 还是一种可以广泛利用的工具(Birnbaum, 2000)。早在90年代初, 西方就有一些研究者开始尝试利用网络开展心理学研究。随着互联网的普及, 利用网络进行研究的方式受到越来越多研究者的肯定与欢迎, 尤其是在英美等发达国家, 如今基于网络的心理学研究(简称网基研究)已经非常普遍(Musch & Reips,2000), 相比之下, 国内利用网络进行的心理学研究仍十分有限, 与国外的迅猛发展形成鲜明对比。鉴于大量新成立心理系的简陋条件, 在中国大力宣传和推广网基研究, 不仅是大数据时代心理学研究本身的需要, 更是促进中国心理学发展的重要途径。因此, 本文拟对网基研究进行一个较为全面的介绍, 包括网基研究的历史、类型、主要优缺点, 及一些关键的方法与技术等, 以帮助国内的研究者们更好地了解并利用这一新的方法进行研究。

2 网基研究简史

上世纪60年代, 因特网诞生。从最初的BBS、电子邮件到之后盛行的门户网站、搜索引擎, 再到今天的社交网络, 互联网技术以飞快的速度革新与进步, 为网基研究的兴起与发展提供了条件。1983年, Kiesler和Sproull (1986)利用电子邮件最早在网上发放调查问卷; 1994年, Foster(1994)通过电子邮件首次尝试在网络上与病人进行交流与访谈; 同年, 第一个面向全世界开放的调查问卷在互联网上发布(Pitkow & Kehoe, 1996);1995年, 借助于网络, 一项关于听觉感知的心理学实验在加拿大和德国的两所大学中同时进行(Musch & Reips, 2000); 同年9月, 第一个具有交互功能的在线心理学实验室成立(Reips, Eid, &Diener, 2006); 1996年, 在芝加哥召开的计算机心理学大会首次报告了若干个利用网络进行的心理学研究(http://psych.hanover.edu/SCiP/sciprg96.html);1997年, 第一个利用网络进行的研究在学术杂志上发表(Krantz, Ballard, & Scher, 1997)。短短十几年时间, 网基研究从无到有, 并开始开花结果。

目前, 心理学界普遍把1995年世界上第一个网络虚拟实验室的开放作为网基研究的开端。但由于条件限制, 网基研究在最初几年的发展并不是很快。据不完全统计, 截至2000年, 全球利用网络进行心理学研究的网站只有50多个; 但随着计算机与互联网技术的普及与发展, 网络研究方便、高效等优点日趋显现, 越来越多的研究者开始选择利用网络进行心理学研究, 许多心理学网络实验室也相继成立, 网基研究的数目呈爆炸式增长, 所涉及的领域越来越广泛,利用网络采集的数据发表的文章也一直处于加速增长的态势(Granello & Wheaton, 2004; Wright, 2005; Hooley,Wellens, & Marriott, 2012; Skitka & Sargis, 2006)。

3 网基研究的主要类型

从广义上来讲, 网基心理研究可以是任何在网络上开展的有关人类心理与行为的研究, 是传统心理学研究在网络媒介上的延伸。常见的网基研究类型包括非反应性网基研究、网基调查、网基心理测验和网基实验等(Reips, 2012)。

3.1 非反应性网基研究

非反应性网基研究(nonreactive web-based methods)是指将网络上已有的数据库或文本库作为分析对象, 通过对这些非反应性数据进行分析继而探究人们心理和行为规律的研究(Reips,2012)。它类似于传统研究中的观察法, 是对已经发生了的行为或结果数据的分析, 不干涉行为发生的过程, 不需要访问者对任何设定的刺激进行反应, 具有良好的生态性, 因而叫非反应性网基研究。

获取人们上网行为的信息是非反应性网基研究的关键。一种常见的方法是分析网站的日志文件(Log file), 因为它记录了用户访问网站时留下的各种信息, 如页面停留的时间、鼠标运动的轨迹等等。通过对日志文件的分析, 可以很快得到用户在进行网页浏览、搜索资料以及网络聊天等网络行为时相关的行为信息, 如反应时间、反应方式等, 供进一步的分析与处理(Reips et al.,2006)。另一种方法就是分析网络文本本身。通过数据挖掘(data mining)和数据抓取(data crawling),我们可以对各种网络文本和行为数据进行提取与分析, 从而发现蕴含在其中的心理与行为规律。比如, 中国科学院心理研究所的研究人员通过对新浪微博数据的挖掘和分析发现, 可以根据微博用户的网络行为特征来推测他们的个性(Gao, Hao,Li, Gao, & Zhu, 2013); 清华大学行为与大数据中心利用微博大数据分析得出了中国人的幸福感分布状况(李冲, 2014), 还得到了中央电视台的专门报道。

近年来, 随着手机、平板等网络移动终端的普及, 可以实时抓取和获得的数据空前增长。理论上讲, 几乎所有的联网行为都可以被记录, 一个人每天产生和接收的信息比15世纪一个人一生所产生和接收的信息量还要多。云计算、大数据更是风起云涌, 其触角已然延伸到了通信、医疗、交通、商业、物流、广告等现代社会的各个领域。近年来一项基于移动终端的全球性大项目是2012年启动的人类面孔大数据研究(The Human Face of Big Data Project)。该项目推出了一个免费的移动应用, 用以收集各种非反应性信息(如行走的路程、精神状态等)和反应性信息(涉及梦想、兴趣、家庭、信任、睡眠等)。利用每天返回的海量信息, 研究者获得了关于人类心理与行为的许多规律, 并绘制了一张前所未有的人类面孔(http://humanfaceofbigdata.com)。

在大数据时代背景下, 非反应性网基研究具有广阔的应用前景, 但也有局限性。首先, 这种方法获取的信息类型有限, 而且大多是网络语言等文本信息, 信息噪音多; 其次, 该方法无法获得目标个体和人群的即时信息, 如被观察者的生理特性指标等; 此外, 在保护个人隐私与信息安全等方面, 非反应性网基研究也需要进行进一步的规范与完善。

3.2 网基调查

网基调查(web-based survey)主要是指基于网络的问卷调查, 是最早在网络上应用的数据采集方式(Hooley et al., 2012)。它与传统的纸笔问卷调查相比, 具有操作简单方便, 数据收集快捷高效等特点, 在操作性、适用范围及费用上都具有明显的优势(Couper & Miller, 2008)。

基于上述优点, 网基调查自出现以来, 便得到了迅速的发展与广泛的应用。早在上世纪90年代末, 国外就曾有研究者在雅虎网站上以“调查”作为关键字进行搜索, 结果找到多达59种不同类型的超过2000项在线调查, 涉及的主题包括交通、购物、广告等各个方面, 形式也五花八门, 足以显示网络调查的流行与繁杂(Kaye & Johnson,1999)。但无论网基调查的形式多复杂, 内容多丰富, 调查的质量仍是大家最关心的, 其中网基问卷相对较低的反应率一直是研究者们普遍担忧的问题。研究发现, 许多因素都会影响到网基问卷反应率的高低(Couper & Miller, 2008; Frick, Bächtiger,& Reips, 1999)。Fan和Yan (2010)曾对问卷的编制、发放、填写和回收等整个调查过程进行了考察, 结果发现, 调查内容、问卷形式、取样方式、采用的软件等是影响问卷反应率的主要因素。对于如何提高调查的反应率与质量, 研究者进行了大量研究, 并提出了许多有效的操作性措施, 比如, 缩短问卷的长度(Galesic & Bosnjak, 2009)、对访问者给予一定物质激励(Joinson, Woodley, &Reips, 2007)、对问卷呈现进行个性化设计(Sánchez-Fernández, Muñoz-Leiva, & Montoro-Ríos, 2012)等等。近年来, 随着手机、平板电脑等网络移动终端的普及, 越来越多的研究者开始关注利用移动设备开展调查研究的相关问题(de Bruijne &Wijnant, 2013; Mavletova, 2013; Peytchev & Hill,2010)。也许, 日益普及的移动设备所带来的便捷性, 也能在一定程度上提高网基调查的反应率。

随着在线调查问卷的流行和技术的进步, 进行一项在线调查研究变得越来越简单。许多第三方网络调查网站提供相应的服务, 用户只要选择问卷的类型与模板, 就可以轻松开始编辑自己的问卷, 操作简单, 使用方便, 编辑好问卷后只需将链接发布在不同的门户网站、社交平台或者通过电子邮件传播即可, 如国外的Survey Monkey、PsychData、Qualtrics以及国内的问卷星、调研宝等都是比较常用的第三方在线调查工具。这些调查网站一般还提供样本收集服务, 可根据用户的需求邀请符合要求的样本库成员参与调查, 能迅速地收集到质量较高的数据。但目前这些商业网络调查网站提供的免费服务一般都是十分有限的,如只能收集有限的样本数量, 问卷的题项不能超过一定数目等, 高级的服务需要进一步收费才能实现。因而, 这类调查工具主要适合于企业的市场调查、组织满意度调查以及个人、学生等发起的小型、简单的问卷调查等。当对问卷质量要求比较高时, 调查问卷制作软件可能是更好的选择。例如Limesurvey是国外一款功能强大且开源的问卷管理系统, 它集合了问卷的设计、修改、发布、回收和统计等多项功能, 并支持包括中文在内的50多种语言, 是许多调查网站或学校等研究机构常用的问卷管理系统。这类软件在操作性上比第三方调查工具稍稍复杂, 但可以满足研究者更加个性化、多样化的要求, 更适合频繁发布网络问卷的研究者。

3.3 网基心理测验

传统的心理测验往往是采用纸笔的形式进行的。当把标准的心理测验放到网上来实施时, 就产生了网基心理测验。网基测验在形式上与网基调查相同, 但后者往往是为了回答某一个具体问题而编制, 没有经过标准化, 相比之下, 前者一般需经过严格的标准化程序, 对信效度都有一定的要求。

当将心理测验放在网上实施时, 大家最关心的问题是通过网络测验获得的数据是否和通过纸笔测验获得的数据同样可靠。对此, 国外已经进行了大量网基测验和传统纸笔测验的对比研究(Buchanan et al., 2005; Buchanan, Johnson, &Goldberg, 2005; Gosling, Vazire, Srivastava, & John,2004; Pettit, 2002)。研究结果总体是乐观的：网基测验和纸笔测验具有类似的信效度, 两种方法得到的结果通常也基本一致。这些发现为网基心理测验的可靠性提供了证据, 也极大地消除了人们的顾虑, 促进了网基心理测验的健康发展。国内也有研究者对网络测验和传统的纸笔测验的对等性进行了研究。有研究发现, 按照测量学的标准,网基测验和纸笔测验具有对等性, 这为在中国文化下实施网基心理测验的可靠性提供了依据(蔡华俭, 林永佳, 伍秋萍, 严乐, 黄玄凤, 2008)。近年来, 我国也逐渐有一些利用网络心理测验收集数据的研究在国际杂志或会议上发表(Cai, Kwan,& Sedikides, 2012; Gao, Li, & Zhu, 2014), 这些研究成果的发表进一步增强了中国研究者利用网络进行研究的信心。除了基本的可靠性之外, 随着研究的深入, 研究者逐渐开始关注网基研究的可靠性是否受到其他因素的影响, 如不同的投放网站、研究目的等(Buchanan & Reips, 2001)。

网基心理测验通常还加入了对测验结果的计分与解释部分。一般的问卷调查工具也都具有这项功能。这样做简化了繁琐的人工计分程序, 能利用计算机程序迅速计算测验分数并及时提供反馈。但需要注意的是, 这类反馈通常是比较机械、简单的, 如何对结果作出科学的解释还需要一定的专业知识, 故测验者在给予测验反馈时需特别注意、审慎对待(Barak, & Buchanan, 2004)。

3.4 网基实验

基于网络的心理学实验就是将计算机实验嫁接到网络上, 即在网上进行心理学实验。与传统的实验室研究不同的是, 研究者不能对实验条件进行严格的控制, 或对被试的操作做出相应的指导(Honing & Reips, 2008), 而是完全依靠被试自主完成实验。

与其他网基研究类型一样, 网基实验的有效性也一直是研究者关注的重要主题。大量研究表明, 确实有不少因素会影响网基实验的结果。比如,实验任务的性质(Krantz & Dalal, 2000)、电脑的运行环境、网速等(Joinson & Reips, 2007)。尽管如此, 也有研究表明, 这些问题很多时候可以通过增加样本容量和多样性等来弥补(Birnbaum, 2000; Germine et al., 2012; McGraw, Tew, & Williams, 2000)。最新的一项旨在探讨研究可重复性的研究表明, 实验环境对结果的影响非常有限, 更重要的是研究问题本身的效应大小(Klein et al., 2014)。所以, 很多时候, 只要样本量足够大、多样性足够高、研究对象效应足够大, 就容易得到可靠的实验结果。

在操作方面, 网基实验比传统的实验室研究更加简便, 早期研究者一般直接用简单的HTML、Java或者Javascript语言编写在线实验程序。还有研究者开发了一些专为心理学在线实验量身定做的软件, 如Wextor、WebExp、Factorwiz等, 这类软件往往内含一些常用的实验类型, 可以简化程序编写的步骤(Reips & Neuhaus, 2002); 而例如inquisit、psytools、medialab以及psyscope等软件则能胜任更加复杂的实验程序, 功能也更为强大。参与由这些工具编写而成的实验, 被试无需在本地安装程序, 仅安装相应插件便可加载实验程序, 并将试验程序下载到本地, 离线参与实验,实验完成后才将数据传回服务器, 从而保证实验不会因为网速、浏览器等外部因素而受到干扰(Birnbaum, 2004a); 也有一些软件专门适用于某一类型的网络实验, 如DirectRT特别适用于需要测量反应时的实验, 可以精确到毫秒级, 又如Cyberball是一个根据投球游戏范式编成的实验程序, 可以通过操纵玩家的个人信息、投球速度、频率等变量来研究人际接受与疏离等相关课题(William & Jarvis, 2006)。此外, 将实验程序编写成小游戏, 让被试像做游戏一样完成实验, 也是一种很好的形式。如研究者可以利用Experimental tribe将在线实验以游戏的形式呈现出来, 使被试身临其境地进行实验, 从而提高实验的生态效度。

4 网基研究的优点与局限

4.1 网基研究的优点

和传统非网络的研究相比, 网基研究具有许多优点。

4.1.1 更大的样本数目

由于受时间、空间、经济等诸多客观条件的限制, 传统的实验室研究通常只能对有限数量的被试进行研究, 即使是所谓的“大样本”, 样本量也非常有限。相比之下, 利用网络进行研究不会受到时间和空间的限制; 如果特意花钱进行招募的话, 通常可以在很短时间内收集到较大样本的数据, 因而可以极大地提高实验效率(Hewson,2003)。例如, Birnbaum (2000)曾同时利用纸质问卷与网络问卷的方式对一个决策问题进行研究。在6周时间里, 纸质问卷只有124个人完成, 而同期收集的网络问卷则多达1961份, 优势显而易见。

4.1.2 更多样化的样本

样本同质性过高是传统实验室研究比较突出的问题。通过传统的方式收集多样化样本往往需要耗费较高的研究成本。所以目前, 大多数的心理学研究采用的被试都是在校大学生, 这就大大限制了对研究结果的解释与推广。而在网络日益普及的今天, 通过网络收集多样化的样本已经不再是一件困难的事。比如, 英国有研究者利用BBC网站进行了一项人格调查, 采集到了来自53个国家的超过20万被试的数据, 该研究发现男女性在个性方面的差异更多与遗传有关(Lippa,2010)。又如, Fischer和Boer (2011)利用网络收集了来自63个国家超过40万被试的数据, 发现个人主义(individualism)与财富(wealth)对心理健康具有积极意义。如此大的、多样化的样本在过去几乎是不可想象的, 可是在利用网络进行数据采集的今天, 这种现象就已经很常见了。

能够收集到多样化的样本还意味着网基研究能调查到占总人口比例较少的某些特殊群体。例如, 最近, Carhart-Harris和Nutt (2013)通过一项网络调查采访了93名有多年吸食毒品经历的吸毒者, 并获得了这部分特殊群体被试对毒品相关知识的了解情况和毒品使用情况等信息; 而这样的数据是传统的调查方式很难获得的。

4.1.3 更高的外部效度

在传统的实验室实验中, 研究者一般都可以对实验的环境、操作进行严格的控制, 因此被试完成实验的条件就比较纯净和单一。这样做有很多好处, 比如排除无关因素的干扰; 但是, 这样获得的研究结果很难推广到实际环境中, 生态效度较低。而对于网基研究, 所有的实验过程全由被试自主完成, 实验者无法对实验的时间、地点、硬件设备与软件环境做出选择, 也无法对实验过程进行控制与干涉, 使得不同被试参与实验时的外部环境与状态可能都不尽相同; 然而当获得的样本足够多时, 这一缺陷反而能使获得的结果更加稳健, 在各种环境条件下均普遍适用, 更具有可推广性。当某些环境因素可能会导致系统性误差时, 实验者可以在数据分析过程中将这些信息作为变量, 单独探讨环境因素和实验处理对结果的独特影响(Reips, 2000)。

4.1.4 更高的被试动机

网基研究与实验室研究招募被试的方式不同。大部分实验室研究的被试都是在校大学生,而这些大学生则主要是为了获得学分或报酬来参加实验, 很少对研究本身感兴趣; 相比之下, 在网基研究中, 被试大多是完全自愿的, 来参与实验大多是出于对研究本身的兴趣, 对待调查和问卷态度也就更加认真。研究发现, 在完全自愿参与的实验中, 被试更少受到社会期望的影响(Richman, Kiesler, Weisband, & Drasgow, 1999),问卷填写更加完整, 数据的质量也更高(Pettit,2002)。从这个意义上讲, 网基研究获得数据可能比实验室研究具有更高的研究价值。

除上述优点外, 网基研究还具有可消除实验者效应、高效经济、公开开放等优点; 特别是高效经济这一点, 对许多研究者就特别有吸引力,因为心理学研究者拥有的研究经费通常都很有限。

4.2 网基研究的局限及应对

尽管网基研究有许多优点, 但是也有其局限性。不过, 随着20年来研究者们的不断试错与摸索, 也总结出了一些特殊的方法与措施, 以尽可能地减小或避免这些问题。

4.2.1 实验控制不足

与传统的实验室研究精细严格的实验条件相比, 网基研究对实验过程则是零控制的, 实验环境与条件也千差万别。一般来说, 外部环境与条件的变化有利于研究结果的推广, 但对于一些对刺激呈现要求较高的实验来说(比如许多知觉、注意类的研究), 外部条件的细小改变都可能对结果产生较大的影响(Schmidt, 2001)。还有一些研究需要对结果变量进行精确的测量(比如精确到毫秒的反应时), 若这种实验在网上收集数据, 则可能因为硬件设备、网络环境等因素导致不够精确或准确的测量(Eichstaedt, 2001), 最终影响实验结果。还有, 由于网基实验是在无人监督的情况下完成的, 这时被试的反应可能更加随意, 可能会降低数据质量(Kraut et al., 2004), 甚至有时出于各种原因, 还会出现被试重复参加实验的情况,给实验结果的真实性造成威胁。针对这一问题,最简单直接的办法就是核查被试的电脑物理地址、IP地址或账号等, 如果有相同的, 则不允许被试提交。有些网络实验网站要求访问者只有登陆后才可参与实验, 保证一人一号, 每个实验只能参加一次, 从而避免重复提交的问题。此外, 网基研究的实验者还无法即时了解被试参与实验时的心理、生理状态, 如无法得知哪些数据是在被试心理、生理严重不适的情况下产生的等, 当然更无法对这样的数据进行有效剔除, 从而在整体上降低了数据的可靠性。

4.2.2 样本偏差

与传统实验室招募被试的方式不同, 网基研究招募到的被试都是自主自愿参与研究的, 这可能会带来一定的样本偏差。

首先, 网络用户未必能代表整个人群。中国互联网络信息中心 2013年7月第32次中国互联网发展状况统计调查结果显示, 我国目前上网人口中70%以上生活在城镇, 且以学生、自由职业者、企业职员等为主, 与我国总人口的属性结构并不相符(中国互联网络信息中心, 2013)。由于网络普及的限制, 并不是所有的人群都有同等的机会参与到特定的研究中去, 从而造成取样的误差(Couper, 2000)。建立被试库能在一定程度上缓解样本偏差的问题, 即通过线上或线下招募的方式提前建立被试库, 然后每次从被试库挑选被试。这样不仅可以确保稳定的被试来源, 并能了解到被试各方面的信息, 在招募被试时可以根据研究的要求挑选合适的被试, 最终减少废数据量。

其次, 网基研究参与的自主性也可能造成样本偏差。一般来说, 参加网络实验或调查的被试都是出于对研究本身的兴趣, 他们更可能在性格、兴趣、经历或教育背景等方面具有较高的相似度, 从而造成取样的系统性偏差, 不利于结果的推广, 甚至可能会因此得到错误的结论(Couper,2000; Wright, 2005)。例如, 有研究者将是否自愿参与实验作为一个变量, 根据被试是否愿意参加后续的调查将他们分为两组, 发现两组被试在某些特性上确实存在显著的区别(Hudson, Seah, Hite,& Haab, 2004)。针对这一问题, 可以采用多站点入口技术(multiple-site entry technique), 即同时在多个不同的站点推广研究。这样不仅可以分析来自不同站点的被试是否具有不同的特征, 也可以在一定程度上增加被试的多样性, 降低自我选择的负面效果(Reips, 2000, 2002)。

此外, 被试中途退出实验也可能对实验结果产生系统性误差, 因为退出的人可能具有某些共同的特点, 比如, 不喜欢或不擅长参加某项实验等(Reips, 2002)。针对这一问题, 可以在研究开始前向来访者说明研究的严肃性和获得有效数据的重要性, 并询问其参与实验的动机。研究发现, 参与动机对是否完整完成调查或实验有较好的预测能力(Reips, 2009)。另外, 应用一些心理学原理设计实验流程, 也可以在一定程度上减少中途退出的概率。热身法(warm-up technique)、高门槛法(high-hurdle technique)就是典型的例子, 这些方法在正式实验开始之前增加了一些与实验无关的热身任务或者故意设置一些降低参与者动机的障碍, 如不友好的页面、减缓页面加载速度等, 使那些参与动机不强的被试在正式实验开始之前就主动离开, 从而不至于在正式研究中中途退出, 影响数据质量(Reips, 2000, 2002)。此外, 还可以通过向被试提供物质报酬来降低被试中途退出实验的可能(Reips, 2012)。

4.2.3 伦理问题

确保实验符合科学伦理规范是心理学研究的基本要求。但是, 在网基研究中, 很多规范却难以得到保障。首先, 虽然理论上所有参加研究的被试都有知情权, 但是研究表明, 在参与网基研究时, 很少有人会认真阅读实验说明和知情同意书(Birnbaum, 2004b), 很多人是在对实验内容与风险缺乏足够认识的情况下参与实验的, 这样, 被试的权益实际上在很多时候得不到保障。其次,一般情况下, 实验室实验完毕, 被试有权对实验的目的、原理等很多内容进行咨询和了解, 把误解的可能降至最低; 但是网基研究能提供给被试的反馈通常非常有限, 这样不仅无法保证被试已对研究有足够的了解, 甚至还有可能产生误解(Buchanan, Johnson, & Goldberg, 2005)。最后, 在隐私保护方面, 由于网基研究会受到许多研究者无法控制的因素影响, 有时候实验数据以及被试的个人信息难以做到完全保密, 从而导致被试利益受损(Birnbaum, 2004b)。除上述不足外, 网络研究还可能存在的问题有无法实施复杂实验、恶意欺骗等, 这些因素也可能会对结果产生影响(Reips, 2002)。

总结起来, 网基研究的优点是明显的, 比如：样本量大、多样性高、外部效度高、高效经济等; 但是, 也确实存在一些不足, 比如难以对实验进行严格控制、样本可能有偏, 以及某些伦理问题等。不过, 十全十美的方法是没有的, 具体采用哪种方法, 还要结合具体研究的目的和特点,进行合理的选择。

5 中国的网基心理学研究：必要性、概况与展望

自陈大齐教授于1917年在北京大学建立第一个心理学实验室至今, 中国心理学历经了近百年的沧桑。几经波折, 中国心理学在改革开放以后才得以重回正常发展轨道。经过30多年的发展,尤其是近10年来的快速成长, 中国心理学已经从80年代初的4个心理系发展到如今的200多个,各类心理学机构或研究所更是多达300多个, 具有硕士学位授予权的心理系也已经有100多个。与全国各地快速发展的心理系相比, 受时间、空间、经费、人力等许多因素的限制, 心理实验室的建设明显落后：即使是中国一流的心理系, 大多也都存在实验室空间不够、设备不足等问题。作为一门实验性学科, 这些都极大地制约了实验心理学等课程的教学、学生的培养乃至心理学研究的进步。在这种情况下, 利用网络的优势, 建立和发展网络实验室无疑是实现中国心理学跨越式发展的有效途径, 更是在全球网络心理实验室遍地开花的情况下, 填补国内空白、缩小中国在心理学研究与应用方面与发达国家差距的必要举措。

在中国, 利用网络进行心理学研究只是2000年后的事情。2002年, 赵向阳等人最早在国内介绍了国外利用网络进行心理学研究的情况, 并开展了我国第一个基于网络的心理学研究(赵向阳,朱滢, 2002)。2004年, 国外大型网络数据收集网站——哈佛大学内隐社会认知研究网面向中国大陆的中文网站正式开通(https://implicit.harvard.edu/implicit//china/), 并正式开始在网上大规模采集中国人的数据。2008年, 蔡华俭等人利用网络采集数据对中国文化下网络测验的可靠性进行了研究, 结果表明, 在中国文化下, 基于网络进行的心理测验和传统的纸笔测验得到的结果具有可比性, 两种测验在心理测量特性上基本具有对等性,为在中国利用网络进行心理测验提供了方法上的依据(蔡华俭等, 2008)。在网络测验可靠性得到初步验证的情况下, Cai等人开始利用网络采集数据对中国人的自恋进行了研究。通过对近3万份网络数据的分析发现, 近30年来的经济、社会、文化变迁使得中国人具有越来越自恋的倾向(Cai et al., 2012)。

在实施工具方面, 国内有与国外Survey Monkey等类似的问卷星、调研宝、调查派等第三方调查工具。例如, 问卷星能够方便快捷地实施各种问卷调查、心理测验, 但其缺点是不能够采集反应时数据、不能进行实验研究、不能对实验流程等进行控制, 特别是不能解决避免重复提交以及中途退出实验等问题, 对受访者的质量也不能很好的保证。又如, 调查派可整合多平台进行问卷的投放与收集, 支持智能手机、平板等多平台填写问卷、支持二维码扫描获取问卷地址。总体来说, 除个别大型网站之外, 国内的调查网站情况还比较混乱, 提供的功能也大体相似, 且被试信息安全、样本质量等都不能得到保障。在实验管理方面, 一些被试管理系统服务对网络研究的展开有很大的帮助。如北京师范大学引进了美国的SONA公司的被试管理系统, 专门用于发布心理学实验信息及管理被试信息, 研究者可以利用该系统对库中被试进行筛选, 向符合实验要求的被试发出实验邀请, 并可直接发布外部网络研究链接等。值得一提的是, 2013年, 中国科学院心理研究所建立了中国第一个云端心理实验室(www.cpsylab.org)。该网站是基于inquisit软件开发而成的, 目前提供外显测验、内隐测验、能力测验、心理实验、科学研究五个与心理学数据采集直接相关的版块, 基本能满足绝大多数心理学行为实验的要求。该网站还对网站采集的数据结果进行发布, 以帮助大家了解中国人的心理状况。此外, 网站还设立了专门的学习资源版块, 为广大心理学的学习者和爱好者提供大量免费的经典学习资料。云端实验室具有成本低、覆盖面广、效率高、功能齐全、能够采集大样本数据等优势,在一定程度上反映了未来心理学研究的某种趋势,有望能在中国心理学的快速发展中发挥越来越大的作用。

除了利用网络工具进行测验、实验实施、数据采集进行研究外, 国内也开始利用网络大数据进行研究。近年来, 国内先后成立了一批关于心理和行为的大数据研究中心, 如清华大学的行为与数据中心、北京师范大学的行为科学大数据研究与开发中心、中国科学院的计算网络心理实验室等, 并取得了初步成果。例如, 中国科学院心理研究所计算网络实验室与新浪微博数据中心合作,根据微博数据编制了一部微博人格词汇分析词典,可用于对微博或其他社交网站的内容进行分析(Gao et al., 2013); 清华大学的行为与大数据中心编制了一套可以用以测量幸福感程度的中文心理词库, 并基于新浪微博全年数据绘制了2013年全年的幸福感及其各个维度的走势图, 发现了我国人民幸福指数与经济状况的关系、幸福感的节日效应等(李冲, 2014)。

6 小结

从20世纪90年代以来, 互联网得到迅速的普及和发展, 逐渐成为心理学研究的新工具, 并得到越来越多心理学研究者的关注。鉴于当前国内与国外在利用网络进行研究方面的差距, 我们对国内外利用网络开展心理学研究的历史、方法、优缺点等进行了比较全面的介绍。总的来说,网基研究涵盖了从简单的问卷调查到复杂的行为实验等常见的心理、行为研究, 具有能够采集多样化的大样本、经济高效等诸多优点, 但同时也有研究控制不足、可能的样本偏差以及对伦理考量不足等问题, 实施中也有诸如中途退出、重复提交等诸多需要应对的问题。不过, 近20年来,国内外针对网基研究进行了大量方法性研究, 不仅证明正确实施的网基研究是可靠的, 还为网基研究中存在的许多问题提供了对策, 确保了网基研究能够健康、顺利的发展。迄今, 已经有大量基于网络进行的研究成果发表, 回答了许多一般实验室情境下小样本实验所不能回答的问题, 充分表明了网基研究的优势和价值。

和国外的大量网络实验室以及发表的大量研究相比, 网基研究还远没有得到国内的心理学研究者的重视, 并发挥其应有的作用。国内快速发展的心理学现状、薄弱的软硬件条件以及数量庞大的网民数目, 都意味着中国网基心理学研究的巨大发展空间。近年来快速兴起、并获得快速发展的移动互联网, 更预示着大数据时代网基研究在中国的美好前景。不过, 作为新兴快速发展的领域, 利用网络进行心理学研究还需要很多技术支持, 如基于移动互联网的研究平台的开发等,使其在更多的研究领域中发挥更大的作用。

著名心理学家勒温曾经说过“没有什么比一个好的理论更实用” (Lewin, 1951)。不过, 对科学而言, 科技和方法的进步同样的重要。最近,Greenwald (2012)对近20年物理、化学、医学三个领域的诺贝尔奖获得者的获奖原因进行了分析,发现诺贝尔奖更多地是颁给了新方法的创造者而不是新理论的提出者, 并提出“没有什么比好的方法更理论”的新理念, 因为新的方法常常能使研究者采集到以前采集不到的数据、观察到以前观察不到的现象, 进而导致领域的突破性进展,并为新的理论的诞生提供基础。总之, 对于现代科学而言, 没有好的方法, 许多好的理论就不会诞生。网基研究为采集以前实验室研究不可能采集到的大样本、多样化的数据, 为回答很多宏观问题提供了可能, 比如像国家层面的内隐性别学科刻板印象是否可以预测国家层面的科学成绩的性别差异这样的问题(Nosek et al., 2009)。我们期待, “没有什么比好的方法更理论”将会在互联网时代的网基研究中再次得到印证。

蔡华俭, 林永佳, 伍秋萍, 严乐, 黄玄凤. (2008). 网络测验和纸笔测验的测量不变性研究——以生活满意度量表为例.心理学报, 40(2), 228–239.

李冲. (2014年, 3月21日). “国际幸福日”网友晒温情: 大数据解读社交网络上的“幸福感”周六最高兴.扬子晚报.2014-05-21取自http://epaper.yzwb.net/html_t/2014-03/21/node_201.htm

赵向阳, 朱滢. (2002). 互联网——心理学研究的新工具.心理科学进展, 10(3), 309–314.

中国互联网络信息中心. (2013年, 7月).中国互联网络发展状况统计报告. 2013-08-30取自http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201307/t2013071740664.htm

Barak, A., & Buchanan, T. (2004). Internet-based psychological testing and assessment.Online counseling: A handbook for mental health professionals, 217-239.

Birnbaum, M. H. (2000).Psychological experiments on the internet. San Diego: Academic Press.

Birnbaum, M. H. (2004a). Human research and data collection via the Internet.Annual Review Psychology,55, 803–832.

Birnbaum, M. H. (2004b). Methodological and ethical issues in conducting social psychology research via the internet.In C. Sansone, C. C. Morf, & A. T. Panter (Eds.),The sage Handbook of methods in social psychology(pp. 359–382).Thousand Oaks, CA: Sage.

Buchanan, T., Ali, T., Heffernan, T. M., Ling, J., Parrott, A.C., Rodgers, J., & Scholey, A. B. (2005). Nonequivalence of on-line and paper-and-pencil psychological tests: The case of the prospective memory questionnaire.Behavior Research Methods, 37(1), 148–154.

Buchanan, T., Johnson, J. A., & Goldberg, L. R. (2005).Implementing a five-factor personality inventory for use on the Internet.European Journal of Psychological Assessment,21(2), 115–127.

Buchanan, T., & Reips, U. (2001).Technological biases in online research: Personality and demographic correlates of Macintosh and Javascript use.Poster presented at Psychology and the Internet: A European Perspective.Farnborough, UK.

Cai, H., Kwan, V. S., & Sedikides, C. (2012). A sociocultural approach to narcissism: The case of modern China.European Journal of Personality, 26(5), 529–535.

Carhart-Harris, R. L., & Nutt, D. J. (2013). Experienced drug users assess the relative harms and benefits of drugs: A web-based survey.Journal of Psychoactive Drugs, 45(4),322–328.

Couper, M. P. (2000). Review: web surveys: A review of issues and approaches.The Public Opinion Quarterly,64(4), 464–494.

Couper, M. P., & Miller, P. V. (2008). Web survey methods:Introduction.Public Opinion Quarterly, 72(5), 831–835.

de Bruijne, M., & Wijnant, A. (2013). Comparing survey results obtained via mobile devices and computers: An experiment with a mobile web survey on a heterogeneous group of mobile devices versus a computer-assisted Web survey.Social Science Computer Review, 31(4), 482–504.

Eichstaedt, J. (2001). An inaccurate-timing filter for reaction time measurement by JAVA applets implementing Internetbased experiments.Behavior Research Methods, Instruments,& Computers, 33(2), 179–186.

Fan, W., & Yan, Z. (2010). Factors affecting response rates of the web survey: A systematic review.Computers in Human Behavior, 26(2), 132–139.

Fischer, R., & Boer, D. (2011). What is more important for national well-being: Money or autonomy? A meta-analysis of well-being, burnout, and anxiety across 63 societies.Journal of Personality and Social Psychology,101(1),164–184.

Foster, G. (1994). Fishing with the net fur research data.British Journal of Educational Technology, 25(2), 91–97.

Frick, A., Bächtiger, M.-T., & Reips, U.-D. (1999). Financial incentives, personal information and drop-out rate in online studies. In U.-D. Reips & M. Bošnjak (Eds.),Dimensions of Internet science(pp. 209–219).Lengerich:Pabst Science Publishers.

Galesic, M., & Bosnjak, M. (2009). Effects of questionnaire length on participation and indicators of response quality in a web survey.Public Opinion Quarterly, 73(2), 349–360.

Gao, R., Hao, B., Li, H., Gao, Y., & Zhu, T. (2013).Developing simplified Chinese psychological linguistic analysis dictionary for microblog. In K. Imamura, S. Usui,T. Shirao, T. Kasamatsu, L. Schwabe, & N. Zhong (Eds.),Brain and Health Informatics(pp. 359–368). Berlin,Germany: Springer.

Gao, Y., Li, H., & Zhu, T. (2014, March).Predicting Subjective Well-Being by Smartphone Usage Behaviors.Paper presented in 7th International Conference on Health Informatics, Angers, Loire Valley, France.

Germine, L., Nakayama, K., Duchaine, B. C., Chabris, C. F.,Chatterjee, G., & Wilmer, J. B. (2012). Is the Web as good as the lab? Comparable performance from Web and lab in cognitive/perceptual experiments.Psychonomic Bulletin &Review, 19(5), 847–857.

Gosling, S. D., Vazire, S., Srivastava, S., & John, O. P.(2004). Should we trust web-based studies? A comparative analysis of six preconceptions about internet questionnaires.American Psychologist,59(2), 93–104.

Granello, D. H., & Wheaton, J. E. (2004). Online data collection:Strategies for research.Journal of Counseling & Development,82(4), 387–393.

Greenwald, A. G. (2012). There is nothing so theoretical as a good method.Perspectives on Psychological Science,7,99–108.

Hewson, C. (2003). Conducting research on the Internet.Psychologist Leicester, 16(6), 290–293.

Honing, H., & Reips, U.-D. (2008). Web-based versus lab-based studies: A response to Kendall (2008).Empirical Musicology Review,3(2), 73–77.

Hooley, T., Wellens, J., & Marriott, J. (2012).What is Online Research?: Using the Internet for social science research.London: Bloomsbury Publishing.

Hudson, D., Seah, L.-H., Hite, D., & Haab, T. (2004).Telephone presurveys, self-selection, and non-response bias to mail and Internet surveys in economic research.Applied Economics Letters, 11(4), 237–240.

Joinson, A. N., & Reips, U.-D. (2007). Personalized salutation,power of sender and response rates to Web-based surveys.Computers in Human Behavior, 23(3), 1372–1383.

Joinson, A. N., Woodley, A., & Reips, U.-D. (2007).Personalization, authentication and self-disclosure in self-administered Internet surveys.Computers in Human Behavior, 23(1), 275–285.

Kaye, B. K., & Johnson, T. J. (1999). Research methodology:Taming the Cyber frontier techniques for improving online surveys.Social Science Computer Review, 17(3), 323–337.

Kiesler, S., & Sproull, L. S. (1986). Response effects in the electronic survey.Public Opinion Quarterly, 50(3), 402–413.

Klein, R. A., Ratliff, K. A., Vianello, M., Adams Jr, R. B.,Bahník, Š., Bernstein, M. J.,... Woodzicka, J. A. (2014).Investigating Variation in Replicability.Social Psychology,45(3), 142–152.

Krantz, J. H., Ballard, J., & Scher, J. (1997). Comparing the results of laboratory and World-Wide Web samples on the determinants of female attractiveness.Behavior Research Methods, Instruments, & Computers, 29(2), 264–269.

Krantz, J. H., & Dalal, R. (2000). Validity of Web-based psychological research. In M. H. Birnbaum (Eds.),Psychological experiments on the Internet(pp. 35–60).San Diego: Academic Press.

Kraut, R., Olson, J., Banaji, M., Bruckman, A., Cohen, J., &Couper, M. (2004). Psychological research online: Report of board of scientific affairs' advisory group on the conduct of research on the Internet.American Psychologist,59(2), 105–117.

Lewin, K. (1951).Field theory in social science: Selected theoretical papers. New York: Harper & Row.

Lippa, R. A. (2010). Sex differences in personality traits and gender-related occupational preferences across 53 nations:Testing evolutionary and social-environmental theories.Archives of Sexual Behavior, 39(3), 619–636.

Mavletova, A. (2013). Data quality in PC and mobile web surveys.Social Science Computer Review, 31(6), 725–743.

McGraw, K. O., Tew, M. D., & Williams, J. E. (2000). The integrity of Web-delivered experiments: Can you trust the data?Psychological Science, 11(6), 502–506.

Musch, J., & Reips, U.-D. (2000). A brief history of Web experimenting. In M. H. Birnbaum (Eds.),Psychological experiments on the Internet(pp. 61–87). San Diego:Academic Press.

Nosek, B. A., Smyth, F. L., Sriram, N., Lindner, N. M.,Devos, T., Ayala, A.,... Greenwald, A. G. (2009). National differences in gender–science stereotypes predict national sex differences in science and math achievement.Proceedings of the NationalAcademy of Sciences of the United States of America,106(26), 10593–10597.

Pettit, F. A. (2002). A comparison of World-Wide Web and paper-and-pencil personality questionnaires.Behavior Research Methods, Instruments, & Computers, 34(1),50–54.

Peytchev, A., & Hill, C. A. (2010). Experiments in mobile web survey design: Similarities to other modes and unique considerations.Social Science Computer Review, 28(3),319–335.

Pitkow, J. E., & Kehoe, C. M. (1996). Emerging trends in the WWW user population.Communications of the ACM, 39(6),106–108.

Reips, U.-D. (2000). The Web experiment method: Advantages,disadvantages, and solutions. In M. H. Birnbaum (Eds.),Psychological experiments on the Internet(pp. 89–117).San Diego: Academic Press.

Reips, U.-D. (2002). Standards for Internet-based experimenting.Experimental Psychology, 49(4), 243–256.

Reips, U.-D. (2009).Internet experiments: Methods, guidelines,metadata.Paper presented at the IS&T/SPIE Electronic Imaging, San Jose, CA.

Reips, U.-D. (2012). Using the Internet to collect data. In H.Cooper, P. Camic, R. Gonzalez, D. Long, & A. Panter(Eds.),APAhandbook of research methods in psychology:Vol. 2: Research designs: quantitative, qualitative,neuropsychological, and biological. Washington, DC:American Psychological Association.

Reips, U.-D., Eid, M., & Diener, E. (2006). Web-based methods. In M. Eid & E. Diener (Eds.),Handbook of multimethod measurement in psychology(pp. 73–85).Portland: American Psychological Assn.

Reips, U.-D., & Neuhaus, C. (2002). WEXTOR: A Web-based tool for generating and visualizing experimental designs and procedures.Behavior Research Methods, Instruments,and Computers,34, 234–240.

Richman, W. L., Kiesler, S., Weisband, S., & Drasgow, F.(1999). A meta-analytic study of social desirability distortion in computer-administered questionnaires, traditional questionnaires, and interviews.Journal of Applied Psychology,84, 754–775.

Sánchez-Fernández, J., Muñoz-Leiva, F., & Montoro-Ríos, F.J. (2012). Improving retention rate and response quality in Web-based surveys.Computers in Human Behavior, 28(2),507–514.

Schmidt, W. C. (2001). Presentation accuracy of Web animation methods.Behavior Research Methods, Instruments, &Computers, 33(2), 187–200.

Skitka, L. J., & Sargis, E. G. (2006). The Internet as psychological laboratory.Annual Review Psychology,57,529–555.

Williams, K. D., & Jarvis, B. (2006). Cyberball: A program for use in research on interpersonal ostracism and acceptance.Behavior Research Methods,38(1), 174–180.

Wright, K. B. (2005). Researching Internet-based populations: Advantages and disadvantages of online survey research, online questionnaire authoring software packages, and web survey services.Journal of Computer-Mediated Communication, 10(3), doi: 10.1111/j.1083-6101.2005.tb00259.x