大数据时代的特征及其对心理学的影响
2016-03-01陈炎秋
陈炎秋
(武汉大学 发展与教育心理学研究所,湖北 武汉 430000)
大数据时代的特征及其对心理学的影响
陈炎秋
(武汉大学发展与教育心理学研究所,湖北武汉430000)
随着互联网科技的发展,海量数据的产生,迎来了一个新的时代——大数据时代。大数据时代有万事万物皆可被数据化,包括人们的知、情、意、行;及通过对数据的信息挖掘可以实现强大的预测功能,这些对于心理学产生了极大的冲击以及样本不再局限,描述更加客观,推论更加精确,干预更加有效等特征,这一切都为实现心理学的四大功能即描述、解释、预测、控制提供了便利。与此同时,心理学的两大研究方法:定量研究与质性研究也将在研究的广度和深度上得到极大的拓展,这就要求我们变革思维方式,顺应潮流变化。
大数据时代;心理学;预测
随着科技互联网、移动通讯技术、云计算等的发展,数据的积累,迎来了一个新的时代,大数据时代。大数据,也即海量数据、海量信息资料,其所涉及的数据规模巨大,仅靠人力无法在有限合理的时间内达到获取、储存、管理并进行分析成为可解读的、有价值的信息。大数据的产生带来的不仅仅是技术层面的变革,在此重在探讨大数据时代本身的特征及其对心理学所产生的影响。
一、大数据时代的特征
大数据是指数据规模大,人工无法对其进行有效的管理,从而将其包含的价值提取出来。根据大数据本身的性质和特点,互联网将大数据的特点归为4V,Volume(数据体量大)、Variety(数据类型繁多)、Velocity(处理速度快)、Value(巨大的数据价值)。大数据时代的来临,推动了各学科研究领域的发展,它充分展示了一切皆可数据化、整体大于部分之和、强大的预测功能等优势,这也是当前大数据时代各学科变革发展的趋势。
(一)一切皆可被数据化
大数据时代的第一个特征就是数据有着多种多样的搜集渠道,图书、社交网站、网络、传统博客、通话讯息、手机APP、摄像头、监测器、安全防护系统等都有可能是大数据的来源。
几乎所有的一切原始资料都可以被记录,被捕获,被数据化。正如人们主要是通过自己的感觉器官(如眼睛、耳朵、嘴巴、鼻子、皮肤等等)来获得各种各样的信息,力求与环境之间达到一种信息的平衡;而计算机则通过摄像头、录音器、各种各样的传感器来获得所需要的数据流。大到地球表面的变化、海洋的气温、空气的质量、实时的路况,小到个体的认知、情绪、行为的变化、脑皮层的神经活动水平、细胞、细菌和病毒的探测,这些信息无一不能被计算机感知。
近年来随着智能手机的普及、各种APP的开发,获得关于一个人的全面的真实的信息就更加的快捷和方便。心理学家要想获得更加真实的研究数据,就可以联手软件开发商研发出实时记录人们知情意行的手机APP,可以采用自我报告亦或是声音采集的形式,详细记录欲研究对象的日常活动,其内嵌的多种传感器甚至可以记录用户在使用中的环境数据信息(如当时的气候,交通状况,重力加速度等)。
这样以来,将大大扩展了心理学研究的深度和广度,情绪变成了数据、思维变成了数据、沟通变成了数据、态度变成了数据、主观幸福感变成了数据,除此之外,这样获得的数据相较于传统心理学研究在实验情景下获得的数据,更加具有生态效度,所得到的研究结论也将具有普遍性与概括性。
(二)整体大于部分之和
整体是由部分组成的,离开部分整体就不复存在,同时部分也离不开整体,离开了整体,部分也就失去了其本身存在的价值。但两个之间还是存在较大的差别,整体并不是将离散的部分进行简单的堆砌而形成的,而是将各部分按照一定的逻辑关系、遵从一定的方式组合而成的有机体。大数据的价值可以用一句话来表达,即“整体大于部分的总和”,单个观察那些细碎的信息,汇聚到一起经过计算机算法的深度分析,可以提炼出从表面信息观察不出来价值。大数据中不同数据类型之间的信息具有关联性,这与具有相同信息量的几个不同数据集的结合相比,具有明显的信息优势,能够挖掘出很多不同的信息和隐含的知识。这与格式塔学派提倡的知觉的整体观念不谋而合,信息不是简单的刺激的相加,而是按照一定组织原则又认知主体构建起来的整体。通过现代计算机技术将简单的单个信息汇聚为超大规模的数据库,再通过人工智能演算法的分析,让研究人员可以得到只有在整体层次才能观察到的规律性、相关性与未来发展趋势。同时,这样的预测力不仅仅体现在整体层次。只要透过设计,也可以在个体层次中体现出来,从而为人们更贴合人们真是需求的产品、服务、环境与政策,提高使用者的体验感,增加幸福感。
(三)强大的预测功能
通过对来自不同侧面的数据集的整合,不同数据类型之间的关联性就会凸显,这时通过对数据的分析建立一定的模型,数据就会显示出其强大的预测功能。这种预测功能能够应用于不同的领域创造出更大的社会价值。例如“google流感趋势”(Google Flu Trends)利用关键词搜索预测禽流感的分布,内特·西尔弗(Nate Silver)利用大数据预测2012年美国选举结果等;再如,在我们的日常经验中,淘宝网根据你的购买历史记录、关键字的搜索,购买物品前后发生的事件、情绪状态,从而对你的购买能力,个性偏好等特征进行分析,从而在特定的时间特定的情境推送出对你来说可能成交率更大的一些商品。甚至人们在twitter、facebook、微博、微信、qq、人人等各类社交网站上,对于自己心理行为情绪状态的记录,与其他网友的互动情况,都是有一定的规律可循的。不论是法国数学家西莫恩·德尼·泊松(Siméon Denis Poisson)认为的人类行为的松柏分布,还是后来拉巴西(Albert-László Barabási)又提出的幂定律,都表明了人类行为的可预测性。因此现在大数据的预测功能通过对用户数据的精准把握以及受众信息的个性化分析将创造出前所未有的社会价值。
简单的对比可以发现,西方风俗画与中国古代风俗人物画无论是在内容还是创作意识上都有很大的不同。西方风俗画更多的是通过表现社会风俗而引起公众与鉴赏者的审美情趣,作者往往是从不同的角度来选择所描绘的内容,其作品既包括对社会现象的整体概括,也包括对老百姓的日常生活的细腻写照,这些绘画具有地域民俗色彩和浓郁民族风格,其笔触生动细腻,描绘出的一幕幕生活场景很有民俗气息,使得作品具有一种无与伦比的美学内涵,同时表达出了画家们独特的审美角度和文化素养,也为后人在绘画研究上提供了珍贵的艺术资料。风俗油画的审美价值可从以下四个方面体现出来。
二、大数据时代对心理学带来的影响
心理学是用科学、合理的方法研究人类行为、思想和感情如何受他人影响的一门学科,它的研究是以社会现象为基础,探究个体和群体心里现象的产生及其演变规律,揭示个体和群体表面现象下的动机和目的。大数据时代的到来为心理学研究的发展带来了新的变革,存储着海量信息和宝贵资源的大数据样本,成为心理学研究者探究个体和群体心理活动规律的产生及发展的巨大数据库。这次变革,对于心理学来说是一个很好的机遇与挑战,其改变的不是心理学的研究对象而是心理学研究的思维方式和整体逻辑。
(一)无需假设,避免偏见
心理学的推断统计是建立在概率论基础之上的,其前提假设就是小概率事件在一次实验中不可能发生。心理学研究的逻辑是需要证明备择假设,不是直接去验证,而是建立一个跟备择假设相反的假设-虚无假设,通过对于虚无假设的证明从而决定接受还是拒绝备择假设,这种假设是一种先验的,是一种自上而下的思维策略,就是在未得出研究前的一种推断。但是这种逻辑的第一大缺陷就是如果研究中接受了虚无假设,那么就推翻了备择假设,但是要得到正确的推断还需要不停地验证其他的假设。这种逻辑的第二大缺陷就是研究者一旦有了研究假设,就会带着一种“偏见”去证实假设,这时候他所选取的样本,研究内容的侧重点都会不自觉地选取那些能够证实假设的,而不再是以一种客观中立的态度去做研究。
然而大数据时代,由于数据的易得性,不需要研究者事先做出假设,通过对多方面数据的信息挖掘就可以直接归纳得出结论,用数据、事实说话。这是一种自下而上的数据驱动的加工模式,这就有效地规避了传统心理学研究建立假设逻辑的两大缺陷。
(二)样本不再有限
在传统的心理学研究中,样本规模都十分有限,研究过程中大都采用从总体中抽取样本,把针对样本的分析结果应用到总体上,这就使得研究结果的有效性受到了样本质量的影响。心理学由于受到方法手段及人力、物力、财力等各方面的制约,不得不妥协于抽样和推论统计的逻辑,以有限的样本来推测总体的真实情况。但是实际上所做的大多数心理学研究很难做到随机取样,一般都是用的方便取样,样本也以学生和病人居多,难以代表总体的复杂性。而在大数据时代,真实、准确、及时的大数据样本将为心理学研究方法的变革带来崭新机遇,因此大数据提供的全数据模式的研究方法,将以总体为样本进行深度探讨。随着研究的日益深入,也许我们能够发现,以往所从事的研究可能只是冰山一角,其潜在的内容需要通过大数据逐一揭示。
(三)研究的广度与深度前所未有
心理学研究的两种主要的研究方法就是量化研究与质性研究。量化研究是指在研究中运用问卷调查、测量、实验、统计等量化手段来收集和分析研究资料,从而发现内在规律验证假设的研究方法,对样本量有一定的限制。而质性研究则是在自然情境中,通过研究者与研究对象的互动对其行为和意义获得解释性理解的一种活动,其对样本不作限制,也不涉及推广性的问题。因此可以看出定量研究是一种演绎推理的思维模式,关注的是研究的广度,而质性研究遵循的是一种归纳总结的思维模式,关注的是研究的深度。两种方法截然对立,侧重点各不相同,各有所长。然而大数据时代由于可以通过各种传感器获得对于数据的实时监测,因而能够兼容并收,将两种方法进行有效地整合,使得质性研究与量化研究的广度与深度同时得到极大的扩展。
(四)生态效度大幅提高
以往的心理学研究多采用问卷、量表或者实验室情景下的研究,问卷或量表由于篇幅的限制,只能从欲研究的行为总体中选择出有代表性的行为样本,但是我们知道由于个体的差异性,行为样本很难做到完全具有代表性,能够涵盖或者反映不同人在某一心理特质上的真实表现情况,再加上人们可能会受到社会赞许效应的影响,很难保证测得的信息的真实性,而实验室研究则是经过了严密的控制,企图通过排除无关变量的影响,来探讨自变量和因变量之间的因果关系,但是现实生活中常常是很多因素交织在一起的,况且实验室中所操纵的自变量与现实生活中的自变量的概念是否具有一致性也很值得考究。
人的心理活动、行为状况是一个不断变化的连续体,传统的研究选取的都是某一时间点或者一个时间段的暂时状况,很难将得出的结论推广到整个时空领域,即错误地将情境变量推广为特质变量。而大数据时代就可以摆脱这些限制,能够实时的记录和检测欲研究的行为,这样得到的数据真实性高,从中得到的数据之间的关系也更具有真实性及生态意义。基于上述两点,由大数据时代所获得信息,将对总体的描述更加客观,接近真实,解释更加具体,预测更加准确,干预更加有效,这就为实现心理学的四大功能提供了极大的便利。
(五)更加高效、便捷
传统的问卷和测量调查研究,由于既要考虑样本的代表性,研究变量的选取,还要考虑工作量,比如样本在保证代表性的同时尽可能少,量表在保证信效度的同时尽可能选择题目数量少的,都是考虑到数据录入的困难,而且调查题量太大,对于被试来说,也是一种负担,很难得到有效的数据,因此从有了自己感兴趣的研究课题到施测到最终撰写出一篇研究论文其过程之艰辛,其耗时之长久,非有耐心、潜心学术的人所能及。然而大数据技术所具备的对海量数据的捕获、截取、分析能力,使心理学研究在数据基础的规模上实现了质的飞跃,能够降低研究成本,激发研究者的兴趣,及时推动心理学的研究进展与成果。
三、思考与展望
大数据时代给心理学所带来的不仅仅是技术上的方便与快捷,更重要的是改变了整个心理学研究的思维模式,使心理学研究摆脱实验室的限制,获得更为详实的生态化数据,同时也能够将两大研究方法进行有效地整合,最后大数据的上述特点也将给用户体验用户研究-心理学的一个对口岗位以更大的发展空间。然而由于高新技术的专业性、前端性与复杂性,因此要想抓住大数据的潮流在心理学领域大施拳脚,就应该培养多学科的人才,将信息科学、计算机科学与心理学有机的结合起来,才能够很好地将心理学的理论体系与信息科学技术充分融合,寻找更多的有价值的学术项目、应用项目等。此外,应用大数据进行的心理学研究发现的是一种相关关系而非因果关系,研究的是“是什么”及“将来怎样”,而非“为什么”,因此传统的经过严密控制的实验室研究在某些注重因果探讨的领域仍旧不能抛弃,要将两种思路有效的结合起来。
[1] Mark A.Beyer,&Douglas Laney.(2012,June 21)The Importance of“Big Data”:A Definition[EB/OL].Retrieved February4,2015,from hops://www.gartner.com/doc/2057415 /importance-big-data-definition.
[2] http://zpbcyol.com/html/2014-05/26/nw.D110000zgqnb-20 140526-2-02.htm.
[3] 艾伯特·拉斯洛·巴拉巴西.爆发:大数据时代预见未来的新思维[M].北京:中国人民大学出版社,2012.
[4] 管维.大数据能为心理学带来什么[N].光明日报.2014-12-03.
[5] 马妮.大数据时代旨在政策参与的幸福研究[D].吉林大学,2015.
[6] 喻丰,彭凯平,郑先隽.大数据背景下的心理学:中国心理学的学科体系重构及特征.科学通报[J].2015,(Z1).
[7] 朱廷劭,汪静莹,赵楠,刘晓倩.论大数据时代的心理学研究变革[J].新疆师范大学学报,2015,(4).
[8] 薛婷,陈浩,赖凯声,董颖红,乐国安.心理信息学:网络信息时代下的心理学新发展[J].心理科学进展,2015,(2).
责任编辑:苏一星
文字校对:荣国
G84
A
1008-8539-(2016)04-0110-03