APP下载

心理学研究的动向:基于对美国《心理科学》创刊以来文献的计量分析*

2019-09-03

应用心理学 2019年3期
关键词:词组语料库心理学

(1.浙江大学外国语言文化与国际交流学院,杭州 310058;2.贵州大学国际教育学院,贵阳 550025;3.浙江警察学院,杭州 310035;4.浙江大学心理与行为科学系,杭州 310028)

1 引 言

心理学是研究人类行为及其心理机制的科学。100多年来,心理学的研究主题随着人类经济和社会的发展以及科学技术的进步和心理学理论研究取向的转变而变化,从而形成心理科学目前研究领域无所不包,研究技术色彩纷呈,应用范围无所不及的复杂而丰富的局面,因此探讨心理科学研究的变迁对于深入理解心理学发展历史,准确把握心理学研究动态和精确制定心理学未来发展战略具有重要的理论和实践意义。

考察心理学发展脉络的方式通常有两类:其一是研究综述,即基于对心理学实证研究文献的系统分析和梳理,总结其发展脉络和动态。其二是文献计量学分析,即对特定历史时期的心理学实证研究文献,从某个或某几个维度(如范畴、方法、地域、作者属性、引用率、影响因子等等)进行定量分析(Jennings,Ehrhardt,& Poling,2008;Allik,2013;Leeuwen,2013;Piocuda,Smyers,Knyshev,& Harris,2015)。传统的文献计量学方法的一个主要缺点是不利于把握心理科学内涵发展的历史演变过程。最近,在语言学领域,有研究者(Chen & Liu,2014;Lin & Liu,2017)将语料库分析(corpus-based analysis)模块引入文献计量研究,即通过提取和分析各个时期语言学文献“题目”和“摘要”语料中的词语和词组的发生频率,探索语言学研究主题和内容的历史演变和研究热点,从而将文献计量学分析深入到研究内容层面。此外,在对科学研究文献进行综述或结构映射的过程中,采用词共现网络方法(co-occurrence network analysis)能够以“整体的视角”(holistic perspective)考察相关研究领域的演变情况(Li,An,Wang,Huang,& Gao,2016),弥补其他分析方法(如单纯的词频率分析方法)难以有效捕捉“有关知识构成和知识结构的重要信息”的缺陷(Radhakrishnan,Erbis,Isaacs,& Kamarthi ,2017)。在本文中,笔者以美国《心理科学》(PsychologicalScience)自1990年(创刊)至2018年期间发表的心理学研究文献为对象,采用基于语料库分析模块和词共现网络方法的文献计量学技术,考察了29年来国际心理学前沿研究内容和方法的历史变迁和当前的热点主题。

该期刊是美国心理科学协会(APS)1990年成立之初即创立的会刊。APS成立的初衷是为了纠正当时美国心理学会(APA)过度关注职业或临床心理学而轻视心理学基础及应用研究和学术人才的发展偏向(Cautin,2009),致力于更好地代表和推进科学心理学的健康发展。该刊旨在及时“向心理科学研究者展现该学科各领域的研究工作概貌”、“促进跨学科交流”以及“将心理科学呈现给更广大的、学术圈内外的读者”(Estes,1994),因而其所发表的研究成果具有鲜明的前沿性、综合性、学术性和创新性,代表着当代国际心理学界刊出成果最新且顶级的学术水准,广受国际心理学界推崇。创刊29年来,其年度影响因子迅速提升,其中2017年的5年期影响因子高达7.37,位居国际心理学综合研究领域期刊的顶端。因此,以该刊的学术论文为对象,考察国际心理学研究内容的历史演变,可反映心理学科当前的学术动态。

2 研究方法

2.1 语料库构建

分析材料源于美国《心理科学》1990~2018年29年间(其中1990~2003年间为双月刊,2004年起改为月刊)共计29卷262期期刊的研究文献(2018年的文献收集至截止本文完稿时最新的第十期)。为了构建可供计量分析的语料库,首先通过收录该刊文献信息的Scopus数据库生成一个初步的语料库,该语料库包含了该刊在1990~2018年间所有文章的元数据,包括年份、卷期、文章类型、文章标题以及摘要等;然后逐一参照该刊出版商SAGE Publications网站提供的文献档案,查找并更正语料库中的错误信息,同时排除不属本研究分析范围的文章类型(如,编辑文章、综述论文、评论性文章和读者来信等),仅保留来自该刊三个学术性栏目的论文信息,即研究论文(Research Article)、研究报告(Research Report)和简短报告(Short Report);最终形成包括3814篇文献(研究论文2442篇、研究报告1190篇、简短报告182篇)的元数据语料库。这些论文在29年间的数量分布见图1,其中2006~2015年间每年的论文数量均在150篇以上。

图1 1990~2018年间《心理科学》研究性论文数量分布

2.2 语料库核心信息的提取

采用AntConc语料库分析软件(Anthony,2018),从前述语料库中提取词组频率,按频率高低排序生成实义词组列表。具体做法是,首先从3814篇论文的题目库中提取出现频率最高的词组,然后从这些论文的摘要库(其中2018年之前的177篇简短报告未提供摘要,故摘要库实有摘要3637篇)中提取出现频率最高的词组。此外,为考察国际心理学研究主题的历史演化过程,将摘要库的所有摘要按照十年期划分到三个子库,即第一阶段(1990~1999)、第二阶段(2000~2009)和第三阶段(2010~2018),三个子库分别包含478、1379以及1780篇论文摘要,生成每个论文摘要子库的高频词组列表。

2.3 共现网络可视化

采用Gephi网络可视化工具(Bastian,Heymann,& Jacomy,2009)分阶段对论文摘要子库中的高频词组进行共现网络可视化。其原理是,将同一篇论文摘要中出现的词组定义为共现节点(co-occurring nodes),相互之间由一条边线(edge)连结,从而形成一个小网络。不同论文摘要的小网络则通过其共有的词组连接起来,形成更大的网络。与节点相关联的边线的条数为该节点的节点度(degree)。在本研究的可视化方案下,节点的视觉大小表现其中介中心性(betweenness centrality)大小,该指数描述节点在整个网络中的互联性(interconnectedness),可反映节点在网络中的重要程度。边线的可视化方案设置为加权,即一条边线的粗细程度与其两个节点的共现次数成正比。Gephi的模块化(modularity)功能将网络分解为不同的区块(communities)。一个区块包含一组紧密关联的节点,而属于不同区块的节点之间联系较为稀疏(Blondel,Guillaume,Lambiotte,& Lefebvre,2008)。因此,在可视化共现网络中,区块的构成可反映心理学研究的主要话题模块。

为生成三个时期的论文摘要高频词组共现网络,首先采用AntConc工具提取每个阶段的摘要子库中出现频率最高的400个实义词组;然后在该阶段所有摘要中检索这些词组,并生成一个词组工作表,该表格的每一行记录从一篇摘要中检出的词组,同一篇摘要至少检索出两个词组才可形成共现关系。检索结果显示,在第一、第二、第三阶段的摘要子库中至少检出两个词组的摘要分别为300、797及1017篇。将各阶段的共现词组工作表按照Gephi工具的数据格式要求进行处理后,分别导入Gephi进行共现网络可视化。

3 结果与分析

3.1 国际心理学29年来的主要研究范畴

3.1.1 论文题目库中的高频词组提取

从3814篇论文的题目库中提取出频率最高的实义词组,结果显示,出现频次在10次以上的实义词组共有30个(见图2)。可以发现,图表中的大多数词组均与认知范畴密切相关,其中在复杂认知活动中具有关键作用的working memory(工作记忆)以59的出现频次居首位,是这个时期国际心理学家最为关注的研究主题,而诸如visual search(视觉搜索)、decision making(决策)、false memories(错误记忆)、cognitive control(认知控制)、visual attention(视觉注意)、cognitive abilities(认知能力)、selective attention(选择性注意)、face recognition(面部识别)、inhibition of return(返回抑制)、attentional blink(注意瞬脱)和retrieval induced forgetting(提取诱发遗忘)等范畴因属于不同侧面和层次上对认知过程的微观考察而成为国际心理学界的关注点。此外,诸如反映机体变量的individual differences(个体差异)、sex/gender differences(性别差异)和physical health(生理健康),反映社会环境变量的socioeconomic status(社会经济地位)以及反映发展变量的-month-old infants(新生儿)、young children(幼儿)、older adults(老年人)、theory of mind(心理理论)等也具有较高频次,说明国际心理学界强调从终身发展和差异化的视角考察人类行为及其心理机制。

图2 1990~2018年间研究性论文题目中的高频词组频次分布

3.1.2 论文摘要库中的高频词组提取

采用与前面相同的方法,从3637篇论文的摘要库中提取出频率最高的实义词组,结果显示出现频次在45次以上的词组共有30个(见图3)。对比图3和图2发现,从两个语料库中提取的高频词组基本一致,即从摘要库中提取的大多数词组也同样存在于题目库的提取列表中。两者间的差异主要集中于反映认知过程脑机制的词组(如prefrontal cortex(前额皮质)、brain regions(脑区))以及反映研究技术和背景的词组(如event related potentials(事件相关电位)、reaction time(反应时间)、United States(美国)),这些词组在论文题目中可能因字数限制或信息过于具体而通常被忽略。

3.2 国际心理学的主要研究范畴在29年间的演变

为考察心理科学在不同时期的主要研究范畴及热点主题,分别生成三个时期论文摘要子库中的高频词组列表,结果见表1。

图3 1990~2018年间研究性论文摘要中的高频词组频次分布

注:括号内的数字为频次,其中频次排序有显著变化的词组以粗体标示。

表1显示,大部分的高频词组,特别是有关基本认知过程范畴的词组,在三个时期都较为稳定,最典型的如working memory(工作记忆)、visual search(视觉搜索)等。然而,各时期之间也存在明显差异:第一,decision making(决策)在第一阶段频次排序较低,但在第二、第三阶段跃居列表前列。第二,positive/negative affect(积极/消极情感)从第二阶段开始才出现在列表上,而emotional regulation(情绪调控)、life satisfaction(生活满足感)、personality traits(性格特质)和physical health(生理健康)只出现在第三阶段的列表上。第三,functional MRI(磁共振功能成像)和prefrontal cortex(前额皮质)从第二阶段开始呈现较高频次,而event related potentials(事件相关电位)从第一阶段到第二阶段呈现了频次激增,但第三阶并未出现在列表中。第四,socioeconomic status(社会经济地位)和income inequality(收入不均)是第三阶段新出现在列表上的词组。

3.3 国际心理学的主要研究话题结构在29年间的演变

为探索心理学研究在不同时期的主要话题结构及其演变特征,利用Gephi工具分别对三个时期的论文摘要中频次最高的400个实义词组的共现网络进行可视化。考虑图示可读性,通过节点度过滤使得每个共现网络只保留70至80个主要的节点。经过Gephi的自动区块分割处理,三个时期的高频词组共现网络均留下四个主要区块,同一网络中的不同区块以不同颜色标注,不同网络中范畴相似的区块标以同样的颜色,以便对比分析,最终结果如图4-6所示。

图4 1990—1999年的论文摘要高频词组共现网络

图4显示,1990—1999年间的心理学研究主要包含四个话题区块。最大的(红色)区块围绕working memory(工作记忆)、cognitive processes(认知过程)、selective attention(选择性注意)、visual search(视觉搜索)等主要节点展开,体现了基本认知加工过程在该时期心理学研究中的核心地位;该区块也包含decision making(决策)和functional MRI(磁共振功能成像)等节点,但它们还相对较小,在网络中的互联性较低,说明这些范畴的相关研究当时处于起步阶段。以recognition memory(再认记忆)为关键节点的黄色区块则表明,该时期心理科学十分关注这个特定的认知过程,以至于与其相关的研究在网络中分化出了一个话题模块。而以individual differences(个体差异)为中心节点的蓝色区块以及以-month-old infants(新生儿)为中心节点的紫色区块,则结合genetic and environmental factors(遗传及环境因素)、age differences(年龄差异)、twin pairs(双胞胎)、male and female(男女)等节点反映了该时期心理学研究对于一些基础性的机体变量、社会环境变量和发展变量的关注,但这种关注还比较局限。

图5 2000—2009年的论文摘要高频词组共现网络

与上一个十年期相比,2000—2009年的论文摘要高频词组共现网络(图5)呈现了更为复杂的话题结构信息。该网络同样包含一个反映基本认知过程核心地位的(红色)区块,其主要节点包括working memory(工作记忆)、spatial attention(空间注意)、visual search(视觉搜索)、recognition memory(再认记忆)等,此外还融合了上一时期蓝色区块的individual differences(个体差异)这个大节点,说明基础认知研究开始关注个体差异。紫色区块较上一时期也有所发展,-month-old infants(新生儿)、young children(幼儿)、theory of mind(心理理论)等成为其主要节点,说明该方面的研究重点逐渐从儿童语言转向心理理论。相比上一阶段,这个阶段的新增信息主要体现在蓝色区块和绿色区块。蓝色区块的一些重要节点,包括black and white(黑人和白人)、racial prejudice(种族歧视)、black/white faces(黑人/白人面孔)、social cognition(社会认知)、college students(大学生)等,表明心理科学关注的社会环境变量相比上一时期有了较大拓展,而该区块的其他主要节点,如negative/positive affect(消极/积极情感)、well-being(幸福感)、emotional experiences(情绪体验)、emotional regulation(情绪调控)等,则表明连接机体变量和社会环境变量的情感和情绪相关范畴也成为心理学研究的热点。绿色区块是一个最大的,且新增的区块,其主要节点包括磁共振功能成像(fMRI)、事件相关电位(ERPs)、额/前额皮质(frontal/prefrontal cortex)等,说明认知神经科学和脑科学的前沿技术和研究方法已经在心理学领域得到了广泛应用,众多的心理学研究聚焦于人类行为的脑机制。

图6 2010—2018年的论文摘要高频词组共现网络

与之前的两个阶段相比,第三阶段(2010—2018)的共现网络(图6)呈现出更加丰富的话题结构信息。该网络中,以working memory(工作记忆)为中心节点,executive function(执行功能)、visual attention(视觉注意)等为主要附属节点的基础认知(红色)区块有扩张的趋势,说明基本认知过程的研究得到了进一步的加强,尤其是工作记忆已成为基础认知领域的焦点话题。而最大的(蓝色)区块与前两个阶段差异显著,充分融合了individual differences(个体差异)、well-being(幸福感)、negative/positive affect(消极/积极情感)、negative emotions(负面情绪)、physical health(生理健康)、socioeconomic status(社会经济地位)、personality traits(性格特质)等节点,表明心理学研究变得更加以人为本(people-centered),即随着时间推移,心理科学愈发关注个体与社会现实各方面的交互。淡蓝色区块作为一个新增区块,直观地捕捉到了近年来心理学研究中的一个重要进展,即经过十多年的发展,decision making(决策)相关研究已由“量变”引起“质变”,分化成了心理学研究中的一个主要话题模块。值得注意的是,以认知神经科学技术与脑机制研究相关范畴为主要节点的绿色区块呈现缩小趋势,说明该类研究在心理学领域的增长有所放缓。

4 小结

本研究使用基于语料库和共现网络的文本计量分析方法对美国《心理科学》期刊1990—2018年间的研究文献进行了考察。结果显示:第一、基本认知过程始终是心理学研究的核心范畴,工作记忆已经成为基础认知领域的焦点话题;第二、心理学研究变量的范围和层次不断深化拓展,近年来社会经济地位、收入差距等社会环境变量成为心理学研究的重点考察内容,与此同时,连接机体变量和社会环境变量的情感和情绪相关范畴也成为心理学研究热点,说明心理科学愈发关注个体与社会现实各方面的交互;第三、在新世纪的头十年,认知神经科学和脑科学的前沿研究技术和方法在心理学领域得到广泛应用,众多的心理学研究聚焦于人类行为的脑机制,然而近期此类研究的增长有所放缓;第四、发展心理学研究方面,研究重点已经从上世纪末的儿童语言发展研究转向心理理论;第五、心理学研究近年来还呈现了一个重要进展,即经过十多年的发展,决策相关研究已经演变为心理科学的一个主要话题模块。总而言之,1990年以来心理学研究的发展特征可概括为:基本认知过程的核心地位保持稳固,同时研究朝着愈加以人为本、跨学科及社会化的方向演进。

据笔者所知,本研究是同时利用语料库提取和共现网络可视化方法在研究内容层面考察大宗心理学文献的首次尝试。上述文本计量方法在挖掘科学研究文献数据规律方面具有易操作性和有效性,较为适合专业研究人员快速粗略地了解某学科领域的研究概貌和最新动向,可作为专题文献综述的先导性工作,同时对有志于以计量方法研究科学文献的读者也具有一定的参考价值。

猜你喜欢

词组语料库心理学
基于语料库的清末民初日源外来词汉化研究
《语料库翻译文体学》评介
爆笑心理学
爆笑心理学
爆笑心理学
爆笑心理学
语篇元功能的语料库支撑范式介入
副词和副词词组