Nature期刊论文使用量的跨语种平台比较分析*
2020-07-03丛挺明蔚陈必坤
丛挺 明蔚 陈必坤
(1. 上海理工大学出版印刷与艺术设计学院,上海 200093;2. 南京理工大学经济管理学院,南京 210094)
近年来,学术成果通过社交媒体进行交流传播成为学术交流的新趋势,由此催生Altmetrics研究的兴起。Altmetrics将社交媒体、社会标签、社交网络等用户行为(包括浏览、下载、评论、标引、注释等),均视作一种可供计算的用户使用数据(user usage data)[1],就其本质而言,可看作社交媒体环境下学术信息行为研究。相关研究涉及Altmetrics概念内涵[2-3]、指标体系[4-6]、实证检验[7-8]、实践应用[9]等方面;数据来源平台和工具包括推特、Mendeley、Researchgate、F1000等;分析对象以期刊文献为主,此外还有数据集、视频等。由于语言和使用平台的差异,当前该领域研究在国际和本土情境之间存在明显的鸿沟,国外研究更多聚焦于国际科研成果在国际社交媒体平台(如推特、脸书等)的交流活动,国内研究则集中于国内学术期刊在本土社交媒体(如微博、微信)的传播状况,对国际科研成果在本土社交媒体传播与用户行为的研究较为缺乏[10]。中国作为全球最大的非英语母语国家,拥有持续增长的社交媒体用户和科研用户群体,国际科研成果通过本地社交媒体传播,不仅拓展了学术信息的国际化传播渠道,也为探索Altmetrics背景下跨语种用户行为模式提供重要契机。
目前,国内大量的学术期刊利用微博、微信等社交平台为读者提供即时文章推送、期刊出版、实时追踪稿件动态等服务。截至2017年12月,分别有53.1%的CSSCI期刊和56.5%的CSCD期刊开通微信公众号[11]。微信平台已成为国内外学术期刊分享与传播的重要平台。随着中国科研市场地位不断提升与社交平台服务的成熟,越来越多的国际学术期刊出版商开始进驻中国本土社交媒体,在微信、微博等平台开设官方账号。以微信平台为例,目前已有Nature、Science、Elsevier、Springer等国际知名STM出版商开设了官方微信公众号。这些国际学术出版商的公众号运营模式主要是将最新的期刊文献和学术动态编译成对应的中文版本,发布在公众号上推送给读者,同时在推送文章末端附加“阅读全文”链接,用户可直接点击跳转至英文版本官方网站。
基于上述实践和研究成果,本研究旨在通过对Nature期刊文献在中国本土社交媒体平台(微信)和国际主流学术平台(WoS)用户行为的比较分析,揭示国际顶级学术期刊论文跨语种平台使用行为规律。本研究问题聚焦于:从指标层面,Nature期刊论文在WoS平台与微信平台用户使用的关系;从主题内容层面,Nature期刊论文在WoS平台与微信平台用户关注话题和动机的差异。需要指出的是,本研究所提出的“跨语种平台比较”是Nature期刊以不同语种形式在两类平台进行文献传播后,针对其在各自平台上使用量的比较分析。具体而言,即同一篇Nature期刊论文以英文形式在WoS平台发布后和以中文形式在微信平台上发布后的使用量数据比较。
1 数据和方法
1.1 数据来源与处理
考虑到本研究主要针对国际期刊文献在WoS平台和微信平台用户行为进行比较分析,因此在期刊样本选择上需要综合考虑以下因素。首先,该样本必须属于国际期刊出版商,旗下期刊在全球具有较高的知名度;其次,该出版商必须在微信开通官方账号,拥有一定的用户基础和影响力,并有持续稳定的内容输出。根据前期调查,目前在微信平台开通账号的国际期刊将近10家,其中属于全球知名STM出版商的有Elsevier出版商的爱思唯尔Elsevier、《自然》(Nature)期刊的Nature自然科研、赛吉(Sage)出版商的SAGENews、Springer出版商的Springer、泰勒弗朗西斯(Taylor&Francis)集团的TandF Rights、《科学》(Science)期刊的ScienceAAAS、威立(Wiley)出版商的Wiley威立等[12]。然而在调研中发现,部分公众号运营情况并不理想,如TandF Rights篇均阅读量不足20。根据清博大数据指数显示,Nature自然科研公众号活跃粉丝数超过13万,微信传播指数(WCI)达到821.52,总榜排在2 998名,是所有国际期刊出版商微信公众号中唯一进入前1万名的。综合以上分析,本研究最终确定Nature期刊作为目标样本。
样本数据方面,本研究选取WoS平台中的使用次数和微信平台中的阅读量数据。前者主要衡量用户对于WoS平台上一个特定项目的关注程度,具体表现为用户点击了指向出版商全文的链接,或是对论文进行了保存以便在题录管理工具中使用;后者是衡量用户点击进入该微信文章页面的次数,根据相关学者研究,阅读量是评测学术研究成果影响力的重要参数指标[13]。在样本时间跨度的选择上,本次选取文章样本发表时间限定在2016年1月—2018年12月。在样本范围上,为确保两个平台用户使用数据的对比分析,本研究获取的微信文章必须有DOI号,因此一般新闻通稿、广告等不纳入抽样范围。
数据处理步骤:首先,通过爬虫软件抓取2016年1月—2018年12月Nature自然科研微信平台文章阅读量、点赞数据及相关元数据(如论文标题、发表时间等);其次,通过Python爬取对应文章末尾的DOI号,登录WoS平台,利用DOI号获取相关文章在WoS平台的使用数据;最后,通过DOI字段匹配,将微信平台与WoS平台数据融合,删除无效样本后,最终得到有效样本1 390条。样本数据和预处理时间为2019年1月10—25日。由于数据抓取软件对阅读量超过10万的微信文章统一显示为100 001,无法提供精确数据,因此统计时按100 001处理。
1.2 分析方法
本研究采用计量研究和内容分析相结合的方法,对Nature期刊在WoS平台与微信平台的使用行为进行比较分析,以探索国际科研成果跨语种平台用户使用规律。本文研究步骤和方法如下。
首先,利用数据分析软件SPSS23对1 390篇文章的数据样本进行描述性统计分析和相关性分析,以揭示用户跨平台使用状况及相互关系。其次,分别选取Nature期刊在微信平台和WoS平台上受关注量排名前100的文章进行主题分析,对其文章发布位置分布、中国主题占比以及文章标题专业性表述进行统计,以揭示跨语种平台用户的主题偏好差异。最后,采用内容分析法,对跨语种平台用户使用动机差异进行分析。具体步骤包括:①参考其他学者进行学术推文动机分析所采用的内容框架[14],在此基础上经过课题组成员讨论,形成本研究的分析框架;②由2位图书情报与传播学背景的编码员对微信平台前25篇文献分别进行独立编码,得到一致性结果为52%;③2位编码员再次就编码结果,尤其是不一致方面进行讨论,并对内容框架进行部分修正;④2位编码员根据修正后的内容框架对全部200篇文献进行编码,一致性结果提高至74%;⑤针对剩余不一致文献,2位编码员通过讨论后确认结果。具体的技术路线如图1所示。
图1 技术路线图
2 结果分析
本研究从指标、主题和内容视角对跨语种平台用户行为进行比较分析,试图揭示其特征和规律。
2.1 基于指标视角的用户行为比较分析
2.1.1 基本统计分析
根据统计显示(见表1),整批样本中,无论是最小值、中值、最大值还是均值,微信平台的使用数据都明显高于WoS平台,其中微信平台推送文章的阅读量均值为5 240人次,而WoS平台中文章的使用量均值为43人次。两类平台面向的用户群体和自身定位决定了同样文章的使用次数差异悬殊。在WoS平台上,用户群体主要是不同学科的专业学者,数量较小,且通常只关注本领域的专业文献。而微信公众平台的用户群体数量庞大,除了特定学科的科研人员之外,还包括跨学科研究者以及对科学感兴趣的普通用户,他们出于个人兴趣关注Nature公众号文章。除此之外,不同平台使用次数计算方式差异也造成两者数据差异悬殊,WoS使用次数反映某篇论文满足用户信息需要的次数,具体表现为用户点击指向出版商全文链接或对论文进行了保存以便在题录管理工具中使用,往往是专业用户登录平台并进行检索后实现的操作,而微信推文阅读量则是以用户点击进入该文章次数为计算标准,不仅有用户主动关注公众号产生的阅读,还包括朋友圈分享或好友推荐后的阅读行为,前者使用门槛更高,后者相对较低。值得注意的是,根据Nature期刊在微信平台和WoS平台使用数据统计显示,期刊在不同平台的使用量均值都明显高于其中值,表明数据分布存在集聚效应,即“头部数据”对整体使用数据的影响较为明显,前50%的文章贡献了超过80%的微信阅读量和90%的WoS使用量(见图2和图3)。
表1 Nature期刊在微信平台与WoS平台使用量的基本统计
图2 Nature期刊微信平台阅读量分布
图3 Nature期刊WoS平台使用量分布
2.1.2 不同平台相关性分析
针对Nature期刊论文跨语种平台使用数据的关联性,本研究对该期刊在微信平台阅读量与WoS平台使用量做相关性分析。由于皮尔逊(Pearson)相关系数计算方法对数据有正态分布要求,本研究并不适用;而斯皮尔曼(Spearman)相关系数作为非参数统计方法,对数据分布没有特定要求,因此采用斯皮尔曼相关系数。
经过斯皮尔曼分析发现,Nature期刊文献在微信公众平台的阅读量与WoS平台的使用量之间呈微弱负相关(-0.23,p<0.01)。针对这一结果,考虑到本研究仅以Nature期刊作为分析对象,且样本数较少,并不能够完全就此判定两个平台使用数据之间存在负相关关系。反之,我们认为,这更可能反映两个平台之间缺乏直接关联,不同平台用户文化和语言差异导致这一现象的出现。通过对其中部分在微信平台上获得大量关注的文章分析发现,其在WoS平台上的使用次数并不突出。由于WoS平台的用户来自全球各国科研人员,且更多基于专业性的研究需求进行使用,而微信平台则主要是华人用户,接触到相关文章的目的和原因较为复杂,因此造成Nature期刊论文在两个平台使用数据上并未表现出明显的关联。
2.2 基于主题视角的用户行为比较分析
在描述性统计和相关性分析的基础上,本研究进一步通过主题分析揭示不同平台用户兴趣的差异特征。具体而言,以不同平台阅读量和使用量排名前100位的文章为样本,对其文章发布位置、主题内容、文章标题等进行分析(见图4)。
根据传播学中议程设置理论,大众传播具有一种为公众设置“议事日程”功能,媒体通过赋予各种“议题”不同程度的显著性方式,影响人们对周围事件重要性的判断。在社交媒体环境下,相关学者研究表明,议程设置的作用并没有削弱,反而强势存在[15]。根据本研究对社交媒体中学术期刊用户使用分析发现,议程设置的影响表现突出。根据微信公众号功能设计,每次发布内容都可设置发布位置,即选择头条或次条、尾条位置。根据统计结果显示,Nature期刊论文通过微信平台推送发布的排名前100文章有96%出现在微信头条推送位置,而基于WoS平台的排名前100文章对应的中文版本,则只有26%出现在微信头条推送位置。这表明,基于微信平台发布的Nature期刊论文使用量很大程度与其被推送位置有关,醒目的发布位置有助于提高其用户阅读;而WoS平台使用数据主要来自用户主动检索,主要与其文献内容质量和影响相关,与发布形式无直接关系。
在主题内容上,本研究重点比较不同平台排名前100文章标题是否涉及中国主题、是否采用专业性标题等方面。一般认为,国际期刊面向特定国家和地区社交媒体平台发布研究成果时,用户会对与该地区相关的主题内容更感兴趣。因此,关于中国主题,本研究通过对中文标题与文章首段中是否出现与“中国”相关的表述来作为主要依据判断该文章是否属于中国主题,如出现“中国科学家”“中医”等表述。而针对专业性标题,则依据中文标题中是否含有专业词汇作为判断标准,如标题中出现“暗物质”“大脑超声疗法”“姜黄素”等,则认为其属于专业性标题。通过编码结果发现,较之WoS平台,中国主题推文在微信平台上并没有显示出明显的关注优势,微信平台排名前100文章中的占比为15%,略低于WoS平台的18%。文章标题设计方面,针对不同平台,标题专业性程度也对用户关注度产生较大影响,在微信平台排名前100文章中,接近70%的文章采用非专业性标题设计,更适合非科研用户阅读;而在WoS平台排名前100文章对应的微信中文版本中,该比例仅为18%。值得注意的是,考虑到中国用户的语言差异,Nature期刊微信公众号专门对原本专业性标题和内容进行必要的加工,以适应本土社交媒体用户的阅读需求,经过加工的文章往往能取得较好的传播效果。如2017年10月19日在Nature上发表的一篇文章Mastering the game of Go without human knowledge,同日在Nature微信公众号上正式发布,其标题被翻译为《AlphaGo重出江湖,又发了一篇Nature》,并且对内容做了必要的精简,加入配有中英文字幕的短视频。该文章一经发布,即取得9.4万人次的阅读量。
图4 主题分析对比结果
2.3 基于内容视角的用户行为比较分析
为进一步分析不同平台用户关注Nature期刊文章的动机和驱动因素,本研究采用内容分析法对两个平台使用量排名前100的文献进行分析。需要指出的是,相比于科学推文涉及较为丰富的用户行为信息,微信推送文章仅有阅读量和评论等数据作为分析依据,且考虑到评论数据无法被批量采集,因此本研究主要通过对阅读量排名前100的文献本身进行内容分析,来反推用户阅读该文章的动机和驱动因素。
本研究根据微信推送文章动机类型,将其分为传播性主题和讨论性主题,前者以传播学术信息内容为主要目的,一般通过对科研成果的提炼以吸引用户;后者以探讨学术文章中某一话题为目的,通过描述、解释或评论等方式引发用户参与讨论。针对上述动机,进一步结合文章特点,细分为兴趣驱动、惊奇驱动、学术价值驱动和实用价值驱动等因素。其中,兴趣驱动突出文章有趣部分以吸引关注,惊奇驱动突出主题的出人意料特性以吸引用户,学术价值驱动是强调文章的学术有用性,实用价值驱动则强调文章的实际有用性。根据编码结果显示,整体而言,微信平台排名前100文章中讨论性主题占比(51%)要高于WoS平台(20%),具体驱动因素方面,较之WoS平台,在微信平台上惊奇驱动和实用价值驱动表现更为突出。最终编码结果如表2所示。
表2 用户使用动机编码结果
3 结论与讨论
作为分析和理解学术目的、基于社会网络构建的新计量指标,Altmetrics研究在数据科学时代持续蓬勃发展,也为探索不同环境和情境下的用户行为研究提供了崭新的视角。本研究通过比较Nature期刊论文在国际主流学术交流平台WoS与本土社交媒体平台微信公众号的用户使用状况,以揭示国际顶级学术期刊跨语种平台用户行为特征与规律,得出以下结论。
(1)在用户平台使用方面,国际主流学术平台与本土社交媒体平台之间存在较大差异。从用户接触范围来看,微信平台用户阅读量远高于WoS平台用户使用数量,前者接触门槛相对较低,用户范围已超越专业用户群体,吸引了更多的社交媒体用户关注,促进科研成果的广泛传播。而从相关性程度来看,期刊文献在WoS平台与微信平台之间存在微弱的负相关,表明两个平台用户群体和关注内容存在较大差异,其原因可能来自文化和语言习惯。
(2)在跨语种平台用户需求方面,单纯中国主题并不具有明显的关注优势,而面向本土的标题设计更符合微信用户阅读需求。按照新闻传播的接近性原则,读者往往对离身边越近、关系越密切的事更关注,因此一般认为,中国主题推文在微信平台会获得更多关注。但本研究调查显示,中国主题在微信平台阅读量排名前100文章中的占比低于WoS平台。对于这一看似反常的结果,我们认为,这反映了媒体情境对用户选择偏好的影响。相比于通过主流学术平台获取专业外文文献,通过微信平台获取Nature期刊文章的用户本身已经使用中文母语阅读,并不存在语言上的障碍,在这种情况下,用户并不会刻意留意中国主题内容,而更关注内容本身吸引力。这也体现在本研究另一发现上,即非专业化标题在微信平台阅读量排名前100文章中占比明显高于WoS平台,更多用户在社交媒体平台上阅读科学文章的核心诉求是通俗易懂。考虑到不同平台之间的语种差异,Nature期刊针对专业性程度较高的内容进行一定的通俗化改造,尤其是结合本土语言的二次创作,更加受到用户欢迎。
(3)不同情境下用户选择和兴趣偏好受到特定平台功能的影响,表现出明显的差异。根据本研究显示,社交媒体平台的议程设置作用显著,微信平台阅读量排名前100的文献中96%来自头条推送文章,远远高于WoS平台中的比例。大多用户在社交媒体环境下的学术信息行为是分阶段的,在选择是否关注某一公众号阶段用户具有较高的主动性,而一旦关注后,其行为实际上并非完全的主动选择,而是被动接受推送,在这种情况下,期刊对内容发布位置的设计就会对其行为产生直接影响。反之,在WoS平台,用户从检索关键词、结果排序,到最终获取使用,基本上是主动选择,较少受到其他因素的影响。另外,在社交媒体情境下,用户注意力是相对稀缺的,因此用户更表现为惊奇驱动和实用价值驱动,而非传统学术交流平台中的学术价值驱动。
4 研究不足与展望
本研究通过替代计量研究方法,对Nature期刊论文在微信平台与WoS平台跨语种用户使用行为展开比较分析,得出一些有益结论,为跨语种科学交流行为研究提供参考。当然,本研究还存在诸多局限和不足之处:①样本量不足,作为一项探索性研究,考虑到跨语种平台数据可对比性,我们选择Nature期刊作为分析对象,而没有扩展到更多国际期刊,这使得研究结论向一般性的国际学术期刊推广上需要特别谨慎;②数据指标选取过于单一,主要针对期刊论文在微信平台阅读数据和WoS平台使用数据,没有涉及评论、分享等与情境相关性更高的数据,因此在用户使用动机分析上存在较大的局限;③主题与内容分析存在主观判断的问题,特别是对中国主题和专业性标题判定上缺少已有分析框架借鉴,影响了结论的科学性。针对上述不足,未来将进一步扩大样本范围,结合多元化的用户行为指标,引入更为成熟的分析框架,对跨语种平台用户行为展开更为细致的探索。