大数据时代学术期刊的内容优化与价值重构
2016-02-13夏登武
■夏登武
宁波大学学报编辑部,浙江宁波市江北区风华路818号 315211
大数据时代,学术研究正从单一学术领域向多元化学术领域渗透与延伸,各个学科在研究方法、视角等方面互相借鉴,且不断融合。吉姆·格雷(Jim Grey)提出了以数据为中心,以协同化、网络化与数据驱动为主要特征的数据密集型科学研究“第四范式”[1]。由此凸显数据对现今科研工作的重大影响。应学术创新模式与知识传播交流环境的变化,学术期刊界也在积极探索自身的生存与发展路径:韩璞庚等分析了大数字时代学术期刊面临了“办刊模式困境,信息获取方式陈旧,审稿方式单一以及评价方式片面”等问题,并提出相关应对策略[2];周小华等研究了大数据时代学术期刊的转型与发展机遇,认为学术期刊要运用大数据技术跳出传统出版流程,积极探索以学术期刊为纽带的“大数据”全产业链和新业态发展路径[3];李宏弢针对大数据时代学术期刊面临的危机,从思想、技术等视角提出了大数据时代华文学术期刊发展的战略选择[4];邵玉娴基于大数据技术的应用给学术期刊编辑带来的变革的视角,分析了大数据时代学术期刊编辑的转型问题[5];柴英等研究了大数据时代学术期刊的导向功能、传播交流功能与评价功能的变革[6]。从已有的研究成果来看,目前对“大数据时代学术期刊的生存与发展”研究主要是基于解读大数据,认知大数据时代学术期刊面临的转型与变革的必要性与紧迫性。而对于刚刚涉入数字化的学术期刊来说,应用大数据技术,由“数字化”转型到“数据化”仍有很长的路需要探索。大数据真正意义不仅在于数据量的“大”,而且在于对数据组织与利用。只有认知学术期刊的数据及其价值,才能不断扩大与挖掘学术期刊数据的量,丰富数据类型;同时,只有科学地优化数据结构,才能使数据得到合理利用。基于此,本文试从学术期刊的“数据”认知与管理的视角,探索盘活学术期刊“大数据”,重构学术期刊的传播内容与价值的路径。
1 采集科研行为数据,提升学术期刊网络平台的资源建设能力
目前,我国的学术期刊基本上完成了“数字化”转型,且大多学术期刊也拥有自己的网络传播平台,其中不乏部分学术期刊的网络平台已经具备一定资源建设与信息集聚能力,与纸媒期刊互动大大增强了期刊的传播能力与服务能力;但是大多数学术期刊网络平台的资源建设能力与传播能力仍然非常有限。大数据时代,学术期刊要实现从“数字化”到“数据化”转型必须要善于认知“数据”,挖掘“数据”,即首先必须要解决数据之大的“大”,从哪里来的问题。正如有论者曾认为,媒体人需要用不一样的眼光看待数据,最起码能够看到什么样的数据才是有用的[7]。由此可见,要实现“数字化”基础上的“数据化”转型,必须要对以“学术期刊”为中心的数据具有基本的辨识能力,有了数据辨识力才能对数据进行诠释、组织与整理,进而有意识地积累数据、提取数据、拓展数据,实现数据的推广与应用。
1.1 采集与挖掘科研行为数据
科研行为是学术期刊的源头活水。在科学研究过程中,每一个科研活动都可以产生大量的数据,如原始记录、科学研究素材、成功与失败的摸索经验、中间成果等。运用网络智能技术,对这些科研行为数据进行挖掘、分析,并使其结构化与可视化,可以用其描绘科研事件轮廓和蕴含在科研成果背后的行为轨迹。由科研成果回溯科研背景数据、过程数据、成果数据等,将数据转化为资源,就可以从科学研究源头增加传统学术出版链的长度。
学术期刊需要转变传播理念,根据科研用户的需求、科学交流需要再结合学术出版传播态势,从科研成果产生的源头,关注相关科研行为数据以及编辑出版过程数据,收集、整理、分析、提炼具有潜在的价值信息,使学术生产与传播数据对接、互动、共生,再通过资源组合产生的叠加优势,扩展学术期刊的资源价值链。对科研行为数据的收集与整理,一方面要体现科研成果获得的全过程,增强学术传播的递延性,增强学术出版的生命力;另一方面,要对科研活动的动态描述数字化,用不同镜头为受众观察事物提供多元化的视角,描绘完整的科研活动过程,增强学术成果信息的可信度。科研行为数据既可使本专业领域内相关科研活动人员对个体或群体行为进行实时回溯与观察,也可以多维度地揭示更全面、更深刻的事物本质规律,促进问题的解决。此外,对科研活动行为数据挖掘与整理,会使科研知识体系更加丰富,服务更加贴近受众需求。
1.2 提升学术期刊网络平台的资源建设能力
大数据时代,学术传播必须要转变传统单一的学术成果信息的“精雕细刻”与序化传播方式,通过扩大科研行为数据采集面,深度加工与优化数据结构来提高自身网络平台信息拥有量以及资源建设能力。扩大数据采集面,主要是通过网络平台,以学术成果信息为内核挖掘其背景信息及其相关信息,尤其要注重对与科研成果相关的非结构性数据的采集与整合,建构多维的数据结构,使其与传统的结构性数据或半结构性数据建立新的关联模式与互动关系,以此来打破传统学术期刊与数据库的数据孤岛局面。同时,强化不同媒体之间的互动性与互联性,增强优质内容的增殖与衍生能力,创造更高的附加值。围绕传统学术期刊的“优质内容信息”这一内核,梳理学科发展与研究的纵向脉络,厘清学科与相关学科之间的横向关系,增强数字信息使用分析与二次开发能力,促进知识的显性化表达。对网络搜索引擎、社交媒体内容、用户数据进行深度挖掘,过滤其中有价值的信息,增加对半结构化数据和非结构化数据的收集和存储,再进行结构转化,并将其置于一定逻辑关系中,赋予一定意义,利用数据挖掘技术充分释放文献与数据的功能,把有意义的每一条数据及其数据关系都转换化成一个知识群或信息链,以此提升学术期刊网络平台的资源建设能力。
2 扩展传播数据源,提升学术期刊的服务能力
2.1 推动学术期刊富媒体出版,拓展学术传播渠道
所有媒介的传播目的都是满足人们获取知识与信息的需求。而人们对知识与信息的需求包括占有大量可利用的知识,信息的可操作性,对所获取信息的价值性与重要性的评判等三个维度。基于这三个维度,大数据时代,传统学术期刊应尽快打破一元化学术信息加工与处理思维,从注重科研成果的发表转变为强调科研全过程发布,重组编辑流程,拓展内容信息的多元化表现形式,丰富学术信息的传播介质,推动学术富媒体出版。一方面要保留传统平面媒体文字加图片形式的编辑严谨性与规范性,注重局部的、小数据量的精确性;另一方面又能运用数字技术,将与论文有关的图像、文字、影像进行多元化内容结构处理,实现多维度表达,以增强学术信息资源的解释能力与活性。如采用html格式发布学术论文可增强网络引擎的匹配功能;利用视频信息表达与传播优势可拓展学术论文的文本、图表数据的表达能力。应媒介环境的变化,学术传播界已做出一些积极有益的探索。如美国圣奥拉夫学院的Robert M.Hanson教授开发出一款针对化学、结晶学、材料学、分子生物学领域3D化学结构。利用3D图像、视频或Flash等将特定内容可视化,可以将复杂结构或抽象概念进行更直观地阐述。《新英格兰医学杂志》在网络平台上,对每期内容中开放不到20分钟的视频专题介绍,以及概述每期杂志主要内容的音频,来延伸受众的感官与及其内容价值[8]。采用可视化技术转化数据,大大推动科技知识大众化普及,扩充了科技新知识的受众群。
2.2 利用传播数据,挖掘学术资源服务价值
传播数据,是以内容数据为内核,集聚日复一日的出版行为中产生的大量数据。新媒体环境下,学术期刊传播会形成两个数据核心:一种是以传统媒介为核心的半结构性数据与结构性数据。采集、挖掘与管理学术期刊出版传播过程中的半结构性数据与结构性数据,可满足内容分类和用户聚类的需求。如励德·爱思唯尔公司利用自有的科研文献、学术论文、专利二次文献以及OECD等国际组织的海量信息,通过专业大数据技术HPCC,2013年为英国BIS(科技部)作了英国科研竞争力国际比较和人才流动的分析,对英国政府在高科技人才流动和移民政策方面都产生了一定的影响[9]。另一种是以新媒体为核心生成的大量的非结构性数据。两个核心数据具有一定的交叠点与共振点。对这些结构化、半结构化和非结构化数据实现挖掘、提炼与整合,析出有价值的知识与信息,依据关联规则,分析非结构性数据,探寻数据背后隐藏的事物运行规律与行为模式,可为科学研究提供前导性的咨询信息或更精确的发展趋势,以数据体系与前导信息图谱为专家学者确定研究方向,或为相关应用领域提供决策参考,实现用数据引领科研价值取向,用数据驱动科研发展。
3 关联外部数据,发挥学术期刊在科研协同创新过程中的纽带作用
科研创新涉及经济与社会发展的方方面面,探寻数据之间的关联性,构建科学合理的数据结构,发挥学术期刊在科研协同创新过程中的纽带作用,是满足跨学科、跨专业与跨行业需求,实现科技创新资源价值的根本。大数据技术具有一种粘合剂的作用,它粘合了平台各方构成的产业链中所能容纳、辐射到的所有行业、部门、企业、机构[10]。如何使大数据在学术创新与科学应用链中更好地发挥粘连作用,其中最重要的是分析数据与数据的内在关系,重构传统学术生产方式与运行规律,使不同的来源的数据之间不是单层相加,而是深度关联。
首先,借力外部科研数据资源,建立与外部的各种数字资源互动或链接。如相关专业领域的实验数据、历史数据、观察数据、科研过程数据以及科技成果转化与应用数据,或者政府部门的统计数据,管理部门的行业发展数据等。对这些数据进行科学合理地处理,可以满足科研创新、实际应用以及优化决策等需求。因此,学术期刊数据库建设需要在不断补充自身新资源的基础上,善于建构学术知识网络体系,打通库与库之间、不同文献或平台之间的通道,实现不同类型数据库、不同平台、不同载体等相关信息的链接以及数据间的跨界利用。如英国医学杂志(BMJ)除了传播与临床工作密切相关的信息与知识外,还涉及与医学相关的政治、经济、社会、教育、伦理、公共卫生等诸多方面,增添与众不同的报道角度和人文情愫。它不仅致力于传播临床医学的研究成果与前沿知识,还致力于帮助医务工作者、医疗机构和政府做出正确的医疗决策,提升医务工作者的临床经验,改善患者的临床结局,受到世界很多国家读者的欢迎[11]。其次,利用知识发现软件中语义查找功能,厘清研究主题间的内在逻辑联系,在数据中关联相关领域研究人员分布、动态、联系信息,对专业领域的相似性进行挖掘与推荐,加强研究者之间的研究协作与信息交流,让多学科的世界观与方法论擦出火花。著名的学术研究网站Academia.edu发布了一款实时追踪分析工具,科研工作者借助这款工具可以进行具体的学术受众分析,了解自己的研究方向受到哪些地区、哪些人群的关注,从而可以进行积极地学术互动和研究反馈,形成良好的学术交流互动的网络氛围[12]。
4 善于分析数据,延伸学术期刊在网络空间的品牌效力
网络环境下,数据留下的不只是人们的活动轨迹,更是一种决策的依据,一种信心的来源,一种说服力[13]。善于分析数据,可更精准定位传播方向,加强传播信息质量控制,延伸学术期刊的在网络空间的品牌效力。
4.1 利用消费数据,精准定位传播方向
消费数据是指学术信息在消费过程中产生的数据,其包括登录、搜索、浏览、点击、购买、阅读、引用、评论与交流信息等数据总汇。这些数据既描述了期刊数字传播的特点,也非常准确地记录了受众对某一主题研究的关注情况。如:对某一研究成果有哪些专业领域的人员会关注,及其关注重点是什么等。通过这些数据分析可以直观显示期刊传播内在规律与传播效果;受众人员组成、地域特征与专业特征以及阅读层次与兴趣等。对消费数据进行统计与分析,有利于期刊更精准地定位受众,更明确地建构期刊品牌形象,优化内容生产,提升传播影响力与服务能力。如国外医学期刊统计网络点击、访问、页面浏览、文摘浏览、目录浏览等数据,建立用户数据库,通过这些数据归纳用户最感兴趣的主题、搜索最多的词,并根据用户的不同国籍、不同年龄、不同专业进行分层分析,以此来动态调整期刊的报道重点[14]。此外,也可以借用消费数据反刍学术期刊的优质内容,进而实现数字再生产与信息衍生,导引科研价值取向。Limerick大学的Tim Ritchie教授在评价自己学术成果时,常把用户行为数据分析作为一个重要的指标。通过对已有学术成果受众群特征与对其成果的认可度来评价已有学术成果,并定位即将展开的研究[12]。
4.2 用“数据量”控制“信息质”,延伸学术期刊在网络空间的品牌效力
传统学术出版的质量控制大多依赖主观经验判断,强调资深经验与约定俗成的行业规制,带有强烈主观色彩与感性化,在学术信息消费与接受等方面的分析与服务能力也欠佳。而数据时代,更大规模数据的获得与更全面数据的拥有为编辑培养信息筛选能力与洞悉力,提供了前所未有的空间与潜力[15]。因为,大数据的记录与分析价值为变革出版发行的数据思维方式提供了更明确的方向;大数据的监督、复核价值为重新审视出版传播行为“订讹规过”提供了更直观的依据;大数据的调整、纠偏价值为确保出版发行系统的良性运行提供了最基本的保障。通过大量相关数据可对相关领域的主要科研进展情况进行分类、整合、对比,多维度考量其创新价值。如获取作者的科研行为数据、成果获得过程数据以及已有的学术成果信息等,分析作者科研成果的获得过程、背景认知,可对作者学术积淀、经验、学术水平、学术成就与贡献等进行评估;而从作者信息、涉及的专业研究等层面又可对作者的创新成果进行判断与分级定位。
知识容易在繁杂的信息中迷失。数据容量的增加,带来了受众对数据的筛选与过滤的更强烈的需求。运用大数据技术来提升信息过滤与选择能力,进而促进学术信息质量的控制,可提高受众获取知识的效率;同时,明确清晰地刻画受众的需求和目标,及时精准帮受众定位所需要的信息,也可以培养受众群的信息依赖性,继而延伸学术期刊的在网络空间的品牌效力。
5 结语
当网络变成了日常交流工具,可为任何一个潜在用户提供丰富的信息资料时,信息也会在不断传播中衍生并延伸其价值。学术大数据是一个全新的发展概念。用大数据理念优化学术期刊的内容结构,重构学术期刊的传播价值,是变革传统学术出版的静态、单向、线性传播模式,促进学术期刊从“数字化”向“数据化”转型的根本路径。
[1] 吴锋.“大数据时代”科技期刊的出版革命及面临挑战[J].出版发行研究,2013(8):66-70.
[2] 韩璞庚.大数据视阈下的学术期刊:挑战与对策[J].甘肃社会科学,2015(1):72-74.
[3] 周小华.“大数据”时代中国学术期刊的转型与发展机遇[J].科技与出版,2014(4):102-104.
[4] 李宏弢.大数据时代华文学术期刊发展的战略选择[J].清华大学学报:哲学社会科学版,2015,30(6):89-96.
[5] 邵玉娴.大数据时代学术期刊的变革及编辑工作的转型[J].编辑学报,2014,26(S 1):152-155.
[6] 柴英,马婧.大数据时代学术期刊功能的变革[J].编辑之友,2014(6):28-31.
[7] 陆小华.传媒产业链变革:再专业化与再组织化[J].南方电视学刊,2014(2):7-12.
[8] 任胜利.柳叶刀(Lancet):医学期刊中的锋利之刀[EB/OL].(2013-10-25).http://blog.sciencenet.cn/home.php? mod=space&uid=38899&do=blog&id=247729.
[9] 邬书林.关注国际科技知识和信息传播趋势积极推进我国科技文献传播体系建设[J].出版发行研究,2014(7):5-12.
[10] 崔恒勇,范钦儒.试析数字出版平台与大数据结构[J].出版发行研究,2014(4):9-12.
[11] 沈锡宾,刘伟竹,刘冰,等.英国医学杂志(BMJ)集团的转型与思考[J].2014,25(7):863-866.
[12] 韦龔.网络正在改变学术界[EB/OL].(2013-10-25).http://www.Bookdao.com/article/44978/?type=98.
[13] 侯玉欣.大数据时代华文出版的机遇与挑战[J].出版广角,2013(24):10-12.
[14] 马英,胡永成.谈国外医学期刊经营中的服务理念[J].编辑学报,2011,23(6):560-562.
[15] 大数据时代降临[EB/OL].(2012-09-22).半月谈网.http://www.banyuetan.org/jrt/120922/70953_1.shtml.