科技期刊新兴增值服务模式及启示
2019-06-27翁彦琴王雪峰任艳青白小晶
■翁彦琴 王雪峰 张 恬 任艳青 白小晶
1)中国科学院文献情报中心,北京市海淀区中关村北四环西路33号 1001902)中国科学院大学经济与管理学院图书情报与档案管理系,北京市海淀区中关村东路80号 1001903)中国科学院物理研究所《物理学报》编辑部,北京市海淀区中关村南三街8号 1001904)中国科学院电子学研究所《微系统与纳米工程(英文)》编辑部,北京市海淀区北四环西路19号 100190
随着数字技术的迭代更新,大数据、云计算、人工智能、物联网等技术[1]正逐步影响人类生产生活的各个领域,与之对应,以科技期刊为重要产出的学术出版领域也随之发生变化。科技期刊领域应对数字化发展是一个从被动跟随到主动适应和利用的过程。以科技论文为例,其呈现形式经历了纸本单行本到电子版PDF全文再到HTML全文的转变;呈现方式经历了纸本论文机械数字化到基于网络(手机)浏览方式的全文浏览到加载丰富相关信息的Rich HTML方式,再到数据或代码的读取、关联和再利用等高级呈现方式[2]。2013年,学术与专业学会出版商协会报告显示大多数出版商已经有90%以上的内容可以在线获取[3],表明科技期刊进入数字化时代。可以预见,科技期刊领域对于论文(包括数据、图片、代码等)的呈现形式将越来越丰富,与计算机技术的关系也越来越紧密。从办刊实践来看,更多的期刊主动或被动地选择提供增值服务,最大化地利用数字出版优势,为用户带来最佳使用体验,从而增加用户黏性。
科技期刊数字化转化初期,其增值服务模式特点为单向性,以“供”为特色。文章的深度加工、全媒体呈现、E-mail推送等初级阶段的增值服务,更多地是从科技期刊“可提供”的角度来进行,初衷为科技期刊希望(想让)用户得到增值服务。国内有研究对本阶段的增值服务模式进行了全面的介绍和总结。如张维等[4-5]定量分析了国内与国外科技期刊在提供增值服务方面的差距,从内容资源深度加工、表现形式的扩展和信息延伸、个性化定制服务、承载载体变化4个方面对国内外科技期刊增值服务现状进行了分析。张丹[6]从用户的角度,了解作者对期刊增值服务的需求情况,探讨期刊向作者反馈增值服务结果的必要性及意义,研究结果表明作者非常希望得到增值服务结果反馈,反映出用户的互动性需求。
随着数字出版技术的发展,科技期刊逐渐进入主动利用计算机技术阶段,其增值服务特点为双向性,以“动”为特色。本研究拟通过对国际科技期刊出版领域前沿项目的调研和分析,探讨本阶段新兴增值服务模式及特征,并尝试将这些新兴模式对照科技期刊的最初功能设定进行定标定位,结合我国科技期刊增值服务现状,提出相应的发展对策。本研究建议并呼吁科技期刊重视用户服务,做好数据的标准化、挖掘、关联和重组,在“互联网+”的大环境下,充分利用相关技术,聚合资源,建立基于科技期刊的、具有数字化特性的学术生态。
1 科技期刊的新兴增值服务模式
近年来,国外出版商、大学设立相应的出版项目,外围科技公司以用户为中心设计对应的项目和服务,希望尽可能多地参与到科研人员的工作流中,参与论文生产的各个环节,通过针对科研人员工作需要提供各项工具(平台),使得科研人员习惯(乐于)享受其增值服务,出版与科学交流相互融合的特征更加凸显。新兴服务模式从被动提供变为主动参与,触角延伸到科研的全过程,最大程度地参与科研、服务科研。根据增值服务功能的不同,将新兴增值服务归纳为以下6种模式。
1.1 以提供解决方案为特征的定制服务模式
随着自然语言处理和机器学习技术的发展,科技期刊的语义分析和结构化解析成为可能,这促使科技期刊出版商向解决方案提供商转型,为读者、作者等用户提供定制服务,数字出版领域的知识服务趋向已成为业内共识。这种定制服务的实现,需要储备标准化、可关联的“信息”(包括数据、文献、词表、图片、音频、视频、程序等资源),通过计算机快速阅读和加工处理后,产生最终决策方案供用户参考,具体表现形式各不相同。
Elsevier的医学信息平台ClinicalKey拥有全球最大的医学信息资源库,涵盖所有医学专科。项目将“智能内容(Smart Content)”引入临床领域,支持语义检索;BMJ临床实践(BMJ Best Practice)更新关于诊断、预后、治疗和预防方面的逐步指导信息,且内容根据循证医学方法和专家意见整合而成,帮助用户实施最佳的临床实践[7]。ChemPlanner通过云计算帮助化学家在多种合成路径当中筛选出简洁高效的最优方法,该系统利用文献数据预测反应路线图,使用界面友好易懂,可以完成从目标产物到可获取的起始原料间的逆合成分析。美国化学文摘社(Chemical Abstracts Service,CAS)也已经使用机器学习系统来阐释数据库专业化管理的数据。欧洲分子生物学组织(European Molecular Biology Organization,EMBO)发起的SourceData平台支持根据数据内容发现论文,寻找特定数据、测试或生成新假设,允许生物医学科学家以机器可读的方式共享数据和底层源数据。
人工智能(Artificial Intelligence,AI)[8]已经进入科技期刊出版领域,尝试解决计算机时代海量文献产出的问题,基于AI的工具可以实现机器阅读并提炼文献观点,找出各领域最相关的文献或内容。如Yewno为出版领域提供的Yewno Unearth服务支持学术和专业出版机构建立自己的知识图谱[9]。施普林格·自然(Springer Nature)出版了该公司第一本由机器生成的化学类书籍。Iris.ai支持用户从一篇论文开始,根据计算机提取的关键词、语境同义词和上位词进行“指纹”特征化,随后根据指纹匹配开放获取(Open Access,OA)论文,可支持来自各个研究领域知识的组合。Dimensions是一个相互关联的知识研究系统,支持已有“知识”的重组。Escalex、CORE、Delta Think、JournalGuide、CHORUS分别从不同角度汇集并整合资源,提供个性化的知识服务。
1.2 以支撑学术交流为特征的辅助工具模式
科技期刊知识服务生态是一个庞大的体系,其中每一个环节都需要考虑整体性的需求,各环节的要求越来越专业化与标准化,由此伴生了大量支撑学术交流的辅助工具。科技期刊领域也乐于开发与推广这些辅助工具,优化科学研究成果发表程序,使得科研人员可以专注到他们最重要的工作——“科学研究”本身,并且起到宣传推广、推进本领域的标准进程、建立增值服务的底层基础等作用。这些工具根据论文发表前后可分为:论文发表前的协作与标准化工具,如ACS ChemWorx、Overleaf、Edifix、Mendeley参考文献管理或协同写作和发布系统;论文发表后的共享与重用工具,如RightFind®XML for Mining、Code Ocean、Annotation for Transparent Inquiry、Research Data Support Service分别从XML文本挖掘、代码共享与重用、“注释”与链接数据及数据的引用等方面支持论文碎片化元素的再利用。另外,同行评审认证平台Publons可认证审稿人同行评议中的工作,并提供相应记录。
1.3 以促进交流共享为特征的虚拟社区模式
新生代科研人员的生活和科研都在互联网环境下,他们更愿意在虚拟社区平台交流。伴随这一特性,科技期刊出版领域也出现了科研属性的社交平台,吸引了研究人员通过虚拟社区来开展科研合作、推广其研究成果[10]。
这些虚拟社区从不同方面满足科研人员的交流需求:论文发表前的指导与交流,如AuthorAID为中、低收入国家的研究人员提供论文写作与发表方面的支持、指导、资源和培训;论文评审新模式,如Frontiers由科研人员运作,评审的目标是与科学家(作者)一起提升文章质量,该平台支持作者与同行之间的网络交流[11];论文发表后的分享与推广,如Kudos支持作者搜索关键词或DOI号认领作品,也可通过输入ORCID号,将信息关联、导入至其Kudos账号,通过推荐推广提高发表文章的显示度和影响力[12]。
1.4 以丰富论文内容为特征的文章呈现模式
数字时代,论文核心内容的格式与印刷本仍然一致,但是网页呈现的已经远不是最初纸本论文的篇幅和内容。英国皇家化学学会(Royal Society of Chemistry,RSC)提出“让科学变得生动”诠释了这一趋势。通过结构化、碎片化、数据化、文本挖掘和关联、语义增强、附加扩展信息等对文章内容进行深度揭示和丰富拓展,学术文章的呈现更加专业、丰富和生动,更具有推广性。论文内容呈现方面,Article of the Future、eLife Lens重新定义web视图的文章格式和内容,RSC Rich HTML在文章页码引入语义元素,可在文章中识别化合物、化学概念和相关数据。在论文内容推送方面,各方关注焦点在论文摘要,图文提要已经在纸本和电子刊中普及,Video Abstracts和Cartoon Abstracts是衍生的新推广方式。另外,Nature,Science,Cell等知名期刊均引入Summary推广,Summary的核心目标是对研究成果的广泛传播,强调内容的精炼与表述的通俗性,充分考虑社交媒体的传播特点,应用现代社交媒体的传播性对科研论文进行充分传播。
1.5 以适应网络环境为特征的存取分享模式
论文的首发权和时效性是科学家非常关心的内容,为了适应新节奏,出版领域使用网络预出版等方式减少论文的发表时滞,即便如此,仍不能满足网络时代的信息交换的需求,因此“网络世界”中论文的存取和分享方式也在悄然发生变化。在论文登记存储方面,预印本网站发展迅速[13],更多学科开始建立预印本网站(如arXiv、BioRxiv、ChemRxiv),或者提交并存储在适当的第三方公共仓储(如Figshare、Dryad)[14],数据期刊有自建数据库(如EcologyArchive、Giga DB)[15]。在论文合法分享方面,Springer Nature SharedIt为作者和订阅者创建了一个合法的、免费的、拥有版本记录的方式来共享成果;出版商和图书馆可在IP Intrusion Database交换信息,并可实时警告盗用威胁。
1.6 以评估期刊发文为特征的分析工具模式
传统的期刊发文评价利用文献计量学的基础指标如影响因子、引用半衰期、即年指标、h指数和g指数等[16],已不能全面评价数字环境下的期刊学术影响力。为此,补充基于社交网络分析和描述学术成果的新计量指标如Altmetrics[17]。Mendeley单篇论文阅读统计(Reader Counts)可实时反映文章在科学社区内的学术影响力,填补了自论文发表至被引信息公布之间的空白[18];F1000评价系统以事后评议方式为研究人员甄选生物学与医学领域中重要的论文;CiteScore通过计算3年期间每篇文章的平均引用频次来衡量数千种期刊的影响。另外,科技期刊也使用分析工具评估学术内容,将科技期刊采编过程中产生的数据反馈在办刊的决策过程中,使期刊出版和管理成为闭环[19],如Impact Vizor可视化分析工具,从引用和文章使用情况来评估学术内容的影响力。
2 科技期刊增值服务的定位
尽管数字化的外衣花样繁多,但是科技期刊伴生于学术研究,基本运作模式未发生本质变化,核心功能仍保留了“科学的记录”的初心,与建立之初的理念一脉相承。
2.1 科技期刊的核心功能
科技期刊作为传播创新型科学研究成果的重要手段和方式,是科学研究生命周期中重要的起点和终点。1665年,最早的同行评议期刊——英国皇家学会创办的《哲学会刊》正式出刊[20],亨利·奥登伯格定义认为期刊是“科学的记录”,其4项标准后来发展成为学术期刊的4个基本功能:(1)注册登记,表明特定作者的研究成果具有优先权(首发权)和所有权;(2)评估鉴定,通过同行评议、退稿来保证文章质量;(3)传播,通过期刊的途径向其他学界同仁传递作者的观点;(4)存档,永久记录作者的研究成果[21]。
2.2 增值服务的功能定位
在增值服务的新兴阶段,除传统意义上的科技论文之外,科技期刊还提供了各式服务,科技期刊与计算机技术紧密结合后的“服务”已经是“百花齐放”的发展态势。无论表现形式、功能如何演变,科技期刊仍保留了“科学的记录”的初心,与建立之初的理念一脉相承。新兴增值服务项目与科技期刊初始核心功能的对应关系如表1所示。
(1) 注册登记功能。①科技论文不仅是论文本身,还被拆分为段落、图表、参考文献、数据、程序等细粒化内容,这些碎片可单独注册登记,建立独立的档案或标识码。②信息化发展快速,科研节奏变快,论文发表后的登记注册已经不能满足要求,产生预印本方式的登记存储,并与后期发表的版本联动,大大缩短科研成果从产生到面世的时滞。③服务前伸,在论文投稿前便开始参与科学研究过程,开发各类工具方便科研人员的日常工作及成果整理和发布,提前推送或预定科研人员的发布渠道。④考虑社交性,提供发表前、发表中、发表后的交流渠道。
(2) 评估鉴定功能。对科技论文自身的评估向公开、互动方向发展。对科技期刊载文的评估重视即时性,同时,考虑社交媒体的影响力指数。
(3) 传播功能。摈弃纸媒时代的被动获取做法,通过与网络交流工具结合,进行精准化、个性化的服务和推送。①论文内容呈现和推送是焦点领域,文章结构和加载内容丰富化,引入图片、视频等视觉冲击更强的元素。②网络环境下合法的共享与防止侵权被列入考虑范畴。③更加开放,科研成果开始重视大众传播,同时,也在呼吁和提倡OA方式的出版,以及基于OA数据的资源整合。
(4) 存档功能。脱离传统意义的存档入库,科技论文纸本的电子化存档已经完成。在新兴阶段,相对于注册登记,存档内容的类型更加丰富,也支持衍生新的服务和产品,但是需要内容的碎片化、标准化、支持关联和重用才能产生新的产品。存档内容可分解为知识元,实现资源的整合重组,产生定制的知识逻辑和解决方案。
表1 新兴增值服务项目与科技期刊初始核心功能的对应关系
3 我国科技期刊增值服务现状及发展对策
西方发达国家已成功实现由传统出版向数字出版的转型,大型出版集团完成了一系列数字出版的基础性工作,如内容资源的数字化、数字出版平台的搭建、数字内容存储技术的建设、展示技术的应用等,已经开始利用数字出版技术的优势向其他国家进军[22-23]。与之相比,我国的数字出版虽然也取得了一定的成绩,但是仍然处于劣势,有一些数字出版产品尚未形成多学科规模化品牌优势。
3.1 我国科技期刊增值服务现状
在用户方面,国外科技期刊重视用户的需求,已经有较为成熟的互动服务模式;在专业方面,依托计算机技术与强大的底层数据,各类新兴增值服务蓬勃发展[24]。相较而言,囿于技术和数据储备等因素,国内期刊更多的是单刊或依托学科刊群开展相关服务,技术含量(加工)内容较少[25]。
国内科技期刊增值服务对应小体量、小规模,更加个性化,与行业(学科)结合紧密。鉴于微信在国内的大范围使用,微信渠道的传播引起了国内办刊人的关注,国内期刊对微信的利用程度各不相同,定位也不尽一致,有些是用于社区群、有些是用于微信公众号传播(论文推广、行业科普)。我国科技期刊新兴增值服务功能的发展有以下特色。(1)科技论文的标准化、数字化变身已经开始,基于中文的各类标准刚刚开始建立。(2)开始考虑社交性,微信群与集群化平台成为国内期刊服务用户群的重要方式,微信公众号成为传播的重要渠道。(3)逐步使用XML排版,文章结构和加载内容丰富化,有意识引入图片、视频等视觉冲击更强的元素。(4)OSID[26]用于文章的推广和宣传。(5)正在建立中文体系的词表库、专业知识分类体系、本体库,可进行交叉学科分析、产生产业报告,产生数据期刊与数据论文。(6)数字化的“入不敷出”。国内科技期刊的数字出版投入远大于收入,尤其对于单刊,需要传统收入来维护增值服务的支出。(7)科技期刊周边的服务技术公司多为小型企业,仅做期刊当前网站或采编系统的运维等工作。
3.2 发展对策
科技期刊在主动适应和融合网络环境,尽力符合“开放、链接、语义、标准、共享、交流”等网络运行环境的标签[27]。从具体表象来看,科技期刊的丰富内容常态化、提供知识碎片化、数据出版智能化、计算机识别语义化。在数字科技高度发达的今天,出版商能够影响的不仅是一篇篇孤立的论文,还可以为科学研究的全流程提供支持与服务。科技出版与科学研究的关系更加紧密,从科研产生后科技论文的发表前伸至科学研究过程及论文产生过程中的服务,从科研论文发表进入数据库后延至科技论文的再次推广传播,并在研究管理、大数据分析、解决方案和内容复用方面[28]提供帮助。前伸和后延表明出版商非常重视用户的有效服务,其理念从被动提供向有效给予转变。我国的科技期刊增值服务方面建议做好以下4个“好”,抓住核心,稳步发展。
(1) 抓住用户,提供好服务。国际出版商,尤其是学会属性的出版商,非常关注并致力于用户与潜在用户的培训与指引,提供职业生涯指导与规划。出版商通过设立学术会议、参与学术会议宣传推广、设立各类奖项与荣誉等吸引优秀用户的关注和支持。我国科技期刊多源自高校、科研院所和学会,与本领域用户有天然的“血缘”关系,有建立“产—学—研”一体化服务模式[29]的天然优势;微信已经成为我国国民日常交流不可或缺的工具,使用频率远高于传统通信方式,多数期刊已经捕捉到这一点并建立不同定位的微信公众号来吸引和维护用户群[30]。科技期刊的生存发展环境在发生变化,重视、培养和维护用户需引起足够重视。
(2) 重视数据,建立好基础。科技期刊已经不是传统意义上的一本纸刊,一篇篇论文的背后是各类数据、描述的集合,论文如同冰山一角,大量的内容仍潜在海平面之下。国外大型出版商掌握的规模化数字资源、平台技术和数字决策工具,已经成为第四范式下的一个基础条件,同时也成为开展科研工作的强大制约条件之一[31]。标准化、可关联、可描述的数据是学术出版开展各项增值服务的前提和基础[32]。数据问题已经刻不容缓,“不积跬步,无以至千里”,国内出版的科技期刊需足够重视并扎实做好数据工作;国外平台出版的科技期刊需明确数据版权归属。另外,建议鼓励科技期刊依托学科发展增值服务,从国内实践来看,大型出版商垄断了所有增值服务工具,如果这种局势无法破解,长此以往,各刊在整个数字出版链中仅提供原始的粗放式内容,后期碎片化和二次加工整合等工作将全部由数据库商掌握。
(3) 放宽视野,利用好技术。针对科技期刊的新兴增值服务,技术已经是不可不提的关键问题。科技期刊出版的各个层次都离不开技术,如不同领域有不同的数据和处理数据的专业软件,出版商会通过自主或合作研发方式开发相关软件或应用,培育从业人员的使用习惯;开发支持协同写作的工作软件,方便用户沟通与投稿;开发更加智能的阅读工具,方便用户阅读和使用文献;通过专业的数据库提供专业的检索、查询与关联服务;开发适合用户的数据分析及知识服务产品。从国外增值服务实践来看,有各方力量如大学、出版商、技术公司或独立或联合开发相关项目;从国内来看,出版方开发相关产品的案例更为普遍,“中国知网”是以航母的姿态迅速占领科技期刊出版的各个增值领域,集群化刊群基于学科特点开始尝试数据管理与知识服务探索[33]。出版领域的技术方仅有几家采编公司服务于各刊的自建网站,并未引起国内大型技术公司的注意或与其尚未建立合作。在拥有数据的技术上,可尝试放宽视野,打通出版方及技术方的连接,引入雄厚的技术力量,为科技期刊的增值服务建立技术基础。与此同时,也需掌握核心数据与技术,以避免降维竞争。
(4) 聚合资源,维护好合作。从人工智能在科技期刊出版的案例可以看出,纳入计算的资源量非常丰富,远不限于科技期刊论文本身,名词词表、数据库、程序库、图片库、各专业的碎片内容(如化学反应、化学结构)、本体库、富媒体内容资源等均将全部纳入增值服务的资源范围。独立经营的时代将成为过去,打通资源壁垒,建立关联计算的通道,合作将成为常态。在传播方面,期刊传播模式从传统的线性方式向网络化转变,使期刊信息快速、彻底和立体传播成为可能。数字化使得文章的发表更加容易和快速,同时,也带来了信息爆炸和论文噪音的问题。出版商在论文推广方面不遗余力,如通过视频、图像等可视化手段激发阅读兴趣,能在短时间内表达更多信息,促进文章内容广泛传播;采用不同形式,为编辑、作者、审稿人等提供搜索引擎优化培训,以求文章更容易被发现;移动出版帮助实现期刊内容传播泛在化,开发并推出移动终端应用程序;支持学术社区和社交媒体对论文的宣传和转发;重视科技论文对大众的普及等方面。
4 结语
在数字出版全面展开的时代,机遇与挑战并存,“去中心化”后,单刊、刊群与数据库有平等对话的机会,面对公共平台的“搜索”,“核心”与“非核心”期刊又站在同一起跑线上;数字化时代意味着数字化的准备和加工,意味着数字化成本,国内大部分期刊尚未化解数字化成本依靠传统纸刊收入的尴尬。期待中国科技期刊通过深化增值服务模式,做好4个“好”,成功打破这一尴尬,真正进入数字出版的轨道。