人工智能时代的学术期刊数字化传播
2019-12-18■李媛
■李 媛
1)武汉大学信息管理学院,湖北省武汉市武昌区八一路299号 4300722)武汉大学人文社会科学学报编辑部,湖北省武汉市武昌区八一路299号 430072
人工智能(Artificial Intelligence)是研究、开发用于模拟、延伸和扩展人的智能行为的综合性学科[1]。人工智能正在改变数字媒介,为学术期刊的数字化传播带来新的知识谱系和更富个性化的内容,并使得跨平台共享成为可能,其优势主要是信息与受众间围绕信息内涵和外延的交互性增强。人工智能技术有助于解决中国学术期刊在传播过程中普遍存在的受众定位不清、传播形式缺乏吸引力、与受众互动不足、用户黏性和活跃度较低等问题。
学界对人工智能技术在学术期刊传播中的应用已有初步探讨。主流的研究视角是概述性地讨论人工智能在期刊传播中的作用,例如:刘闯[2]指出人工智能可以积极分析用户需求,通过对用户静态/动态属性的分析构建知识图谱,从而优化用户浏览效果;陈鸿等[3]指出人工智能对期刊发展可起到政治支持、技术支持、观念支持和行为支持的作用;向飒[4]指出人工智能可加速学术出版的流程再造,实现选题策划便捷化、生产印刷按需化、营销发行精准化和知识服务智能化等愿景。部分学者分析了人工智能在期刊传播中的应用困境,如范军等[5]和刘平等[6]认为阻碍人工智能与出版业融合的关键因素有弱智能限制出版自动化、专业出版人才建设乏力、版权和责任风险大、生产方式触及伦理法律边界。还有学者分析了人工智能时代期刊传播的发展趋势,如张耀铭[7]指出建设国家级数字化学术传播平台是学术期刊传播转型的关键进路。海外学者的研究以2010年为界,此前的研究聚焦于知识管理和专家系统,以对基础理论和概念的探讨为主,此后更多关注集群优化算法。在人工智能领域论文的数量上,美国是主力军,中国位居第二,印度和欧洲国家紧跟其后[8],全球人工智能研究排名前10的国家占该领域全球出版份额的74.32%[9]。Wade等[10]指出通过人机交互所发现的用户意图,能让学术服务商更深入地了解研究人员在寻找什么;学术出版商可使用学术知识API(Academic Knowledge APIs)来理解学术用户搜索的内容,并从微软学术图(Microsoft Academic Graph)软件中发掘更多相关信息。他们同时指出,由于技术过于复杂且灵活性不足,语义Web方法(Semantic Web approach)发展缓慢。
总体来看,学界对人工智能在学术期刊传播中的应用已从理论和实践方面展开了探讨,但仍存在以下不足:(1)大部分研究是概述性地讨论人工智能对出版业态整体的影响,而专门探讨人工智能应用于学术期刊传播的研究很欠缺;(2)在少有的探讨人工智能与学术期刊传播融合的研究中,鲜有学者提出流程如何嵌合、平台如何运行的系统性设想;(3)几乎没有学者结合我国的具体案例,剖析人工智能在学术期刊传播中应用的难点和对策。本研究基于人工智能在出版业应用的现状,解析人工智能在中国学术期刊传播中应用的优势和存在的问题,勾勒基于人工智能技术的中国学术期刊传播平台,并结合方正出版大数据平台,探讨本研究设想的平台的创新性、可能遇到的瓶颈和对策,以期填补当前学界同类研究较少的空缺。
1 人工智能应用于学术期刊传播的现状与问题
学术期刊的数字化传播能掌握受众特征,将传播主体与受众匹配,增强传播效果。当前,中国学术期刊传播中需解决的关键问题即提升传播效果。
1.1 人工智能在学术期刊传播中应用的现状
在学术期刊出版领域,人工智能已开始发挥重要作用,主要表现在4个方面。(1)辨别洗稿式论文抄袭。例如,对于形容词替换、语序调换等修改语句类的抄袭,可利用自然语言处理技术(Natural Language Processing)识别近义词,并基于时间递归神经网络技术(Long Short-Term Memory)的记忆特征,识别被改动的语句结构。(2)发掘学术资源和潜在审稿专家。如,美国非盈利机构泰德(TED)旗下的话题分析工具彩虹人工智能(iRis.AI),通过对用户输入的语段或论文摘要进行机器学习(Machine Learning),从中提取包含语义背景的关键词,并基于此为用户推荐与被检索话题高度相关的资讯和论文。(3)辨别论文数据的可信度,辅助编辑制订用稿决策。如,通过扫描论文的关键信息点(实验环境、统计方法等),甄别数据篡改的可能。(4)通过算法自动向潜在读者推送学术资源。如,国际学术出版推广工具趋势(Trend MD)能实现论文跨平台自动推荐,不仅增强了期刊的显示度,还能精准定位目标读者群,已被爱思唯尔(Elsevier)、电气和电子工程师协会(Institute of Electrical and Electronics Engineers,IEEE)等采用。
具体到学术期刊传播流程,许多国际出版集团已实现与人工智能技术的融合。如,施普林格-自然(Springer Nature)的关联开放数据平台科研图谱(SciGraph)借助NPG本体(NPG Ontologies)进行语义建模,通过数据融合、知识发现、内容计算和语义图形数据集,提升论文在传播过程中的可获得性,为编辑、学者、会议组织者提供知识服务和数据工具[11];爱思唯尔收购了伯克利电子出版社(Bepress)的标志性产品——基于云的机构存储库平台数字共享(Digital Commons),该平台具备提供存储库、元数据结构、访问接口和跨机构聚合与发现等功能,有助于爱思唯尔掌握更多论文引证、论文传播效果方面的数据[12]。部分中国出版商也已运用人工智能技术提升学术期刊的传播效果。如,世纪超星公司推出的域出版平台,它具备学术期刊数据库搭建、移动出版、社交共享等功能,能通过智能画像了解用户特征,用算法实现动态精准推送,通过智能社交增强用户间的联系[13]。
1.2 人工智能在学术期刊传播中应用的优势
实现论文呈现多媒体化,优化内容分发,增强传播效果。一方面,学术期刊可通过智能语音和知识图谱技术,用适配多种设备的方式对论文进行再加工,增强论文的可读性,为论文增添音频和视频传播形式;另一方面,采用人工智能技术对用户研究领域、教育背景、阅读喜好、阅读完成度进行分析,可优化内容聚合和分发机制,解决信息过载与用户个性化需求间的矛盾。如,数据搜集公司图谱(Graphiq)已开发出语义搜索引擎知识图谱(Knowledge Graph),它允许用户根据话题展开搜索,获得相关主题的数据集,还能生成与报道内容匹配的可视化图表[14]。
辨别读者观点,评价和反馈传播效果。一方面,采用人工智能技术对用户阅读时长、用户社交分享等信息进行解析,可了解论文影响读者的具体方面和程度;另一方面,通过自然语言理解(Natural Language Understanding)、语音识别、深度神经网络(Deep Neural Networks,DNN)等技术,学术期刊能从读者在社交媒体上对论文的评价中,辨别读者观点,掌握比论文浏览量、下载量和被引频次更精准的学术反响。如,威盛电子研发的人工智能平台“欧拉密”,其能实现对90%的语言的语义理解,从而实现提问、信息记忆、知识辅助理解和歧义消除等功能[15]。
1.3 人工智能应用于中国学术期刊传播时存在的问题
人工智能技术与中国学术期刊传播的融合程度不足。国内学术期刊数字化传播的主要平台集中在移动App和社交媒体的嵌套程序中,文献聚合类App几乎被寡头垄断且功能有限,而各刊的主页网站大多仅承担投审稿和简单的宣传功能,各刊的微信公众号也大多未能做到细分传播,缺乏与用户的深度交互。相较于海外学术期刊数字化传播的实践,国内学术期刊的数字化传播存在传播渠道较窄、数据挖掘深度不足、分发不够精准、交互体验不佳、智能化程度较低、用户活跃度不高等问题。
智能化传播离不开元数据的可获得性,而数据库出版商共享信息的难度大,亟须建设共享性的学术期刊传播平台。在期刊传播过程中,智能检索、用户画像和语音识别等技术是基于大量元数据来开展的,这些元数据不仅包含学术资源、会议信息等公开数据,还包含用户身份、用户检索记录等隐私数据。虽然人工智能技术可跨平台获取部分公开信息,但隐私信息往往难以获得。一方面,当前中国学术期刊各自为政的问题较突出,许多编辑部往往只出版几种甚至一种期刊,合作共享信息的难度大;另一方面,中国学术服务市场中,中国知网、世纪超星、万方数据等占领绝大部分市场份额,其盈利性质和竞争关系决定了他们很难共享信息。因此,需要建设学界共享的学术期刊传播平台。
共享性平台的高用户黏性需要海量过刊资源作为支撑,而部分学术期刊尚未与中国知网解除独家合作协议。近年来,提升学术期刊影响力成为刊界热议的话题。与数据库出版商广泛合作、数字化传播、开放获取(Open Access,OA)等方式成为主流期刊的共同选择。2015年,世纪超星公司启动学术期刊域出版平台后,许多期刊先后与中国知网解除了独家合作协议,开始与各数据库出版商广泛合作,以拓宽传播渠道。为顺应刊界提升刊文可见度的需求,维普数据库也开辟了针对期刊、读者的双向免费合作模式。然而,仍有部分期刊尤其是自负盈亏的期刊尚未与中国知网解除独家合作协议,这意味着其协议期内的过刊暂不能提供给其他数据库。该问题的主要症结在于企业性质的编辑部需依靠发行收入维持运转。虽然平台并不要求成员期刊实现严格意义上的OA出版,它允许成员期刊通过发行纸刊创收,其成员期刊的出版成本也不一定以论文出版费的形式由作者预付,但与中国知网独家合作的发行收入是非独家合作的数倍,因此,在期刊转变为非独家合作的情况下,平台如何弥补成员期刊发行上的损失,需深入考量。
2 运用人工智能技术的学术期刊传播平台的设想
要充分发挥人工智能的作用,提升中国学术期刊的传播效果,需建构学界共享的学术期刊传播平台。本研究设计的集群式大型出版平台(图1),能服务于从内容开发到提供增值服务的全流程。
图1 基于人工智能技术的学术期刊传播平台
2.1 平台的流程设计
在流程前端,当学术论文入库后,平台将进行内容二次开发和管理。首先,平台为每篇文献的知识单元、作者信息、引文信息等元数据贴上智能标签,把文献内容碎片化后按知识类别归入子集。然后,平台根据论文内容向编辑部搜集或自动生成讲解视频,生成二维码附于论文首页。最后,平台一方面通过全文免费下载增加用户基数,扩大论文传播范围;另一方面通过知识梳理实现对论文价值的二次开发,提供系列付费增值服务,实现平台盈利。基于论文主题和关键词,平台聚合相近主题的文献,重组后形成专题域;对于学界高度关注的议题,平台将按专题提供精细、丰富的周边产品,如,围绕专题的付费问答知识库、论点溯源知识库等,为学者科研助力。在完成内容开发和管理后,平台根据用户的研究领域、所在单位和科研团队,自动生成符合用户喜好的定制化内容,充分开发学术出版的长尾市场。
在流程中端,平台采取参与+订阅的内容分发机制。首先,根据用户的阅读行为,发现用户阅读完成度高的时间段;然后,结合跨平台合作采集的用户社交信息,用思考式设备洞察用户的深层需求,形成智能化的内容分发规则,在用户阅读频率高的时段推送该时段用户阅读最频繁的内容。用户可通过读书笔记、论文评析等方式在平台内分享资源或跨平台分享到社交媒体,还可把书单共享给科研团队。除常规的内容分发外,平台还为用户提供基于文献的知识增值服务。一方面,平台通过追踪用户研究领域、所在单位和在研项目的最新成果,第一时间向用户提供相关资讯;另一方面,平台通过算法实现文献的彻底透明化,剖析论文研究方法并搜索数据源,为付费用户提供深度解析;此外,平台还通过机器人程序(Bots)提供围绕专题的交互学习模块。
在流程后端,平台用经验和代币激励用户参与,促进优质内容流转。首先,平台为用户搭建社群中心,连接期刊编辑部、作者和读者,为建设学术共同体助力。然后,平台根据用户的学缘背景、科研项目等信息,为用户推荐并协助用户创建学术社群。用户既可在平台内创建自己的学术博客,亦可加入各种社群。每个学术社群均有独立的主页,用于展示社群成员的科研动态。此外,平台还通过对用户检索字段、各社群活动的大数据分析,捕捉学术动态,发现学术热点,预测前瞻性选题,生成报告供付费用户查阅。最后,平台下设问答区和评价区,问答区提供票选议题、付费咨询、交互研讨等服务,评价区提供学术评价、学术监督等服务。除了线上服务外,平台还为学术共同体组织线下学术交流。
平台在创设初期即向提供过刊资源的编辑部发放等价代币作为经济补偿,代币可用于购买平台增值服务,如期刊发展报告、数字内容制作等;在后期运营过程中,平台向参与互动的编辑部、作者和读者发放代币作为奖励,这3类用户参与学术评价、学术监督、付费咨询和线下交流等活动均可获得经验和代币奖励。经验值用于提升用户等级,高级别的用户参与互动能获得更多代币。代币是平台结算的交易媒介,它在平台创始之初由平台建设者出资发行,在平台顺利运转后作为对社群有贡献的行为的价值证明,激励各方参与互动,提升平台的用户黏性。
2.2 平台的功能与预期效果
在内容开发方面:(1)平台根据文献主题和涉及的知识单元,自动检索汇集相关学术资源,便于读者理解论文;(2)平台对原始文献进行机器学习,将知识点单元化梳理归类并智能标引,形成对文献的二次开发;(3)平台一方面通过全文免费下载促进论文传播和知识流动,另一方面通过向用户提供付费下载的增值服务产品,实现盈利;(4)平台针对小众选题,提供限量学术产品(Limited-Edition Academic Products),这类产品能让平台适应学术出版领域用户需求精细、针对性强、个体差异大的特点。人工智能赋予平台的这些功能将增强学术期刊传播的趣味性和交互性,保障用户基数和盈利能力。
在内容聚合方面:针对用户研究领域细分的特点,平台利用内容通路,推行基于用户需求和社交关系的个性化内容聚合机制。在用户洞察方面,平台通过用户授权、与社交媒体合作获得隐私数据,通过概念提取、人物关系梳理、情绪分析等方式量化文本,推测用户的潜在需求,再通过场景耦合技术满足用户喜好,可实现“一对少”式出版(One-to-Few Publishing),这尤其适合小众学科的文献传播。综上,人工智能赋予平台聚焦长尾市场的能力,使平台比国内现有学术聚合App更具分众化的优势。
在内容分发方面:(1)平台通过对用户阅读习惯、阅读完成度的分时段统计,在不同时间段向用户推送不同主题的资讯,如,平台根据用户的入睡和起床时间,提前半小时推送用户喜爱的学术资讯;(2)平台为用户提供“文献+”服务,根据用户阅读完成度高的文献主题,智能推荐同主题或同作者的论文,以及该领域热度高的新文献和经典文献;(3)平台为用户提供“期刊+”服务,向用户推荐其研究领域的期刊征文信息和期刊目录摘要;(4)平台为用户提供“项目+”服务,根据用户在研项目和所在单位,推送小同行的最新成果;(5)平台还借助脑机交互(Brain-Machine Interface)技术,通过4D压感平台监测用户脑电波,捕获高频信号并将其转换为计算机语言,从而解放用户的双手。总之,平台采用多种人工智能技术优化用户阅读体验,提升传播精度。
在增值服务方面:(1)平台通过算法分析文献的创新点,解析文章观点的传承与发展脉络,实现文献彻底透明化;(2)平台通过数据挖掘,捕捉学术会议资讯并追踪会议动态,向期刊编辑部提供参会人员信息、会议新闻,辅助编辑约稿;(3)平台通过解析论文的研究方法和研究思路,辅助编辑和审稿专家辨别数据真伪,并向读者提供学术监督的渠道;(4)平台为用户提供从科研辅导到学术认证等付费服务,如,项目申报指导、专题学习计划,在细分学科中提供纳米学位(Nanodegree)等;(5)平台还通过对用户行为的分析,为用户推荐高效的作息时间,当追踪到用户的新学术成果时,提亮网页背景色以示庆祝。总之,平台不仅实现传播过程中论文价值的增值,还推出系列专业化的服务产品为科研助力。
在社群建设方面:平台根据用户的研究领域、学缘背景、所在单位和城市,建立关联度高、同质性强的学术共同体。(1)平台设置问答区,供读者与作者交流,在该功能区内,读者可票选感兴趣的议题,众筹创建“采访房间”,邀请名家互动;(2)平台设置评价区,通过语音交互(Voice Interfaces)和自然语言理解技术,实现读者对论文的便捷评价;(3)平台设置后台信息处理区,通过数据挖掘分析学术热点,预测学术前沿,实现传播对选题策划的反哺;(4)平台还通过组织线下学术沙龙、编研见面会等活动,促进学术共同体的交流。综上,平台不仅能丰富期刊传播途径,还有助于构建良好的学术交流环境。
2.3 平台的科学性和可行性
(1) 政府投入力度增加,行业标准趋于完善,试点应用逐步推开,这为构建平台打下人力、财力和技术基础。在2018年国资预算中,中央财政向中央文化企业注资15亿元,支持方向包括“人工智能+文化产业”“区块链+文化产业”等新技术和新模式[16]。在行业标准方面:2014年,《中国出版物在线信息交换》(ChinaOnlineInformationExchangeforPublications,CNONIX)国家标准正式发布,该标准可提供出版物产品信息深层次开发、利用、管理的数字化解决方案,实现出版物产品信息“一次加工,全程共享”,为构建出版发行大数据应用体系奠定了基础[17];2016年,“中国标准关联标识符”(China Standard Link Identifier,ISLI)正式发布,为自动识别技术、二维码融合等提供了技术支撑;2018年5月,CNONIX国家标准应用示范单位新增29家;2018年9月,《出版业AR技术应用规范》行业标准征求意见完成,进入送审阶段;2018年10月,21家出版发行单位成为ISLI国家标准应用试点单位[16]。
(2) 人工智能已在出版领域实现文献识别与开发管理、用户需求追踪和内容优化分发等功能,这为平台前端和中端流程的顺利运行提供了技术支撑。比如,斯坦福大学研发的知识发现工具“耶诺”(Yewno),它通过对知识的搜索发现知识间的关联,帮助用户发现跨学科知识的内在关联性,并能让垂直的知识图谱形成独立的出版物;它还通过语义算法等技术把出版物分解为独立的内容,形成细粒度高的知识结构,便于用户搜索和使用[18]。斯普林格与法兰克福大学合作开发了名为贝塔作家(Beta Writer)的先进算法,该算法使用聚类程序将源文档排列成连贯的章节,然后创建简洁的论文摘要,便于读者进一步研究[6]。在我国,百分点公司已开发出基于大数据操作系统的AI产品,如智能标签工厂、智能交互分析引擎等,能通过智能标签勾勒知识实体关系,把用户需求转化为底层数据,并用语音把分析结果呈现给用户,还能从语音数据中提取用户的基本信息和对产品的评价[19]。
(3) 人工智能已在学术传播领域实现人机互动,提供学术增值服务,这保障了平台中、后端功能的技术可行性。如,百科全书机器人司南君,它存储了《中国大百科全书》的全部信息,能实现人机互动问答[5]。自适应学习引擎松鼠AI能细分知识点,通过贝叶斯网络+推断+知识追踪的方式,针对性地辅导用户知识薄弱的环节,提高学习效率。泰勒-弗朗西斯集团与专利/学术论文在线搜索服务商UNSILO合作开发了 NLP 技术,它能从学术文本中提取主题和概念,根据用户阅读内容进行推荐,使用户更容易发现新研究[20]。
(4) 人工智能技术可实现论文内容可视化、立体化,并根据市场需求定制印刷服务,这为平台优化阅读体验、开发学术长尾市场提供了可能。如,以“可看、可听、有深度、有温度”为宗旨的视频医学期刊《中华心血管病杂志(网络版)》运用人工智能技术,用视频的方式呈现学术论文,实现了阅读场景立体化[6];咪咕阅读已实现多场景、多角色的智能配音,能借助全息成像、增强现实等技术为读者带来高品质的阅读体验;由高斯(中国)推出的“匯印e家智能化印机管理平台”,它集数据采集、远程控制、智能提醒功能为一体,通过互联网把生成的电子文件传到世界各地,再用AI分析处理,帮助企业灵活安排印刷量,还能在图书内容上提供定制化服务[21]。
(5) 平台通过发放代币激励各方参与互动,提升用户黏性。平台提供专业性强、比较优势明显的付费增值服务,能将读者、作者中的免费用户转化为付费用户。除了付费获取增值服务的快速途径外,闲暇时间充裕的免费用户亦可通过积极参与平台的学术互动获得奖励性代币,用于结算增值服务费。为平台提供过刊资源的编辑部亦可用平台补偿的代币购买期刊发展报告等增值服务。综上,平台一方面通过全文免费下载汇集人气,通过增值服务实现盈利,另一方面通过代币激励用户的参与行为。
《2017—2018年中国数字出版产业年度报告》指出,“数据和技术将推动产业升级,洞悉用户需求变得尤为重要,面向不同用户,以不同的触达渠道和应用场景满足多元化用户需求。算法、绘制用户画像和海量数据处理技术在数字出版业务流程中的应用将愈发普遍”。国家政策支持、行业标准成熟、AI技术发展、业界高度关注,为构建平台打下基础,平台有望在运营初期呈现良好的预期效果。
3 结合实例分析平台的创新性、可能遇到的困难及对策
通过对比国内领先的学术AI平台,可以发现本研究设计的平台在应用对象和效果、功能丰富性等方面具有创新性和先进性,但同时也可能遇到成本高、界面设计和数据存储难度大等问题。
3.1 所设计平台与“方正出版大数据平台”相比的创新性
北大方正集团于2012年开始研发人工智能学术出版产品,是国内学术出版界运用AI技术的领头羊。本研究设想的学术期刊传播平台与方正电子当前主推的出版大数据平台(以下简称“方正平台”)在设计初衷、关键技术和业务产品上有一定的相似性,如,两者的宗旨都是为出版全流程服务;两者所用的关键技术都包含自然语言理解、情感分析、机器学习、深度学习、读者画像、内容画像;两者都能实现用大数据辅助选题策划、XML排版、智能编校、内容动态封装等功能。但两者在运行原理、应用对象和效果、功能丰富性上有较多不同。
在运行原理方面,方正平台是先从电商平台、阅读平台、社交媒体上获取元数据,再进行模型计算和数据处理。这种运行机制的优势是节省了自建学术资源数据库的高额成本,使开发平台更简单快速,但劣势是,在传统销售模式下,方正公司很难从出版分销商处获得读者数据[22],出版企业的ERP(Enterprise Resource Planning)系统不一定能支持平台运行,闭源的排版软件与其数字出版流程也较难契合[23]。而本研究设计的学术期刊传播平台是先建设大型学术资源数据库,再分解元数据。相比之下,本研究设计的平台在学术资源的可获得性、学术信息的全面性、数据挖掘技术的有效性上,具有明显优势。
在应用对象和效果方面,方正平台的“知识体系自动构建”系统主要为出版社服务。它先通过文本关键词抽取、新词发现算法,辅助出版社实现领域词表的词汇来源建设,然后,利用领域词表的自动解析技术,帮助出版社完成专业词汇积累。方正平台推出的基于二维码和AR的图书增值服务,以及数字资源制作服务,旨在应用于图书增值场景和教学服务场景[24]。而本文设计的平台对知识片段的拆解、梳理与开发不仅服务于出版社,还服务于作者和读者等学术共同体。而且,由于平台自建库中有学术论文、用户注册和使用信息等数据,因此,相较于方正平台,本平台的知识分解与汇集能力更强,运行速度更快,推出的学术周边产品针对性更强,品种更全,更符合学术出版领域用户需求异质性大的特点。
在平台功能方面,除了两者兼具的热点追踪、精准营销和传播分析等功能外,本研究设计的平台在学术服务、社群建设方面具有方正平台不具备的功能,尤其是在学术问答、学术评价和学术监督等领域,方正平台尚未涉及。总之,方正平台主要着力于把出版内容数字化、多媒体化,旨在为出版社选题、编校和排版提供智能化服务;而本研究设计的平台除了能提升用户阅读体验、捕捉学术动态和预测前沿选题外,在知识拆解、人机交互、学术增值服务、建设学术共同体方面,具有显著的先进性和创新性。
3.2 平台建构过程中可能遇到的瓶颈及应对策略
平台架构庞大、功能丰富,给工程师与用户均带来挑战,建议做好需求分析,广泛征集业界意见。(1)在平台建设和调试过程中,由于系统工程师和网络架构工程师对学术出版了解不深入,因此,可能难以理解用户需求,导致平台功能难以完全实现,而刊界精通人工智能的出版专业人才较缺乏[25];(2)平台丰富的人机交互功能和多元化的业务产品对界面友好性、操作易用性提出了较高的要求,一旦界面过于复杂,用户可能难以适应甚至失去兴趣。这一瓶颈可在用户需求分析和用户反馈阶段前瞻地予以解决。平台一方面可聘请对学术出版和计算机科学兼有涉猎的需求分析工程师,以加深系统工程师和网络架构工程师对平台的认知;另一方面可向业界征集志愿者参与平台开发与调试,促进平台完善。
为调和平台对传统数据库出版商盈利模式带来的冲击,建议参考我国专利制度中的知识生产与传播体系,在搭建共享性学术期刊传播平台的同时,允许传统数据库出版商凭借其掌握的博硕士论文、年鉴、图书、音像等数据资源,参照汤森路透、戴芬(Delphion)等国际出版商和专利信息服务商的先进经验,开发具有比较优势的个性化学术产品,集成和提升其服务功能,使其与公共属性的数据平台错位发展[26],二者共同服务于不同用户的个性化需求。
建设平台自带的学术资源库成本高、耗时长,需要国家政策扶持、业界积极响应。中国科协对其旗下科技期刊的调查发现:在中国实现OA出版最大的困难是编辑部普遍不具备进一步开发网站、开发个性化服务的能力,缺乏经济支持[27]。虽然建设学术期刊传播平台自带的学术资源库并不要求成员期刊实现严格意义上的OA出版,但其最基础的环节是建设过刊库,这需要期刊编辑部积极提供过刊数据、接受新的合作模式。为解决该问题,一方面,平台为提供过刊资源的成员期刊发放代币,抵扣其购买影响因子报告等增值服务的费用,以弥补其在发行方面的经济损失;为成员期刊的作者提供免交论文出版费的替代方案,即作者可用参与平台互动获得的代币抵扣出版费(如参与平台后端付费咨询的答疑,提供规定数量的学术会议信息,担任学术评价和学术监督员等)。另一方面,期刊编辑部可效仿爱思唯尔,提供OA与订阅组合的多种模式,结合平台提供的备选方案,同时满足愿意付费出版的作者和倾向于免费出版的作者的需求。最后,建议中国政府参考欧洲开放获取S计划,通过公共财政、学会和慈善机构的支持,为平台建设和运营提供经费。
平台建构和运行过程中会产生大量跟踪数据和调试信息的文本,这对平台的数据存储能力带来挑战,可考虑用区块链(Blockchain)的去中心化存储技术予以解决。传统的中心化存储方式需要海量服务器,且成本高、数据传输速度慢、安全性较低,面临的隐私泄露和数据丢失风险较大。为解决上述问题,平台可采用星际文件系统(Inter-Planetary File System,IPFS),根据文件或数据的哈希指纹寻址链接来交换数据,实现网络去中心化,同时,使用去中心化存储项目Filecoin帮助IPFS节点存储、备份和提供内容,让创建网络价值的参与者获得利益补偿,从而实现去中心化的分布式存储,解决平台运行过程中面临的数据存储和隐私安全问题。
4 结语
在学术期刊传播领域,人工智能可识别用户需求,优化内容分发,提升传播效果,评价和反馈传播效果,但在中国学术期刊传播实践中,尚存在与AI融合程度不高、数据库出版商利益调和难度大、元数据获取难等问题。本研究设计的基于人工智能技术的学术期刊传播平台,在内容开发、内容聚合、内容分发、增值服务与社群建设上具有科学性和技术可行性,与国内领军学术出版AI平台相比,具有一定的创新性和先进性,但平台也面临着界面设计、运营成本、业界支持度、数据存储等方面的困难,需要国家政策支持和业界积极配合。本研究设想的学术期刊传播平台属于学理层面的探讨,在实践中的应用效果还有待检验。未来的研究可在此基础上,进一步探讨平台的运行细节、盈利能力和所需的关键技术。中国已进入智慧创造未来的新时代,人工智能已在内容生成、内容推送和读者交互等方面为学术出版注入新的活力。未来的学术期刊传播很可能是算法主导的,刊界能否实现从内容提供者到信息解决方案提供者的角色转换,将有可能是决定传播转型进程的关键。