做好教育数字化工作 推进知识服务与国际学术出版新变革
2023-05-30王建新
王建新
教育与出版总是紧密联系在一起,2月中旬,由教育部、中国联合国教科文组织全国委员会共同主办的首届世界数字教育大会刚刚闭幕,又迎来了中国数字出版博览会,这是落实党的二十大关于加快建设数字中国的重要举措。世界数字教育大会的主题为“数字变革与教育未来”,中国数字出版博览会的主题为“再出发 创未来”,两个大会的主题都聚焦未来,探讨数字化的未来发展。
● 建设教育强国的全新赛道和强大动能
推动教育数字化转型是贯彻落实科教兴国战略、人才强国战略、创新驱动发展战略的重要手段,也是推动中国式现代化的重要内容。2022年,教育部深入实施教育数字化战略行动,丰富数字教育资源供给,推动教育治理数字化转型,在数字教育的技术、模式、业态和制度创新等方面取得了丰硕成果。
国家教育数字化战略行动为建设教育强国开辟了全新赛道、增添了强大动能。中国教育出版传媒集团作为教育部直属企业,积极打造以数字教材为核心的数字化內容资源和产品体系,服务支持国家教育数字化战略行动,承担了高等教育智慧教育平台、职业教育智慧教育平台和17个子平台的建设和运维工作,以及中小学智慧教育平台的资源供给。
中国教育图书进出口有限公司(以下简称“中教图”)作为集团下属企业,积极融入国家教育数字化战略行动,大力推进数字化转型升级,汇聚优质学术图书、精品教材、最新学术论文,精心打造“爱学术”、“爱教材”、单篇文献服务(SOCOLAR)等数字化平台,各平台用户规模持续扩大、影响力持续提升,为高校科研机构文献保障提供专业服务,助力数字图书馆建设。
汇聚优质学术图书,建设“爱学术”平台。2017年,中教图自主研发具有创新功能的数字化电子书平台“爱学术”。坚持学术专业类图书定位,致力于引进和传播世界最前沿、最新的学术研究成果,更好地满足高校师生及科研人员对外文文献的多元需求。平台提供自主研发的知识图谱、知识发现、智搜服务、视频服务等功能。“爱学术”上线电子书超过46万余种,机构用户730家。
汇聚精品教材,建设“爱教材”平台。立足于教育部外教中心项目,于2016年启动建设,严格落实“引进境外优秀教材”的工作要求,坚持高标准甄选原则。由清华大学图书馆牵头12家外教中心,对标英美地区一流大学课程的教学实践,精选采选率高的教材引进。平台汇聚的教材绝大部分为国内独有资源,重点保障理工农医及管理类优质教材供给。“爱教材”上线电子教材万余种,机构用户198家。
汇聚最新学术论文,建设单篇文献服务(SOCOLAR)平台。中教图倾力打造的中国学术资源一站式服务平台,为广大教育科研用户提供开放获取期刊、商业学术期刊及全文文章检索、浏览、获取等一站式服务。单篇文献服务(SOCOLAR)平台上线全学科学术文章近7000万篇,机构用户超过300家。
该平台经过多期迭代建设,已实现单篇付费、开放获取、学术支付(SOCOPay)、作者服务等功能,采用自主开发的自动分类技术,并与百度学术、百度文库建立了战略合作关系。与威利出版集团、世界科技出版公司等国际知名出版机构合作,打通了OA文章发表费用(APC)的境外支付通道,为统筹开放获取文章发文经费管理,引导科研工作者把论文发表在更有价值、更精准的期刊上提供支持。
● 知识服务发展趋势
当前世界形势更加复杂多变,百年变局与世纪疫情交织影响,数字化转型加速演变,新变化、新挑战不断呈现。
数字化进程加速。这方面主要表现为国际期刊出版已基本转向数字化,电子图书出版稳步增长,开放获取(OA)正成为新的重要学术交流形态。中教图进口的数字文献资源业务比重逐年上升,2022年已超过84%;国内高校图书馆电子资源购置费已占据文献资源购置费支出的60%以上,并呈现逐年上升的趋势;用户对文献的获取已经从单一的图书馆借阅,向以数字资源自主获取为主、图书馆借阅为辅转变;文献引进工作的质量评价已从纸质文献服务的传统衡量指标扩展到数字化服务体系、数字资源集成能力、服务理念和服务手段诸多方面;在线教育产品形态、服务模式不断完善,在线课堂、智慧图书馆成为新的发展趋势。根据中国高校图书馆数字资源采购联盟(DRAA)2022年发布的报告显示,高校作为全球学术出版最大的采购主体,其采购的在线知识服务产品中,传统电子书刊加起来接近50%。
文献本地化长期保存不可缺失。随着我国科技创新能力的不断提升,“文献安全”“数据安全”“使用安全”被提到前所未有的高度。一方面,西方利用自己掌握的话语权,将一些影响国家文化安全的内容通过数字形式输出渗透到国内,给国家意识形态安全造成极大隐患;另一方面,建设社会主义现代化强国需要借鉴利用西方高科技成果,但一些涉及高科技的重要文献的引进使用受到西方国家的制约。2018年以来,部分中国高校科研机构被美方列入出口管制“实体清单”,部分数据库对名单中的中国机构、企业和学校停止服务。俄乌冲突爆发以后,Web of Science数据库停止了来自俄罗斯的访问服务。因此,加快推进数字资源长期保存和服务系统建设,实现文献资源的长期保存和可持续更新,增强抵御风险的能力,已经变得越来越迫切。无论是印本,还是数字文献,特别是一流学科建设、关键研究领域、前沿技术领域等创新驱动发展需要的文献资源,实现本地化长期保存势在必行。
文献需求日趋多样化。高校和科研机构除传统的报纸、期刊、图书、音像等文献需求外,已从通用资源的收藏向特色资源、个性化资源收藏转变。对特藏文献、电子教材的需求逐步增加,对新媒体、科学数据、富媒体学术资源、事实型数据资源等新兴资源的需求日趋增长。如中教图独家代理的JOVE视频类期刊数据库,主要是生物、医学、化学等学科的实验论文,以“视频+文字”的形式呈现给读者,使读者能更好地理解和掌握实验步骤和方法。
文献服务向知识服务纵深发展。根据国际科学技术和医学出版商协会(STM)2021年报告,2020年数字内容占当年科技出版市场的89%以上,比2019年增加了10%,2019年这个数字是77%。用户对文献资源的需求已经不再满足于一般性的文献索取,而是需要从信息搜索、全文获取到知识获得的智慧服务,文献服务机构不但要提供文献资源聚合服务系统,还需要提供基于概念实体识别及语义关系抽取、知识计算技术、自动分类、跨语种跨媒体关联融合等方法和技术构建的知识库、知识服务、可视化交互等服务。
● 知识服务实践
“十三五”以来,中教图顺应数字化发展潮流,大力推进“数字行动”,坚持“需求牵引、应用为王、服务至上”的建设思路,开发建设了多类型知识服务平台和项目,涵盖海外学术图书、经典教材、专业文章等各类型数字化资源,通过多类型服务为国内高等院校、科研机构、企事业单位等提供专业的海外文献资源综合保障,支撑国家世界一流高校学科建设,服务国家重大科研攻关、技术创新需求。
资源评价,助力学术内容精选。外文学术资源的引进,一直采用“精选”模式。一方面,西方对于知识产权极为重视,保护意识很强,无论是书、刊还是数据资源都定价高,通常是同类型中文内容价格的好几倍甚至几十倍;另一方面,国家财政对于教育和科研的经费保障有限,文献采购经费仍不足,上述两者之间的矛盾,导致在采购境外学术资源时必须进行优选。
如何实现“优选”呢?一是充分利用专家资源,比如“爱教材”平台对于电子教材的选择,就是充分利用高校专家团队的专业能力,选择高品质、高价值的教材。二是利用大数据、云计算等技术,通过科学的算法對资源质量进行评价,在“爱学术”平台上可以看到每本书的权威度分值,这是利用自然语言处理技术实现对知识内容的分析和计算的,这一整套计算方法、系统和装置在2019年获得了国家知识产权局颁发的专利证书。在此基础上,综合馆藏、评论、引文等多维评价指标,进一步优化“核心书目”的推荐办法,帮助国内用户优选图书资源。
人工智能,实现文献自动分类。海量知识内容的组织、发现,需要借助人工智能的力量使其更加科学和有效。单篇文献服务(SOCOLAR)平台收录超过7000万篇文章资源,不可能全部由人工来进行篇章级的分类。随着AI技术的日渐成熟和广泛应用,中教图在平台上应用了基于卷积神经网络的深度机器学习技术,通过大量的语料库训练,实现大规模的篇章级文献自动分类。
知识图谱,构建智慧搜索系统。AI分类、资源评价都是利用技术手段增强对文献知识内容的识别、挖掘和判断,在此基础上,好的知识服务还要解决知识发现、智能服务的问题。大家平时在网上搜索内容,常常会被两个问题所困扰:一是搜不到想要的结果;二是想要的结果没有排在第一页。在学术内容服务领域,同样存在这样的困扰。所以中教图追求智慧平台、智能服务,希望通过知识挖掘和智能呈现技术,实现文献的精准定位和优先推送。2022年中教图上线了智搜平台,运用语义网、知识图谱和人工智能技术,对近50万种电子书进行全内容知识挖掘和发现,将多源异构的知识统一成同构知识网络,并利用可视化技术将知识及其关联关系推送给终端用户。
合规安全,确保用户放心使用。中教图各知识服务平台引进、上线境外文献资源均与相关出版机构、代理商签署合法的书面授权协议,严格排查和规避与产权来源不清晰的问题机构合作,确保所有引进的电子书、电子教材及文章来源合法、版权清晰。各平台严格遵守知识产权规定,采取了一系列知识产权保护措施,包括数字版权保护技术(DRM)、用户授权控制、水印保护、流量实时监测等,并建立应急预案,严密防范发生非法获取和恶意传播文献的行为。
公司建立了完善的内容审核机制,严格排查意识形态风险,各平台引进的所有境外文献资源均进行上架前的内容审读和上架后的实时监控,严格保障上线资源的内容安全。
中教图各知识服务平台系统所有资源均采用本地存储策略,确保所有数字资源存储于国内本地服务器,且通过审读系统核准后对外发布访问,访问稳定、快捷,以保障外文学术内容合法合规及使用安全。
中教图始终坚持“专业、高效”的服务方针,支持国内教育科研文献保障需求。从2016年至2022年,公司连续六年获得中国高校图书馆数字资源采购联盟(DRAA)年度代理商满意度综合评分第一名,荣获第十届、第十一届数博会“优秀服务供应商”,荣获2021年度“全国优秀图书馆数字内容供应商”称号。
● 积极应对开放出版、开放获取带来的新挑战
开放科学正在成为新的学术交流模式和学术研究范式。开放出版、开放获取作为开放科学的重要组成部分,已经获得全球学术界、出版界、图书情报界的普遍共识。开放出版、开放获取将对未来学术出版乃至文献服务方式产生革命性的影响,引领未来学术出版新变革。
从国际来看,全球学术出版巨头中,Springer Nature有2000种期刊可选OA,其中600种期刊完全OA出版;Elsevier有2700种期刊可选OA,其中300种完全OA出版;Wiley有79种期刊完全OA出版;Sage有205种期刊完全OA出版;Taylor & Francis 有190种期刊完全OA出版。
从国内来看,国内出版社的开放获取发展推动进程相对缓慢。据2021年《中国科技期刊引证报告》及中国科技论文与引文库(CSTPCD)统计,中国自然科学领域有2084种期刊,社会科学领域有397种,共计2481种。截至2022年7月,DOAJ上以“country of publisher”确定的我国出版的开放获取期刊仅193种,仅占全部期刊比例的7.77%,国内开放获取出版进程与国际相比尚存在较大差距。
根据WOS(全球知名引文索引数据库Web of Science)近五年的论文发表数据显示,全球OA文章量占比从2017年的36%上升到2021年的44%;中国作者发表的OA文章量占本国全部发表文章量的比例,也从2017年的31%上升到2021年的38%。
面对国外开放获取如火如荼的发展态势,国内越来越多的学者被开放获取模式所吸引,我国OA文章在国外期刊上的发表量也在逐年增长,打造健康合理的国内开放获取生态迫在眉睫。目前,国内在开放获取建设上还存在许多不足,主要表现为缺乏OA发展政策、OA期刊建设不足、缺乏集中的全文本地化仓储平台、存在意识形态风险、国际学术传播话语权不够等。
一是建议国内出版界加强模式探索。尽快研究新的OA商业模式、新的同行评议方法、新的科研合作伙伴关系和交流模式。要借助数字技术、数字经济的发展利好,积极开拓新的学术成果发表和传播路径,将重心放在论文的创新水平和科学价值上,强调新技术、新产品、新工艺应用于产业化的实际效果。
二是建议产业界加强知识服务建设。开放获取生态带来许多知识服务创新空间。新的出版、交流、合作模式必然产生新的流程、交互和信用体系,每个环节都需要创新知识服务的方式方法。在这方面中教图也在做一些尝试,单篇文献服务(SOCOLAR)平台包含了近2000万篇的开放获取文章。通过平台的建设和技术投入,实际是在做内容发现和OA仓储的工作,已解决OA文章发表过程中跨境支付(APC)和税务合规的问题。未来,还有学术评价、经费管理、科研管理等一系列的工作要做,政府、社会和更多的学术行业从业者应共同参与进来,去探索、创造一个健康的、可持续的开放获取和开放科学生态系统。同时,健全科技评价机制、加强学风建设、积极推进全方位的科技开放措施,实施更加开放包容、互惠共享的国际合作战略。
作者系中国教育图书进出口有限公司总经理