从数字化到数智化,智能技术赋能出版融合创新
2022-04-27刘长明
【摘 要】 出版业数字化转型经历了“互联网+”产品和服务创新转型阶段,现在正进入以大数据、人工智能驱动的数智化时代。从产业维度看,这标志着数字化转型从“互联网+”进入“智能+”时代。这个阶段是出版业基于智能技术与其他产业深度融合的过程,通过创新技术,提升全要素生产率,实现供给侧结构性改革。一是工具革命,从传统工具到智能工具;二是智能技术赋能产品服务创新,从单一图书出版到多元化复合出版,从图书出版向知识服务平台创新,从文本向视频化、有声阅读、AR/VR等多产品形态发展;三是数据赋能,实现智能出版向智慧出版转型。
【关 键 词】出版;数智化;智能技术;数据赋能
【作者单位】刘长明,北京北大方正电子有限公司。
【中图分类号】G230.7 【文献标识码】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2022.06.006
2022年是“十四五”规划的第二年。“十四五”时期,经济发展的主题是高质量发展,由规模扩张模式全面转向更加注重质量、效率、效益的发展模式。实现经济高质量发展,要把重点放在推动产业转型升级上,而实现产业转型升级,则需要培育新动能。从培育新动能维度看,科技创新是重要突破点,以信息技术为基础的科技创新正成为驱动产业发展和变革的新兴力量;从全球产业环境看,伴随着移动互联、大数据、云计算、人工智能、区块链、5G等智能技术的发展,尤其是这些技术的叠加与融合,我们正迎来新一轮科技革命;从新一轮科技革命看,数字化、网络化、智能化是突出特征,也是新一代信息技术的核心。
新一轮科技革命给产业融合发展带来了新的契机,信息技术与经济社会的深度融合,是未来十年的发展主线,也是数字经济发展的基础。以移动互联、大数据、云计算、人工智能、区块链、5G为代表的新一轮信息技术正推动全球产业进入数智化时代,各领域企业均开始布局数智化转型升级。
一、企业的数智化转型
企业数智化转型大多从信息化、数字化逐渐演进到数智化。信息化阶段,主要是计算机在企业的应用、IT基础设施建设以及围绕ERP、CRM等信息化应用;数字化阶段,互联网、大数据、云计算技术渗透各行各业,其核心特征是数据驱动;数智化阶段,智能技术产业化,实现“AI+数据智能化应用”“AI+服务创新”。数智化的主要特征有两个方面:一是在大数据、云计算等数字技术的基础上,开始应用机器学习、深度学习、知识图谱、RPA等AI智能技术,实现多技术融合发展;二是数智化更注重数据的应用,数字化的重点是用数据来体现业务,而数智化的重点是让数据反馈业务,赋能业务和管理。
企业数智化转型升级就是企业利用等智能技术进行业务流程的优化与重塑,通过深化智能技术在生产、运营、管理和营销等环节的应用,实现企业数字化、网络化、智能化发展。
二、数智化转型是出版融合的发展趋势
2010年1月,新闻出版总署印发《关于进一步推动新闻出版产业发展的指导意见》,其中明确指出:“积极发展数字出版、网络出版、手机出版等以数字化内容、数字化生产和数字化传输为主要特征的战略性新兴新闻出版业态。” 2014年4月,国家新闻出版广电总局与财政部联合发布《关于推动新闻出版业数字化转型升级的指导意见》,极大地推动了新闻出版业数字化转型升级的步伐。经过多年的探索和发展,出版业在业务流程优化、产品和服务创新等方面取得了许多重要成果,也建立了一些数字化内容生产、传播、服务的标准体系和规范。2020年,以5G、云计算、大数据、人工智能、物联网和区块链为代表的新一轮技术,带动全球进入产业数智化时代,中国出版业数字化转型也开始从数字化进入数智化新阶段。《出版业“十四五”时期发展规划》强调,要突出科技创新在推动出版业数字转型升级、实现深度融合发展中的重要作用,大力推动5G、大数据、云计算、人工智能、区块链、物联网、虚拟现实和增强现实等技术在出版领域的应用,推动国家出版发行信息公共服务平台的应用。可见,出版业融合发展已融入新的技术发展和产业变革中。
在新一代信息技术与产业深度融合中,出版业融合发展将进入新阶段。一是内容生产数字化,将数据作为生产要素;二是产品形态持续创新,除传统纸质图书外,电子书、有声书、视频、AR/VR、数字阅读、知识服务等多产品形态不断涌现,内容知识化趋势明显;三是内容传播全渠道化,尤其随着智能技术的发展,内容传播趋向移动化,同时还将与物联网结合,传播渠道、服务渠道更加广泛;四是全面发展数字内容产业,从图书出版到打造多元IP,延伸至游戏、影视、动漫等跨领域内容产业。
目前,出版融合正向纵深方向发展,我国出版企业模态持续进化。从媒介看,单介质出版向多媒介出版发展;从出版流程看,一次出版向可持续出版发展;从模态看,静态出版向动态交互出版发展;从编辑加工流程看,传统内容制作流程向全流程数字化制作流程发展;从产品形态看,单一图书出版向多产品形态发展;从自身定位看,图书出版商向知识服务商发展;从业务边界看,单一书刊出版领域向跨领域出版和数字内容产业迈进。可见,出版业模态进化是落实数字化转型战略的重要体现。
三、智能技术全面赋能内容生产和传播服务
在数智化阶段,智能技术将与内容产品服务创新及业务流程优化等场景进一步融合,全面赋能出版业全链条、全场景的转型升级,依托新技术建立一体化内容协同生产传播新体系,进一步释放内容生产力。数智化阶段有以下特征:一是以智能技术变革生产工具;二是以数据资源为关键生产要素;三是以数字内容重构产品结构;四是以信息网络为市場配置纽带;五是以服务平台为产业生态载体。从数字化到数智化,智能技术将是内容产业和出版融合发展的新动能。
智能技术给出版融合创新带来了新变化,促使出版内容生产和传播服务实现智能化。在智能选题策划环节,依托大数据人工智能技术辅助选题策划。选题策划是图书出版的基础和关键,传统出版流程中的选题策划主要依靠图书策划编辑的经验积累,如今则可以通过大数据和人工智能等技术挖掘潜在读者及其感兴趣的知识和话题,采集分析热点话题和同类选题图书数据,辅助图书策划编辑做好选题方案。在智能辅助内容生产环节,知识图谱、人工智能将赋能内容生产,主要应用场景包括机器写作、智能排版、知识图谱及知识体系智能构建、音视频智能生产(如音视频智能转码拆条、实时语音识别、语音文件转写、视频语音转写等)。在内容智能审核环节,将智能技术应用于内容风险控制领域,依托自然语言处理、跨模态的音视频识别等技术,实现内容文本、图片和视频的智能审核,可将智能比对技术用于内容校对环节,实现机器辅助校对。在内容管理环节,利用多模态智能检索技术,实现文本、图片、音视频的智能检索服务,依托知识图谱技术构建知识体系。在内容智能分发环节,依托大数据、人工智能等技术构建用户画像和用户行为,实现内容个性化分发;依托大数据、人工智能等技术构建编辑画像,为编辑推荐相关内容。在内容智能传播分析环节,依托大数据和人工智能等技术,监控网站、客户端、微博、微信、头条号、抖音等新媒体发布渠道,掌握发布平台的发稿数、原创数、转载媒体数、转载次数、原创比例、传播热榜、重点栏目、传播地域分布等。在智能营销环节,通过分析用户需求,根据自身所能提供的资源和服务情况,运用算法、模型将用户需求和资源服务进行匹配,实现精准营销。
目前,国外很多出版商已将人工智能应用到内容生产传播等环节中。施普林格·自然积极探索人工智能的应用,在2019年出版了第一本由机器生成的书籍——《锂离子电池》,该书是人工智能总结的锂离子电池领域近3年的突出研究成果的摘要,概述了锂离子电池领域的最新研究进展。2021年,施普林格·自然又利用人工智能出版了一本新书——《气候、行星和进化科学:计算机生成的文献综述》。爱思唯尔也在积极运用机器学习和自然语言处理(NLP)技术更好地服务科学家、工程师,帮助用户更快地找到相关内容。
四、智能技术赋能出版融合发展
随着新一代信息技术发展及出版业的数字化转型进入数智化阶段,大数据、人工智能等技术开始应用于出版内容生产各环节。
1.人工智能、大数据技术赋能图书内容生产
业务流程数字化与智能化是数智化转型的重要方向和转型重点,依托人工智能可构建智能编校排一体化的出版业务流程。目前,多数出版单位的内容编审环节还是纸稿流转、人工排版、人工校对的生产模式占主流位置。但在2020年新冠肺炎疫情期间,传统出版业务流程的生产能力不足等劣势凸显,推动出版单位重新审视数字化能力,依托数字技术重塑出版业务流程。出版业务流程重塑是为了应对经营环境的变化和变革,出版企业对出版业务流程进行根本性再思考和彻底性设计,将可以在出版质量、效率、成本和服务等重要指标上取得显著性提升。智能编校排一体化出版业务流程就是将人工智能与内容编校排有机结合,实现内容编辑加工流程全数字化。我国很多出版单位构建了智能编校排一体化平台,如上海辞书出版社《辞海》第七版工具书编纂平台、中国电力出版社协同编纂平台、中国标准出版社智能生产平台、东北财经大学出版社智能生产平台、重庆大学出版社协同编纂平台等,这些平台基于XML结构化数据标准,以内容编校排为核心,应用人工智能集成智能审校、智能排版、智能校对等工具,实现内容数字化编纂、审校、管理和动态出版的全流程数字化。
如上海辞书出版社和北京北大方正电子有限公司(以下简称方正电子)共同开发的《辞海》第七版工具书编纂平台,旨在为作者、编辑、审校人员及管理人员等提供统一的编辑平台。平台集成了包括在线编辑、智能编校、知识图谱构建、XML智能排版、在线发布等子系统(见图1)。
2.人机协同的内容智能审核,将智能技术应用于内容风险控制领域
在数智化转型和媒体深度融合背景下,内容安全成为数智化战略的“方向盘”。采用多模态(音频、视频、图片、文字)分析技术,可以对内容实现全面的风险监控和智能审核。基于文本的智能审校工具利用人工智能、机器学习、大数据等技术,能够对编审内容进行智能审校处理,完成文章逻辑检查、上下文查重、易错词检查、敏感词检查、连接符号检查、全半角价差、千分位检查、格式检查、知识性审校等工作,帮助编辑高效、准确地检查并处理稿件错误之处,提高编辑审稿效率,确保查全率和准确率;辅助编辑发现知识相关、格式相关、语境相关等疑难问题,提升内容质量。
基于图像、音视频的识别技术可以实现政治敏感图片识别、敏感人物识别,图片不良场景识别、广告监测,同时对音视频中的语音、画面进行智能检测和过滤。方正电子借助大数据与人工智能等技术的创新实践,面向新闻出版产品的质量管理需求,打造了智能内容审核及风控监管平台,助力出版内容生态良性发展。
3.基于XML智能排版将应用于内容排版环节
XML智能排版工具依托结构化识别技术、XML排版技术将word文件结构化,不仅可以自动规范整理稿件、高效自动化排版,还能提供丰富的版式,实现PDF、EPUB、HTML、XML等多格式数据同步输出,大大释放了人工生产力,提高了排版效率。目前,智能排版技术已进入产业化应用,在方正电子推出的方正学术期刊出版云服务平台上,已有300多种学术期刊使用XML智能排版工具进行内容生产。
4.知识图谱技术广泛应用于知识库构建及知识服务产品创新
知识是企业智能化转型升级的关键,人工智能算法可以使机器从海量数据中高效汲取知识成为可能。知识图谱分为通用知识图谱与行业知识图谱。行业知识图谱是面向专业领域的专有应用,基于行业知识构建(如金融、医学、公安等)知识库,行业知识图谱对各垂直领域的细分场景更能凸显价值。以知识图谱、自然语言处理、语音、视觉等人工智能技术为核心的新一代智能技术,能够帮助出版行业构建领域知识图谱、事件图谱、多模态知识图谱。依托知识图谱,出版单位可通过搜索、推荐、问答、推理、可视化等方式高效地实现知识应用。
目前,出版单位正从图书出版向知识服务商转型,通过盘活存量资源、整合增量资源,利用知识图谱技术构建知识体系和行业知识图谱,打造面向不同领域、基于多应用场景的知识服务产品。如专业数据库、特色数据库、知识问答、数字图书馆、移动APP、微信应用等多端应用,为受众和更多机构提供多形态的知识服务产品。知识图谱核心技术在出版业的应用趋势将以大数据采集、知识体系建设为基础,以知识自动标引为关键,以知识计算引擎和知识服务关键技术为枢纽,构建行业知识服务生态平台。
5.智能技术的发展让内容形态多元化、立體化
随着融合出版的深入发展,内容产品形态更加立体化,更具交互性。随着互联网打破传统出版物对内容形态的束缚,文字、图像、视频,以及包括VR/AR等新元素已成为出版内容表达的重要因素,多模态内容呈现给用户带来了更多感官体验。随着智能技术的发展,未来元宇宙将越来越频繁地出现在人们的视野里。元宇宙形态的诞生其实是基于人工智能技术的成熟应用,随着这些新兴技术成熟度的提升,元宇宙有望逐步从概念走向现实,成为数字化转型的新路径之一。
五、结语
未来,数字技术将进一步重塑出版生态,出版数字化、融合化将向纵深方向发展,走向数智化。一方面,从内容生产出发,对内容生产的重点环节进行数智化改造,提升出版质量、出版效率、数字化运营能力,进而延伸到客户侧的数字化;另一方面,从读者和受众需求,依托平台构建连接和服务,以平台产品聚合生态,发展出版新业态、新模式,不断通过数字化营销、线上服务、电商服务拓展渠道和用户群,形成“内容+关系”“内容+服务”的新生态,以提升出版单位自身的发展韧性,并传导业务生产侧的数字化,实现更柔性的按需出版。
在从数字化向数智化演进中,出版单位应注重“数据+AI”双中台建设。通过双中台体系作为连结上层业务与底层技术的桥梁,整合数据孤岛与智能技术孤岛,直接为上层业务应用提供支撑;收集业务应用实际产生的数据,逐步完善底层技术,为用户提供不间断的数据和资源支撑;积极拥抱智能技术,推进智能技术与产业深度融合,通过技术赋能提升内容出版全要素生产率,助力出版业实现高质量发展。