APP下载

面向数字出版的智慧阅读研究

2024-01-11钱毅李强

出版广角 2023年22期
关键词:语音智慧数字

钱毅?李强

【摘要】智慧阅读是传统阅读与数字阅读的新生态,它是内容组织、阅读方式、阅读过程全智慧化的阅读生态系统,系统连接数字出版内容供给、消费和阅读空间,为读者提供高质量的智慧阅读服务。通过数字出版资源智能组织、脑机协同的智慧阅读方式、虚实结合的智慧阅读环境的构建,智慧阅读既为读者带来了精准化、个性化、多元化的阅读内容以及沉浸式、交互式、立体化的阅读体验,丰富了全民阅读阅读形式和场景空间,提高了全民阅读内容质量对提升全民阅读素养具有重要作用。

【关  键  词】数字出版;数字阅读;智慧阅读;全民阅读

【作者单位】钱毅,南通大学文学院;李强,南通大学图书馆。

【中图分类号】G239.2【文献标识码】A【DOI】10.16491/j.cnki.cn45-1216/g2.2023.22.012

随着数字出版的兴起与快速发展,阅读的内涵和特征发生了巨大变革,数字阅读成为全民阅读的主要方式。根据第二十次全国国民阅读调查,2022年超过80%的用户利用网络媒介、软件和手机进行在线阅读,人均电子书阅读量达3.33本,10年来持续增长。科技创新应用使阅读变得日益便捷、个性化和富有吸引力,读者可创建个人书房和书架,邀请好友共读,并实现随时随地阅读[1]。数字出版丰富了阅读文本,拓展了阅读空间,增强了阅读体验,同时也带来许多问题。

一是数字阅读浏览性、碎片化特征明显。阅读时间和内容碎片化导致浅阅读时长增加,不利于读者深度阅读,难以引发读者深入思考。二是数字阅读的娱乐化倾向严重。读者使用手机进行阅读时会在多个任务之间不停跳转,偏好多重信息流动,这对传统深阅读模式造成强有力的冲击[2]。三是数字阅读存在内容质量偏低、受众版权保护意识不强等问题[3]。解决这些问题需要数字出版、数字阅读和信息技术的深度融合,创新数字阅读模式,利用大数据、物联网、人工智能等技术手段,丰富传统纸媒阅读的内容和形式,实现传统深阅读模式在网络时代的功能延伸与创新发展,这也是深化全民阅读活动的重要实践手段。本文在阐明智慧阅读的含义的基础上,分析智慧阅读与数字出版的关系,进一步探讨面向数字出版的智慧阅读生态系统功能的实现和未来发展方向。

一、智慧阅读的含义及理论基础

“智慧阅读”的概念目前尚无准确定义,“智慧”在《汉语大词典》中被解释为“分析、判断、创造、思考的能力”,智慧的本质是人脑创新思维的能力。“阅读”,是对文本进行解码和理解的过程,阅读本质上是一种主动获取信息和知识的活动。将“智慧”与“阅读”结合就赋予了其新的含义——智慧是阅读的方法、策略、状态、要求,阅读是基于智慧的行为,阅读的目标是启迪思考、成长智慧。因此,人们在阅读过程中可形成相对稳定的思维能力。

有学者提出智慧阅读是人机智慧协同支持的服务,通过智能搜索理解、分析、感知内容信息,实现个性化精准推送[4]。也有学者提出构建智慧阅读体系可实现读者阅读能力与智慧阅读媒介平台交融互动[5]。智慧阅读目前还是一种理念,是一个发展的概念。本文认为,在数字出版环境下,智慧阅读是基于脑机协同实现的阅读内容组织、阅读方法、环境过程全智慧化的阅读生态系统,系统融合了数字出版、读者、物联网,在虚实结合的物联网环境下,系统连接数字出版内容供给、消费和阅读空间,全流程为读者提供高质量的阅读内容推送、个性化智慧阅读方法、交互性阅读设备和虚实结合的阅读体验。

智慧阅读是脑科学研究理论的重要探索与实践。脑科学实验表明,人脑的左侧半球侧重于抽象思维,具有语言识别、判断和逻辑分析等阅读理解的功能。人在阅读文本时,左侧文字投射到视网膜右边,传输到大脑右半球的视觉区域,再通过连接左右脑的胼胝体传输到左半球,激活被称作阅读脑区的左腹侧枕-颞区,对文字的视觉形态进行辨别,然后将视觉新信息传递给左半球各处区域,再分别对字词的意义、语音进行编码,阅读的学习过程就是视觉区与语言区之间建立有效连接的过程[6]。传递到阅读脑区的次数增多,激活度就会变强,该区域的反映也会更加灵敏。通过缩短阅读通路,加强阅读脑区,激活阅读脑区发出的信号,会进一步激活附近的创造性思维脑区[7]。脑科学理论为机器阅读提供了理论基础和科学依据。计算机深度学习就是模仿了脑神经元的结构建立神经网络模型,脑神经元之间的连接因粗细不同而产生不同影响,神经网络模型中每个输入输出之间的连接都有一个权重,神经网络的训练算法就是將每个神经元模型的权重值调整到最佳,使得模型预测效果最好[8]。将神经网络模型运用到智慧阅读中,计算机可按照文本顺序来学习连续文本中的语义,发挥海量文本的模式识别、词语自动标记、主题情感分析、语音识别、图像识别等学习功能。

二、智慧阅读与数字出版的关系

传统阅读与出版之间是一种需求与供给的关系。人类的文字创作和阅读需求催生了出版活动的兴起与发展,出版业的快速发展又不断推动阅读方式的变革。数字出版是传统印刷出版的全数字化流程[9]。智慧阅读作为数字阅读的新模式,与数字出版的关系呈现共生交融与良性互动的发展趋势。

从阅读与出版共生发展的历史来看,数字出版的现代化历程与智慧阅读发展共生交融。智慧阅读是伴随着数字出版发展现代化进程而产生与发展的,数字出版的初衷是便利阅读服务。从印刷出版到数字出版,再到智能出版,无论是内容创作、载体演变还是阅读模式创新,服务读者、便利阅读的宗旨始终不变。邹韬奋先生提出的“竭诚为读者服务”深刻诠释了二者的共生关系[10]。智能化的数字出版平台将人工智能融入内容创作、编辑、出版、发行、阅读推广模块,满足不断变化的阅读需求。在出版生态链中,智慧阅读成为数字出版的消费链,二者共生交融。与传统出版相比,数字出版更加重视迎合读者兴趣和阅读载体的多样化体验,通过构建智慧阅读平台,引领智慧阅读模式的创新与发展。交互性泛读、遥读、写读、听读、沉浸式全息视读等智慧阅读模式极大地提升了读者的阅读体验和阅读兴趣。

从阅读与出版的价值链角度来看,智慧阅读与数字出版在促进全民阅读的过程中呈现良性互动。一方面,数字出版通过内容聚合、精准推送、智能语音、全息影像等应用吸引读者,扩大了全民阅读的范围,读者的数字资源阅读时长显著增长。另一方面,读者对多模态资源需求和多元化智能消费体验的增长将极大促进数字出版的媒介融合与增值服务[11]。与此同时,日益丰富的数字出版内容与多媒体的载体形态,催生了多样化的智慧阅读功能和创新模式。智慧化阅读模式实现了阅读的场景化,增强了阅读的互动性,带来了社群化阅读、虚拟社交式阅读、游戏阅读、数字人阅读等新的功能体验。数字科技在阅读中的广泛应用倒逼数字出版跨媒介深度融合,尝试多元文化的整合方式,聚合不同平台的多模态数字出版资源,在内容创作和载体呈现等方面不断创新,以“深度学习+知识服务”实现数字出版资源价值拓展,助推智慧阅读功能创新,提高全民阅读的深度与广度。

三、面向数字出版的智慧阅读生态系统

智慧阅读生态系统是连接数字出版内容供给、阅读消费和阅读空间的智能体系,由数字出版资源智能组织、脑机协同的智慧阅读方式、虚实结合的智慧阅读环境三个相互关联的部分组成。数字出版资源智能组织是基础,是智慧阅读方式实现的前提和支撑,也是智慧阅读环境构建的目标和基础。

1.数字出版资源的智能组织

数字出版资源智能组织是利用数字技术、深度学习技术对出版内容进行模式识别、文本语义分析和内容重构,生成计算机可计算的结构化文本的过程,具体包括文本智能模式识别、文本智能分析和文本内容生成。

文本智能模式识别是采用卷积神经网络模型,计算输入文本的特征,通过多层卷积提取文字序列特征,再结合双向长短时记忆网络模型学习文字的上下文关系。语音文本智能模式识别采用循环神经网络模型作为一个直接学习滤波器应用于自动学习的语音特征提取,通过许多卷积层和池层的组合,实现对整句语音的建模[12]。

文本智能分析是利用深度学习技术对文本中的字词、语句、篇章等进行语义化自动标注和组织,形成电脑理解、可计算分析的结构化数据。目前,深度学习模型已可实现分词、词性标记、命名实体识别一体化训练任务,整体准确率超过90%。语句分析采用依存句法分析法,文本聚类采用模型算法,预先设计多个分布函数,通过函数匹配满足条件的相关样本。文本分类可通过前馈神经网络和卷积神经网络模型对文本类别进行判断[13]。

文本内容生成是利用深度学习递归神经网络、卷积神经网络、对抗神经网络等模型训练,从输入文本序列中生成摘要、文本复述、主题片段、古诗词、经典语句、注释等,从输入的图像中生成图像叙事文本。依据元数据、本体、资源描述框架等标准对多模态数字资源进行知识抽取与描述,再通过实体对齐、关系抽取、本体映射等技术将碎片化资源聚合成不同主题的知识库,为智慧阅读精准推送丰富多样的阅读内容。

2.脑机协同的智慧阅读方式

数字出版资源的智能组织为智慧阅读提供了结构化、语义化、可机器理解和处理的多模态阅读资源。利用云计算、物联网、虚拟现实等技术,基于脑机协同的生成式智能标注阅读、交互式智慧语音听读、沉浸式全息智慧视读等智慧阅读方式得以实现。

生成式智能标注阅读源自传统的批注式阅读。古人阅读时习惯在书中做标记,在阅读段落旁写批语,记录对阅读内容的理解、感受、疑问、赏析、评价、注释、提要概括、写作方法总结、文章脉络提炼等。批注式阅读是一种思考性阅读、探究性阅读、鉴赏性阅读,是产生问题不断激活阅读脑区的深阅读,对提升阅读素养、激发阅读兴趣、培养阅读心智具有积极的促进作用。网络时代,利用人工智能技术可将传统的批注阅读方式转化为生成式智能标注阅读。利用语言模型和智能计算从大数据集中生成用户需要的阅读文本,再对阅读文本的主题进行自动标记,在文本上标注线条、符号、文字和颜色标记、主题情感词、因果分析、例证关系,將地名与人物、事件、时间进行关联,生成数字叙事和时空图谱。如阅读《全唐诗》时,读者可利用大语言模型自动标注文本中的情感词、实体词、动词等,将诗歌主题情感、诗词韵律、鉴赏艺术手法等以关系图谱展示出来,再通过唐诗编年地图,关联诗歌创作地、提及地、作者生平、升迁贬谪等背景知识,从时空分布、人物情感、创作背景等多维度提升阅读理解和感悟。智能标记阅读实现了阅读内容的可视化、场景化,泛读浏览和深度阅读相结合,是传统批注式阅读向智慧阅读的功能延伸。

交互式智慧语音听读是用耳听的方式进行阅读。古代诗词吟诵、吟唱等就常用听读方式,如《诗经》吟唱春秋各诸侯国不同风格的诗歌,《楚辞》吟唱楚地风格的曲调,典籍听读过程中伴随着情感丰富的语调音频信号刺激,可有效激发读者的阅读兴趣。数智时代,利用机器学习混合建模方法构建语言模型,可实现端到端的语音识别。使用神经网络模型将输入语音系列直接转换为输出标记序列,语音识别率显著提高。通过智能语音合成技术将文本、图像、视觉、声音等多模态信息内容转换成音频格式,可实现交互式智能语音听读功能。目前,融合多媒介语音合成的听书广受大众欢迎,如2017年央视播出的《朗读者》节目采用“访谈+朗读”方式,借助经典文本,传递人生感悟,号召大众阅读,启发集体思考,传承中华文化[14]。人工智能语音系统可实现文字声音同步转换,既能将文字转换为现代人的声音,也能通过建立方言语音语料库,利用深度学习大语言模型,生成古代人的地方乡音。如四川人中秋夜读宋词《水调歌头》,通过智慧语音系统能同步听到苏轼四川乡音朗读声,再通过多模态知识图谱,以图文声像呈现经典诗词,获得穿越时空的真实感受,激发读者的人文情怀和阅读兴趣。

沉浸式全息智慧视读是利用计算机图形、计算机视觉、机器学习、虚拟现实技术等构建智慧阅读空间,实现人机交互、实体与虚拟读物共现、线上与线下互动的阅读方式。沉浸式智慧阅读场景与现实空间隔离,用户通过视听触觉,体验到身临其境的立体式阅读体验。通过深度学习模型训练有效分析读者和读物的特征与模式,构建虚拟世界的元智能,实现高效的人机协同阅读。沉浸式智慧阅读场景通过360度全景图像、音频、视频、3D模型、2D图文等技术创建数字叙事全景式呈现,实现感官式、具身化、沉浸感阅读体验。例如机器基于《史记》中的内容进行深度学习模型训练,抽取人物、时间、地点、事件和关系,再利用数字孪生、增强现实、3D建模技术创建《史记》虚拟时空场景,读者利用手机或头盔等互动设备进入预设的《史记》AR沉浸式场景,在打开《史记》的同时,虚拟人物、事件等可以实现逼真的全景呈现,再现多彩的历史画面。利用图书馆、博物馆、文化馆等公共文化场所构建虚实结合的沉浸式智慧阅读空间,协同共创沉浸式智慧阅读新场景,打通线上线下一体化的阅读新生态,为全民阅读注入新引擎。

3.虚实结合的智慧阅读环境

智慧阅读环境是融合实体空间、虚拟空间以及各种智能阅读设施,通过智能感知技术以及虚拟现实、混合现实技术等应用给读者带来各种沉浸式、交互性、具身性、个性化阅读体验。线上数字阅读和线下书本阅读的实时互动结合,支持读者构建智慧阅读空间、定制智慧阅读资源、使用智慧阅读工具、创意智慧阅读方法、建立智慧阅读社群、实现多元化阅读交流与传播等功能。

智慧阅读环境基于云计算、物联网、人工智能、虚拟现实、增强现实等技术搭建:云计算提供了支持智慧阅读环境的网络基础设施;物联网让所有能够被独立寻址的数字阅读资源实现互联互通,阅读传感装置接入网络使智慧阅读的感知能力和感知范围得到极大加强;人工智能通过对阅读资源的智能模式识别和自然语言处理,可实现人机交互阅读、实时推送和多维度呈现阅读资源;虚拟现实、增强现实技术可实现智慧阅读资源的三维空间注册、三维建模、人机交互和三维展现等功能。

基于云计算、物联网、人工智能及其相关技术,可构建智慧阅读环境的三层架构。第一层,阅读对象感知层。实现阅读资源和读者信息的智能采集和感知数据服务功能。通过云计算和物联网将各种网络设备和应用服务器连接成一个通用的实体,数字出版、图书馆等机构可利用射频、传感技术实现阅读资源内容感知和阅读行为感知,提供无处不在的智慧阅读服务。第二层,阅读数据服务层。将感知层的数据接入网络并提供数据管理和监控服务。智慧阅读系统之间实现资源共享、数据交换、访问控制[15]。依托云计算数据中心,建立独立于多个应用系统的公共云,通过不同类型的云环境为智慧阅读提供支持。第三层,阅读场景应用层。智慧阅读感知设备和数据网络为虚实结合的阅读场景应用提供了硬件和软件支持,可实现AR阅读、情境构建、人机交互阅读等场景应用。AR阅读是将书本内容3D建模,制作成动画,再通过增强现实技术以AR形式叠加到书中相对应的章节,读者阅读相关书页时,可同时观看立体动画。情境构建是通过传感设备自动获取阅读情境检测数据、读者注册数据。人机交互是读者与读物、读者与设备、读者与读者之间的实时交互,移动终端支持键盘输入、触摸屏、语音、手势甚至眼神交互。阅读场景应用丰富了阅读手段、工具和方法,通过多样化的人机交互阅读,极大提升了虚实结合的阅读体验,深度激发了读者的阅读兴趣和想象力。

四、结语

面向数字出版的智慧阅读是内容组织、阅读方式、阅读环境全智慧化的阅读生态系统。本文阐述了智慧阅读生态系统的概念内涵及其相关脑机科学理论,分析了数字出版与智慧阅读的共生交融、良性互动关系,在此基础上详细探讨了智慧阅读生态系统三个部分的主要内容,包括数字出版资源智能组织、脑机协同的智慧阅读方式、虚实结合的智慧阅读环境。资源智能组织是通过文本智能模式识别、文本智能分析和内容生成等技术方法为智慧阅读提供高质量内容供给。脑机协同的智慧阅读方式可实现生成式智能标注阅读、交互式智能语音听读、沉浸式智慧场景视读等智慧阅读功能。虚实结合的智慧阅读环境提供了感知阅读对象、智能访问和基于增强现实的立体阅读体验平台支撑。

随着脑科学、人工智能及其相关技术的不断发展和创新应用,智慧阅读模式将更加多元,读者对个性化、多元化、场景化、智能化的阅读体验需求,将促进智慧阅读系统不断升级与创新,智慧阅读将走向以读者需求为核心、用户体验为基础的大数据渠道服务发展方向。智慧阅读将充分利用大数据、云计算、物联网、区块链等技术分析挖掘读者数据,生成用户画像,通过精准化、个性化推荐,最大限度地满足读者的偏好和需求,不断优化读者的阅读体验。语义网技术实现了资源对象的分类组织和多模态关联,基于社交网络的全民阅读互动和类聚使得资源的自组织功能增强。在阅读感知层面,未来可以通过大脑意识与大语言模型计算实现阅读感知、记录、鉴赏的全智慧化,媒介融合将产生更多沉浸式、包围式、具身化、缠绕性阅读作品,为大众带来丰富的多元文化体验。

|参考文献|

[1]第二十次全国国民阅读调查结果发布 2022年成年国民综合阅读率持续稳定增长[EB/OL]. (2023-04-23)[2023-09-29]. https://www.chinanews.com/gn/2023/04-23/9995143.shtml.

[2]李祖平. 穿透灵魂(深阅读与智能出版传播研究)[M]. 北京:科学技术文献出版社,2019.

[3]刘芳. 国民数字阅读:现状、问题与提升[J]. 科技与出版,2022(4):60-66.

[4]茆意宏,朱玲玲,韩燕. 智慧阅读服务概念界定及国内相关研究评析[J]. 图书情报工作,2020(1):131-138.

[5]李英珍. 移动媒体时代智慧阅读体系的构建[J]. 出版广角,2018(24):43-45.

[6]斯坦尼斯拉斯·迪昂. 脑与阅读[M]. 周加仙,译. 杭州:浙江教育出版社,2018.

[7]方晓波,莫雷. 基于文化自信视角的“智慧阅读”教育改革路径研究[M]. 北京:北京教育出版社,2022.

[8]李金洪. 基于BERT模型的自然语言处理实战[M]. 北京:电子工业出版社,2021.

[9]张立. 数字出版相关概念的比较分析[J]. 中国出版,2006(12):11-14.

[10]聂震宁. 新时代:阅读与出版共生发展[J]. 编辑之友,2020(4):5-12.

[11]张立,李广宇. 数字出版学导论[M]. 北京:中国书籍出版社,2015.

[12]刘树春,贺盼,马建奇,等. 深度实践OCR:基于深度学习的文字识别[M]. 北京:机械工业出版社,2020.

[13]张鑫,樊静. 基于深度学习的机器阅读理解[M]. 北京:科學出版社,2021.

[14]高辛凡. 《朗读者》:倡导感性“阅读” 启发理性思考[J]当代电视,2018(11):67-68.

[15]严贝妮,方皓,魏梅,等. “互联网+”环境下的社区智慧阅读平台构建研究[J]. 图书馆学研究,2016(19):19-25.

猜你喜欢

语音智慧数字
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
对方正在输入……
答数字
数字看G20
有智慧的羊
成双成对
智慧派
数字变变变