公共图书馆视障阅读研究

2024-04-11丁乙

新阅读 2024年1期

丁乙

摘要：2022年《马拉喀什条约》对中国生效，在新政策依托下，探索视障者阅读新形式、提升视障者阅读质量，让视障者更好地分享精神文化成果，是公共图书馆需要思考的问题。通过文献调查国内外公共图书馆视障阅读服务现状，以及基于对上海图书馆东馆无障碍阅览室视障服务特色的分析，探索运用多模态预训练大模型提升公共图书馆视障阅读质量的创新策略。

关键词：视障无障碍阅读多模态预训练上海图书馆

《中华人民共和国残疾人保障法》明确了残疾人享有平等接受教育、平等参与文化生活的权利。我国重视残疾人特别是盲人的阅读权益，不断出台政策保障残疾人阅读权益。1952年中国盲文统一，1994年设立中国盲文图书馆，2012年政策扶持盲文出版事业。

2016年鼓励公共图书馆设立盲人阅览室，2022年《马拉喀什条约》对中国生效，国家版权局印发《以无障碍方式向阅读障碍者提供作品暂行规定》。一系列法律政策的出台为公共图书馆视障读者服务提供了有力支撑。

国内外公共图书馆视障阅读服务现状

国外公共图书馆视障阅读服务。大英图书馆解决了租用听书设备的问题，帮助视障读者实现实时听书。其与知名耳机、话筒制造商森海塞尔合作，通过在视障者手机上免费安装Mobile Connect程序，帮助视障读者在图书馆内以手机取代听书设备实现无障碍收听。美国公共图书馆的盲人服务起步较早，在1868年就有服务记录，然而美国公共图书馆网站的无障碍程度尚有待提高。郭亚军等在2020年以《康复法案》第508条为标准，调查了146家美国公共图书馆网站信息的无障碍程度，认为符合信息无障碍标准的只有15%，其中，圖片没有替代文本是普遍问题。图片缺少替代文本，屏幕阅读器无法读出图片信息，导致视障者难以完整浏览图书馆网站信息，影响视障者图书馆网站使用体验。日本公共图书馆视障读者特色服务包括面对面朗读服务，馆员和志愿者在图书馆或前往读者家中为读者阅读馆藏文献及读者的信件、明信片等生活中需要阅读的文本。帮助视障读者通过生活化阅读解决日常视障困难，体现人文关怀。

国内公共图书馆视障阅读服务。视障用户信息素养教育是公共图书馆视障服务之一，可以满足视障读者个性化的信息需求。近些年，无障碍电脑、手机培训班逐渐成为国内公共图书馆普遍的视障服务内容。深圳图书馆和浙江图书馆深挖无障碍电脑、手机培训班，形成特色服务。深圳图书馆举办无障碍电脑比赛，通过赛前特训和赛后颁发奖项的形式，提升视障者参与热情，帮助其巩固电脑操作知识，扩大培训影响。浙江图书馆依托地域优势，邀请蚂蚁金服公司员工从软件开发者的角度，为视障者讲解手机支付宝操作方法，帮助视障者更好地理解和使用支付宝软件，并根据他们的反馈进行优化。

国内外公共图书馆通过改变听书载体、简化听书形式、培训读者掌握听书方法等方式，帮助视障读者阅读文献。然而，视障者听书阅读形式有以下不足：一是长期使用听书设备可能损伤听力，健康的听力是大部分视障者安全出行的保障；二是对于听障、视障双重障碍者群体或者老年听力退化群体，难以通过听书满足精神文化需求；三是有考学、晋升需求的视障学生通过听书设备来阅读学习，效率低且效果有限。

上海图书馆盲人服务继承与发展

2001年，上海图书馆在淮海路馆综合阅览室内设立了面向视障读者的盲人阅览室，至今已经20多年了。通过阅读丰富视障者精神文化生活，强化视障者与社会的沟通是上海图书馆一直以来的坚持。东馆无障碍阅览室2022年开放服务，继承了视障阅览室原有的免费邮寄外借、无障碍电影等业务，并拓展了盲文刻印服务。

上海图书馆盲人服务的历史与特色。2002年5月，上海图书馆开始提供视障读者免费邮寄外借服务。在当时属于全国首创，是由上海图书馆、市残联、市邮政局三方共同合作开展的。视障读者通过服务热线向上海图书馆提出借书请求，上海图书馆完成外借操作后，将盲文文献放入特制的视障读者专递包，通过邮局工作人员免费送到视障读者家中。读者阅读完毕后，也只需拨打所在区对接的邮局工作人员电话，等待上门取件即可。这一服务解决了视障者出行难问题。无障碍阅览室升级了免费邮寄外借服务，对于在无障碍阅览室登记过个人信息的视障读者，可以通过电话或邮件提出盲文文献借还需求，工作人员确认信息后，使用顺丰快递寄送到读者家中，费用由上海图书馆视障读者专项基金支付。

无障碍电影指运用科学技术，为普通的电影影片增加配音、旁白解说和手语视频，帮助视障者和听障者能像常人一样观看电影内容。2009年，上海市残疾人联合会、上海图书馆、上海电影评论学会联合成立无障碍电影工作室制作无障碍影片，通过上海的公共图书馆为视障读者提供免费借阅服务。首部无障碍电影《高考1977》在全国影院同期推出，400余位残疾人在上海图书馆观看了这部影片。无障碍阅览室延续无障碍电影服务，每季度举办一次。

2011年底，上海图书馆为上海市33万残疾读者推出“无障碍数字图书馆”，作为国内第一家完全符合无障碍标准的公共图书馆网站，登录数字图书馆可以免费观看680多部上图讲座视频，阅读收听2000多册有声电子书。

东馆无障碍阅览室的创新服务。根据上海市残疾人联合会数据，上海市2017年有视力残疾人89253人，2018年有视力残疾人93159人，2019年有视力残疾人95550人，呈逐年递增趋势。为满足更多视障者的精神文化需求，2022年上海图书馆东馆无障碍阅览室开放并探索视障阅读新形式，拓展了盲文刻印服务。

盲文文献总量少、体积大、采购难、价格高。早些年，掌握盲文的视障者数量少，听书成为视障者主要阅读方式之一。当前，随着社会经济发展，视障者普遍受到更好的教育，盲童有相应的升学需求，需要反复阅读、思考研究重点的学习材料。

东馆无障碍阅览室为有需要的视障读者提供盲文文献刻印服务，帮助视障读者将需要刻印的word文档带至无障碍阅览室或发送至无障碍阅览室的工作邮箱，由馆员将明文通过软件转换为盲文后，通过盲文刻印机进行刻印输出。由此，听力障碍的视障者可以通过触摸盲点的形式阅读明文文献。盲童学校的学生可以将校外的中英文试卷、文件讲义等学习材料刻印成盲文以便携带、学习思考和保存。

目前，东馆无障碍阅览室盲文刻印服务遇到了一些新的挑战：一是盲文刻印效率低，明、盲文转换比大约是1∶3至1∶4，即一页word文档的明文文本转换成盲文文本需要3—4页；二是盲文刻印机普遍存在噪声，盲文刻印服务必须在保证无障碍阅览室现场服务基础上进行；三是明盲文转换软件在表格、特殊符号、生僻字、下画线等方面存在偏差。

数字赋能无障碍阅读

科技以人为本，数字时代更应关注弱势群体需求，如何运用科技推进无障碍阅读发展，让特殊群体享受到科技的福利，是公共图书馆无障碍阅读服务未来的思考方向。多模态预训练大模型是阿里达摩院预测的2023年十大科技趋势之一，多场景、多任务的预训练大模型将增强模型的跨模态语义对齐能力，打通各个模态之间的关系，使得模型逐步标准化。

单模态与多模态。人类拥有视觉、听觉、嗅觉、味觉、触觉等多模态的感知体验用以收集、解释和分析对象。视觉模态是人类阅读时最主要的感知信息来源，视觉模态的先天性缺失是视障读者阅读的主要障碍。单模态模型是从一个领域或者视角对同一个描述对象获取数据，即只包含图像、语音、文本、传感器数据等其中一种类型的数据，容易导致以下三个问题。

一是模态缺失。为视障人士设计的无障碍阅读技术常因耦合性欠缺，没有让视障者获得良好的阅读体验。现实中，视障读者常常会遇到模态缺失现象，例如由于拍摄原因导致的文本模态缺失、语音识别错误带来的语言模态缺失、背景声音嘈杂导致部分模态数据模糊。

二是数据类型单一，输入模态往往难以完全与给定模态对齐。单模态预训练模型是在某一个单一模态中训练产生的。例如，输入的语音模态与之前预先训练的文本模态属于近义语义但不完全一致，输入句子嵌入由单一模态预训练的文本编码器提取、语义上与图像模态不一致，这就给本就视障模态缺失的群体增加了困难阅读。

三是产生冗余信息。对于文本中插入图像的阅读，若采用单模态模型，在读取文本和图像特征时是独立进行的。不考虑模态信息交互，操作的独立性不可避免产生冗余信息，图像中的信息也必然有与文本内容一致的地方。

多模态模型通过不同领域或者视角对同一个描述对象获取数据，并通过探寻各类型数据之间的关系训练数据和完善数据集。构建多模态阅读模型能弥补视障读者主要视觉模态缺失，更好地进行细颗粒度的语义建模。

预训练模型与自然语言处理。自然语言处理是运用人工智能技术，理解语言、处理语言、生成语言，使得计算机拥有与人类一样的听说读写译的能力，是辅助残疾人阅读的各类视听读机器、助视设备的技术基础。预训练是人工智能发展史的标志之一，即把一个已经训练好的图像分类模型的参数应用到另一个类似任务上作为初始参数的过程。预训练能保存之前解决问题的模型，一旦遇到类似问题，就可以从之前的模型入手，不用从头开始。因此，预训练模型能大规模、可复制地处理自然语言，提高自然语言处理效率。将预训练模型运用到辅助残疾人无障碍阅读中，可以提高阅读效率，减少阅读障碍重复出现。

多模态预训练大模型。多模态预训练大模型是将同一对象在不同领域获取的数据合集的模型参数应用到另一个相关任务上的过程，能让文本与图片映射在同一空间，通过对图像和文本之间相似度的度量，实现跨模态探索。例如，2021年7月中国科学院自动化研究所发布的“紫东太初” 属于三模态预训练大模型，支持图像、语音、文本三模态数据间的跨模态检索。与OPPO合作，文澜模型实现了为视障人士读取收集图片的功能，践行科技向善的理念。

目前多模态预训练大模型尚在起步阶段，还存在数据量规模远小于自然语言语料库、训练效率低、难实时检测识别等问题。但可以看到，在人们的阅读习惯从文本向文字、图像多元化进行拓展的数字时代，多模态预训练大模型能有力提升无障碍阅读质量。未来，要使多模态预训练大模型广泛应用于无障碍阅读，还需探索高效的模态表示和多模态信息交互方法。

作者单位：上海图书馆（上海科学技术情报研究所）

參考文献

[1]马钰荟.中国盲文图书馆早期馆史研究[J].办公室业务， 2021（16）：176-178.

[2]刘涵.大英图书馆残障读者服务现状及启示[J].河北科技图苑，2022（3）： 36-40，14.

[3]袁莉莉.美国图书馆残障用户服务研究及启示[J].图书馆研究与工作，2019（2）：72-76.

[4]郭亚军，席俊红，刘燕权.信息无障碍，距离还有多远？——对146家美国城市公共图书馆的调查[J].图书馆论坛，2020（2）：151-158.

[5]陈婧，臧可，邓亚.日本图书馆残障读者服务探析[J].图书馆建设，2016（1）：61-66.

[6]丁亚茹.国内外公共图书馆视障用户信息素养教育实践与启示[J].图书馆，2021（10）：28-33.

[7]李婉彬，李燕娜.公共图书馆视障读者信息需求调查及分析[J].图书馆论坛，2013（4）：77-81，53.

[8]王亚莘，单琪，潘文建.在断点相遇：“数字盲道”中视障阅读的技术协商[J].出版发行研究，2022（6）：79-83.

[9]孙宇冲，程曦苇，宋睿华，等.多模态与文本预训练模型的文本嵌入差异研究[J].北京大学学报：自然科学版，2023（10）：48-56.

[10]卢志武，金琴，宋睿华，等.悟道·文澜：超大规模多模态预训练模型带来了什么？[J].中兴通讯技术，2022（2）：25-32.