APP下载

各种文本文档转音频文件及音频文件转文字

2020-08-21曹红萍

电脑知识与技术 2020年21期
关键词:朗读音频文本

摘要:随着对TXT/PDF/Word/HTML等各种文本文档转换为音频文件,以及音频文件转换为文本文字的需求日益增加,本文给出了让普通人都能够利用现有技术达到这些目标的方法。方法简单易行,实用有效。

关键词:残障人士;朗读;音频;文本

中图分类号:TP317 文献标识码:A

文章编号:1009-3044(2020)21-0180-03

开放科学(资源服务)标识码(OSID):

引言

现在越来越多的工作和生活中都会使用文本文档(例如:TXT文档、Word文档、PDF文档甚至HTML网页内容等)和音频文件。但是视障人士无法观看这些文档,即便是视力正常的人长时间阅读电子文档也会损伤眼睛而且不能同时进行其他的事情;与此同时,听障人无法听到音频文件的内容,只能阅读文档。而且残障者由于行动受限更渴望丰富生活,了解社会[1]。

如果文本文档可以朗读并转成音频文件,那么就能解放双眼,满足视障人士听读、放映厅放映、课堂教学、外语学习等场景下的需要,而且音频文件相对于文本文档更便于手机上播放和携带。同时,如果音频文件能转换成文本文档,那么就能满足听障人閱读、文档打印、将各种资料汇总成文档、残障人士文字录入等场景下的需要。寻找简单有效的方法,完成各种文本文档与语音文件的相互转换,是帮助残障人士的重要环节。

目前文字转语音的现状(参见文献[2-9])是:Office Word的菜单中都已经有了朗读功能,在“百度经验”中搜索“word朗读”可以查阅调出“朗读”菜单项的配置方法。本次使用的Word2016版本朗读功能可以做到朗读选中的文字和停止朗读。

目前语音转文字的现状是:各种语音输入法陆续发布,虽然存在着由于各种原因导致文字转换不够完美的问题,但该功能已经初步实现。

如何利用现有的技术,达到文本文档转换为音频文件,或者将音频文件转为文本文字,是此次研究的主要目的。

1 实现方法

1.1 准备工作

在开始实现之前,需要做好准备工作,特别说明如下:

1)文档朗读实际使用了windows的语音组件,所以使用前需要安装windows语音组件。本次使用的windows 10操作系统自带了语音组件。

2)因为要做文本文档和音频文件的相互转换。根据需求,笔者选定的实验环境是windows 10操作系统+Office Word2016+“讯飞语音输入法”。

1.2 文本文档转音频文件基本步骤

利用目前的Word朗读功能和windows的录音功能,我们现在只需简单地处理就可以实现Word文字转音频的目标。而其他的各种类型的文档,只要可以拷贝进Word文档里都可以用以下的方法,来转换成音频文件。特别需要说明的是,HTML页面的朗读一直都是浏览器插件开发的一个方向,但是如果可以直接拷贝HTML文档的内容或者利用生成HTML用的原始文本,将他们朗读成音频挂载在网页上播放,会去掉很多不必要的广告或者其他内容的干扰,提高网页朗读的品质。具体步骤如下:

1)在电脑右下角的扬声器上单击右键,“打开声音设置”,选择其中的“声音控制面板”,如图1所示。

2)在声音控制面板的“录制”选项卡中启用“立体声混音”,如图2所示。

3)回到图1所示位置,设置默认声音输入为“立体声混音”(也就是电脑播放音),如图1所示。

4)准备工作完成,可以开始录制Word文档的朗读语音。如图3所示,打开电脑的录音机,并打开Word文档,选中要朗读的内容。开始录音机录音,然后在Word文档中开始朗读,朗读完成即可停止录音,生成录音文件了。

1.3音频文件转文本文字基本步骤

接下来我们完成音频文件转文本文字的工作。因为音频文件转文本文字其实是利用了“讯飞语音输入法”,所以首先需要设置语音输入法的语音来源为电脑播放音,这样语音输入法就可以根据电脑播放的音频文件的声音,在Word文档中录入文字。步骤如下:

1)在电脑右下角的扬声器上点击右键,“打开声音设置”,向下找到其中的“高级声音选项”,打开“应用音量和设备首选项”,如图4所示。

2)确认其中的声音输入为“立体声混音”,并确认“讯飞语音输入法”相关两项的输人为“默认”(也就是立体声混音)。如图5所示。

3)完成准备工作,可以开始音频文件转Word文档的工作。打开音频文件,电脑开始播音;在Word文档中,光标移动至需要输入文字的地方,并将“讯飞语音输入法”的“点击说话”按钮按下。这时候“讯飞语音输入法”就会将声音转为Word文档中的文字。将1.2节中录制的音频文件转换为Word文档,我们来看看文字恢复情况。如图6所示。

可以看到由于文档朗读录音时使用了标准的普通话,所以文字恢复后除了标点符号不同,无法分段,没有各种文档样式之外,没有文字错误。

由上面的过程想到,通过将“讯飞语音输入法”的语音来源设置为麦克风(如图7所示),将音频播放出来的声音收音到麦克风,借助语音输入法转为文字;当然借助语音输入法,如果你对着麦克风讲话,也可以转为文字。

2 实验结论

本次研究,借助现代科学技术顺利地达到各种文本文档转换为音频文件的目的,满足视障、残障、听障人在很多应用场景下对这项技术的需要。虽然语音转文字过程中,可能由于某些语音文件的质量不高、普通话不够标准等原因,文字的准确性还有待进一步提升;文字转语音过程中,播放出来的语音还无法像人一样自然流畅。但是随着技术的发展,相信文字的识别会越来越准确,而播放的语音也会越来越自然流畅。

除此之外,目前的语音输入法不能分段,也没有文字格式,只能恢复文字。所以目前只能简化还原文本文档需要付出的努力。

3 结束语

针对目前各种文本文档转换为音频文件以及音频文件转文字的需求,本文提出了结合现有的windows语音组件技术、Word文档朗读技术、录音技术、语音输入技术,达到了文字与语音相互转换的目的。它能使工作和生活变得更智能、更人性化;使视障人士、听障人和残障人能够更轻松地应对工作和生活中的难题。相信将来会在越来越多对文本文档转音频文件,及音频文件转文本文字的应用场景中发挥作用。也希望随着研究的深入,不久的将来相关的转换软件可以诞生,使得转换工作得以更轻松完成。

参考文献:

[1]林英.视力障碍人士阅读问题研究[J].图书馆理论与实践,2014(4):22-24,25.

[2]张修振.两方法助你轻松阅读Word文档[J].秘书之友,2009(8):46.

[3]巧用“录音机”制作音频文件[Jl,电脑知识与技术,2000 (01):20.

[4]罗海涛.wav音频文件格式分析与数据获取[J].电脑知识与技 术,2016,12(27):211-213.

[5]阮高峰.TXT文件也玩大变身[J].电脑知识与技术,2003(22):8-11.

[6]飞雪散花.乾坤大挪移,文本也转换[J].电脑迷,2011(18):21.

[7]乡里人家.文出有声护眼养神[J].电脑爱好者(普及版),2010(10):33.

[8]朱焕民.让Word XP给你读文档[Jl.电脑知识与技术,2003(31):29-30.

[9]李刚.智能语音识别技术的架构与设计[J].电脑知识与技术,2018,14(18):175-177.

【通联编辑:唐一东】

作者简介:曹红萍(1977-),女,新疆精河人,清华大学软件工程硕士,高级系统架构设计师,主要研究方向为:计算机教育、计算机应用技术、软件工程。

猜你喜欢

朗读音频文本
在808DA上文本显示的改善
必须了解的音频基础知识 家庭影院入门攻略:音频认证与推荐标准篇
基于Daubechies(dbN)的飞行器音频特征提取
基于doc2vec和TF-IDF的相似文本识别
音频分析仪中低失真音频信号的发生方法
构建校园英语文化,培养学生的人文精神
以“读”为桥 走进文言文的天地
小学语文教学的新步伐
谈谈朗读在文本解读中的作用
文本之中·文本之外·文本之上——童话故事《坐井观天》的教学隐喻