APP下载

阅读听书平台智能合成语音的应用进展、质量现状和用户接受

2021-01-05孙艳华

编辑之友 2021年12期
关键词:质量应用

孙艳华

【摘要】智能合成语音具有智能化、标准化、制作门槛低等优点,越来越成为阅读听书平台信息有声化道路上的新宠。评价观察和听审实验结果均表明,阅读听书平台AI合成语音的质量还存在较大提升空间,针对情感表现力弱、通顺性差、部分作品语速快等问题,可通过AI语音技术和人工的结合、强化标点的作用、1倍语速设计为270字/分~290字/分、审校等方式完善。从播放量和评分看,AI主播版作品的用户接受度优于人工主播版,这与AI主播版更新及时、断更现象少、价格优势有关。通过AI语音产品的二次开发为用户提供更加丰富的产品和优质的服务,将成为阅读听书平台后期的工作重心。

【关键词】阅读听书 智能合成语音 应用 质量 用户接受

【中图分类号】G206 【文献标识码】A 【文章编号】1003-6687(2021)12-081-08

【DOI】 10.13786/j.cnki.cn14-1066/g2.2021.12.012

由于音频能更好地解放我们的双手、双眼,满足特殊时段(如做饭、开车)、特殊人群(如视力障碍群体)的读书需求,越来越多的网络信息服务提供商加入有声化的行列。中广联合会有声阅读委员会会长王秋指出,2022年我国有声书用户将达到5.6亿,[1]“耳朵经济”正在成为一个新风口。

2021年是人工智能提出的第65年,智能语音(以下简称AI语音)已经成为人工智能发展到今天最成熟、最重要的板块之一。AI语音是我国为数不多具有自主知识产权且达到国际先进水平的产业,且最近5年的发展超过了过去50年的发展。[2]

AI语音的多项子技术中,作为关键技术的语音合成技术成熟最早,它是指将文本信息自动转换成语音信息(如银行排队叫号机),其应用场景包括阅读听书、资讯播报、订单播报、智能硬件,①本文对其中的阅读听书场景展开研究。

一、调研平台

参照艾瑞数据提供的平台类别,提供阅读听书服务的平台类别有在线阅读、有声听书、有声音频。根据艾瑞数据“移动APP独立设备使用量”2021年6月榜,笔者选取月度独立设备使用量超1 000万台的平台为调研对象,结果如下。

在线阅读平台方面:符合条件的在线阅读平台共10个,分别为掌阅、QQ阅读、番茄免费小说、七猫免费小说、书旗小说、咪咕阅读、搜狗阅读、米读小说、连尚免费读书、微信读书。

有声平台方面:符合条件的有声听书平台为懒人畅听,符合条件的有声音频平台为喜马拉雅、蜻蜓FM、荔枝①,共计4个有声平台。

在研究过程中,首先,基于平台样本对在线阅读平台AI合成语音的应用进程进行纵向梳理;其次,立足当下,对AI合成语音应用中的热点——质量展开调查;再次,从效用的视角,分析AI合成语音的用户接受。

二、AI合成语音在阅读听书平台的应用进展

1. 在线阅读平台

各在线阅读平台上线后,相继开通了智能语音朗读服务。据笔者统计,截至目前,10个在线阅读平台的AI入局率为100%。各平台中,除开通AI语音最晚的连尚免费读书平台有较多作品不支持AI语音,掌阅、七猫免费小说等平台有少量作品未获得音频版权外,其他作品均提供AI语音服务。

2. 有声平台

笔者在4个有声平台通过搜索词“AI”“智能语音”对“专辑”“声音”“用户”“节目”“书籍”“主播”等进行搜索。首先,4个平台均存在AI语音作品,AI入局率为100%。其次,截至2021年7月31日,有效结果共计597部。其中,喜马拉雅481部,占比80.6%;懒人畅听113部,占比18.9%;蜻蜓FM2部;荔枝1部。对597部作品的发布时间、主播、主题等信息进行统计梳理,结果如下。

(1)AI合成语音的应用源起——AI导读。有声平台最早的AI语音作品形态为喜马拉雅和懒人畅听平台的AI导读。AI导读为国内首个实现智能浓缩书的产品,通过智能、客观提取一定比例(通常为10%)全书干货,②用AI语音朗读,起到导读的作用。

喜马拉雅平台方面。AI导读作品共计283部,上传时间集中于2019年1月至2019年6月。其中,最早的作品为2019年1月29日上传的《AI导读︱全球通史(中)》和《AI导读︱全球通史(下)》。作品播放量在

1~2.8万之间,超过1万的作品仅2部——《AI导读︱十人以下小团队管理》(2.8万)和《AI导读︱迈向权利巅峰的希拉里》(1.1万)。平均播放量688,多为付费收听(少量免费),收费区间为0喜点/部~19.21喜点/部。③

懒人畅听平台方面。AI导读作品共计98部,上传时间集中于2019年2月至2019年12月。其中,最早的作品为2019年2月26日上传的《AI导读:全球通史》《AI导读:谁是下一个中国首富》《AI导读:75分钟塑造高情商领导》。播放量介于1万~243万之间,平均值为5.9万,远超喜马拉雅。收费区间为0.99元/部~22.99元/部。

喜马拉雅和懒人畅听可谓有声平台AI合成语音的试水者。根据统计结果,两平台的AI导读作品数量变化趋势如图1所示。所有AI导读作品的主播均为“AI导读”“谷臻小简”,音频技术均由讯飞有声提供。遗憾的是,这一具有历史突破意义的AI产品形态于2019年12月12日退出历史舞台。

(2)AI主播、作品内容、作品数量不断丰富。主播“AI导读”“谷臻小简”自2019年6月13日起,停更喜马拉雅平台的AI导读作品,自2019年12月12日起,停更懒人畅听平台的AI导读作品。但这并不意味着AI语音退出有声平台,接踵而至的是AI语音主体的多元化、合成内容的丰富和作品数量的逐渐增多。

最早的非导读AI作品为2019年6月5日主播“华章有声读物”在喜马拉雅平台分享的作品《学会决断AI版》。之后,“阳光科技AI”“任性_ae”“虚拟镜像”“有声小于”“AI合成”“爱阅读de电子书”等AI主播纷纷入驻有声平台,其中不僅有专业的AI团队,也有普通网民个人。AI语音开始被较广泛地应用于小说、商业、生活等各类主题的作品朗读中,作品数量变化趋势如下页图2所示。可以看出,近两年来,AI语音在有声平台的应用总体呈上升趋势,特别是2021年7月达到历史峰值。需要说明的是,在调研过程中发现,AI语音作品的实际数量远不止图2所列,特别是喜马拉雅平台,近一年来的AI语音服务已经较为普遍,但由于大部分缺少AI标识,因此搜索到的样本有限。

3. 应用进展分析

无论是在线阅读平台,还是有声平台,AI合成语音的应用趋势向好,主要有以下两方面原因。

(1)在线阅读平台的主播有专业播音员、名人(如专家)、AI,有声平台的主播有专业播音员、网民、名人、AI。与专业播音员、网民、名人等人工主播相比,各平台的AI语音虽然技术提供商不同(如喜马拉雅、QQ阅读平台为科大讯飞开放平台的合作伙伴,掌阅、七猫免费小说平台由百度语音提供AI语音支持,微信读书的AI合成语音由微信团队提供①),但均具有生产效率高、成本低、标准化程度高、发音稳定、语速可调、音色优美干净、无情绪波动、随时在岗、不疲劳、无须备稿等优点。

(2)市面上有声书的数量远少于电子书数量,通过AI合成语音技术,用户端输入文本,就可以7×24小时无间断合成语音,大大缓解了由于人工录播效率低而导致的有声内容供给端产能不足的问题。特别是对于网民而言,AI语音合成技术可谓其福音。人工录播门槛高,对主播的自身条件、水平、时间、精力都有很高的要求,大部分网民苦于自身没有好的音色或音准条件,亦缺少聘请专业主播的条件或意愿,而通过AI语音合成软件,普通网民可以将感兴趣的文章转化为AI语音进行传播,而且音频质量优于自产。百度语音技术接口永久免费开放更是为“人人都可当主播”创造了更多的可能性。[3]而大量网民的加入,献声门槛的降低,进一步丰富了听书资料来源,对于推动全民阅读具有重要意义。

三、阅读听书平台AI合成语音质量现状

达到专业人工主播的质量水准一直是AI合成语音的奋斗目标,阅读听书平台AI语音质量现状如何?笔者通过观察用户评价和开展听审实验展开探索。

评价方面。通过观察阅读听书平台评论区的文字评论来了解听众对AI语音质量的评价。

实验方面。为了客观地呈现阅读听书平台AI语音的质量现状,开展对照文稿审校AI语音的实验。考虑到对照与音频内容相同的文稿更有助于听审实验的开展,且符合音频审校实际,而有声平台无对照文本,因此,以10个在线阅读平台为实验素材库,选取各平台2021年7月31日推荐阅读的前5本提供AI语音服务的图书的第1章为听审对象,总计50个样本,约12万字。

1. 整体质量不达标

从评论看,类似“被这平淡不带感情但又机械板正的声音圈粉了”“微信读书的AI男声有点拽,AI女声像实验课上老师放过的20世纪录像课程的声音”的好评和中性评论相对较少,不少用户抱怨AI语音在流水播报中“多音字从来没有念对过,断句奇奇怪怪,语流钝涩,逻辑不清”,频率较高的差评词为:没情感、不通顺、速度快。

从实验统计结果看,10个在线阅读平台的AI语音出错率区间为0.8‰~15.8‰,参考图书质量合格标准(差错率≤0.2‰),出错率均超标,平均出错率4.1‰,为标准值的20.5倍。从分项统计结果看,AI语音错误主要集中在语气不当(占比32.9%)、多音字读错(占比34.3%)、停顿位置不当(占比27.2%)三个方面,其他错误如多读(如将“注”的编号读出)、发音错误(如“娘”错发为一声)、英文发音磕磕绊绊等。

2. 情感表现力弱是最大痛点

评论中,抱怨AI语音没感情者居多。实验结果亦表明,儿化音、轻声、感叹或问话等语气不当,以及重音出错引發的情感不足是AI语音的主要问题之一,诸如“那玩意儿”的“儿”错发二声、“丈夫”的“夫”错发一声、“不怕死?”错为陈述语气等错误非常普遍。情感表现力弱成为AI语音的质量短版,从技术角度看,亦为最难攻克的关卡。究其原因,AI语音合成技术催生了见字出声、语气生硬的读字,而情感是一个复杂的心理活动,相同的字、词、句在不同的语境中含义不同,情感色彩有异,专业人工主播能够充满情感、富于变化地将其准确朗读出来,是基于主播对文本的准确理解和用心感受,而AI主播情感匮乏,缺少变化,不会理解,也无法感受。[4]

有些主播为了提高AI语音的情感,置入了背景音乐,但并未因此收获好评。从评论看,有不少听众抱怨背景音乐影响了收听体验。样本统计结果显示,大部分AI作品并未置入背景音乐,配乐版和无配乐版比例约为1:9。AI语音的机械式播报使听众对内容的理解难度加大,因此,要均衡考量背景音乐对内容情感的促进作用,及背景音乐对内容理解和接收的负面影响之间的关系,背景音乐的处理要谨慎,在决定置入时,要注意控制音量,以免得不偿失。

2021年4月上旬,AI合成语音情感控制取得一项突破,使AI语音在接近人类情感方面又迈进了一步。微软发布支持轻松调节情感程度的AI合成语音技术,将情感分为平静、开心、温柔、撒娇、尴尬、严厉、愤怒、悲伤、恐惧、不满、沮丧11个类别,以平静语气为零点,以1%为情感程度量化单元,使情感更加细腻丰富。[5]另外,建议AI语音技术商和内容商强化标点符号的情感表现作用,如问号为上扬语气,叹号对应为加深语气,要表现重音可借助着重号等。

3. 通顺性差是普遍现象

多音字读错、停顿位置不当是引起AI语音表达不通顺的主要原因。首先,关于多音字,错读现象普遍,且与难易关联不大,如长、重、背、行、发、闷、干、倒、得、觉、晕、看、都、着、落、相、少、冲、喝等简单常见的多音字读错率都很高,因此,听起来特别“刺耳”。其次,关于停顿位置,除了各平台普遍存在的错误,如将“让人讨厌”读成“让#人讨厌”,还包括个别平台的特有错误,如七猫免费小说平台标题中的空格(如“第一章 我的女儿”)、章标题与段之间缺少停顿,微信读书平台破折号没有停顿作用,书旗小说平台的语句在跨页处停顿等。

无论是阅读听书平台的内容生产者还是用户,都对网络小说投入了很高的热情,50个质量调查样本均为此类。网络小说多采用大众化表达,AI语音的通顺性况且如此,如果遇到句式复杂、表达晦涩、语义多变、逻辑性强的内容,AI语音更难像人声那样自如、流畅和准确。

实际上,当前已经具备解决影响AI语音通顺性的多音字、停顿问题的技术条件。科大讯飞推出的“讯飞快读”,在制作语音时,不仅可以进行多音字纠正,还可以插入停顿,停顿时长可设置为0.2秒、0.5秒、1秒、2秒。百度提供的“百度AI”也支持在合成语音时进行多音字标注。因此,在AI语音技术的加持下,如果想获得通顺的AI音频,可以采用智能与人工相结合的方式,对内容进行细加工。另外,AI语音合成软件应进一步完善通用设置,如所有点号,标号中的破折号、省略号、间隔号,空格,回车都有停顿作用;跨页不是停顿的标识。

4. 部分作品语速偏快

从评论看,有不少作品被指出AI语速太快。实验中,为了方便听审,根据需要调整播放速度,因此,并未将速度纳入出错范畴,但有些作品采用默认1倍语速收听时,确实有和网友一样的感受。虽然速度可调,但要考虑到一些网友不方便或不会调速,为了提升服务质量,建议重视1倍语速的设计。通过测算,不满度较高的1倍AI语速区间为290字/分~320字/分(其中,起停顿作用的标点符号计1字符)。中央广播电台播音员语速不超过300字/分,[6]人工主播结合文本语境和情感进行语音播报,抑扬顿挫,有利于信息的接收和理解,而AI语音的每一句话采用基本相同的情感,还附带多音字等错误,290字/分~320字/分的速度确实给人偏快的感觉。参考多部评价高作品的AI语速的做法,经测算,发现1倍语速区间为270字/分~290字/分时听众接受度最高。

无论是语速,还是前文提到的情感表现力、通顺性问题的解决,建议AI语音借鉴人工录播的质量控制方法——审校。阅读听书平台多为大部头作品,人工录音工作量大,AI合成语音质量虽然逊色些,但省时省力省成本,因此,各平台的常见做法是:为畅销书、经典长销书录制人工主播版(以下简称人工版),或全部只提供AI主播版(以下简称AI版),AI版音频未审校。其实,考虑到AI语音出错类型和出错点比较固定,有规律可循,容易识别,发音的标准化也使错误更容易被客观评判,所以,AI语音的审校难度比人工语音小很多,一次审校就能起到很好的质量提升效果。因此,对于有竞争力的作品,建议对AI语音进行至少一次审校,在质量和效率间寻找平衡点。

四、阅读听书平台AI合成语音的用户接受

通过AI版作品和人工版作品的对比,可以看出听众对AI合成语音的接受情况。对于在线阅读平台,常常较难判断读者对作品的评价是基于文本还是AI语音,因此,笔者从不提供文本的有声平台入手,对597部AI样本信息进行统计,播放量超过10万的73部作品中,有13部能在同一平台搜索到人工版,且均为喜马拉雅平台的作品,这13部作品的播放量、评分、上传时间等信息见表1。

1. AI版的用户接受优于人工版

从表1中的播放量看,人工版超过AI版的作品只有3部(分别为“梅花六有声小说”的《小地主(梅花六演播)》、“播小文”的《〈大秦赋〉全集剧情解说》、“拔刀问情”的《三国之宅行天下》),其中2部上传时间早于AI版。其余10部中,AI版播放量更高,其中7部是在上传时间晚于人工版的情况下依然胜出,彰显了AI版强大的竞争力。

从表1中的评分看,首先,从平均分看,两个版本有评分者均为8部,AI版平均分为9.1,人工版平均分为8.7,AI版胜出。其次,从高分作品数量看,考虑到可比性,选取表中AI版和人工版均有评分者,即序号为3、4、5、6、7、13的6部作品做对比。4部AI版得分高于人工版(分别为《唐朝工科生》《无敌大魔王反派》《深海直播间》《我是林正英的僵尸徒弟》),2部AI版得分低于人工版(分别为《KN之我不是蛇精病》《我真的不是气运之子》),AI版胜出。

2. AI版用户接受优于人工版的原因

以上统计结果表明,听众对AI版作品的接受度高于人工版。这一统计结果超出预期,但细致观察分析后,不难发现其中一些深层的原因。

(1)更新频率。通过表1中的上传时间跨度和集数可以分别计算出AI版及人工版的更新频率平均值,结果为AI版更新频率9.1集/天,人工版1.1集/天。可以看出,AI版的更新频率更快、更及时,这与AI语音合成技术的优势有关。人工录播模式下,一部有声书的制作周期通常为数月,对于精品有声书,甚至长达数年,而AI語音的生产效率可达同水平人工的500倍。[7]在催更的呼声中,AI版更能满足用户的需求。

(2)集数。根据表1中的集数统计结果,首先,从单部作品看,除“拔刀问情”的《三国之宅行天下》外,其他作品的人工版集数均少于(且大部分远少于)AI版。其次,从综合对比看,通过表中的集数和作品数量可以分别计算出13部AI版及24部人工版作品集数的平均值,结果为AI版794集/部,人工版209集/部,前者为后者的近4倍。而无论是AI版还是人工版,每集的时长均为10分钟左右。因此可以看出,人工版不能善终、半途断更现象非常普遍,AI版的集数通常更完整。

(3)价格。从表1中的价格数据可以看出,付费作品共4部,均为人工版,AI版均免费,价格优势是AI版的又一竞争力 。

AI语音技术提供商角度。语音合成技术投资大,但在科技向善和普惠的愿景下,技术免费、增值服务收费,开放平台寻求软硬件及内容合作成为主要商业模式,收益并不高。因此,小公司的发展较为困难,需形成规模优势。国际上,AI语音专业公司基本都被Nuance收购。国内反垄断管制严格,情况好很多,形成了专业公司(如标杆企业科大讯飞)+互联网公司(如百度语音、腾讯、搜狗、思必驰、出门问问)+创业公司(如智能360、云知声、阿里巴巴)+高校和科研机构(如清华大学、中国科学技术大学、北京大学、中科院声学所)竞争发展的产业布局。[2]根据《2020年中国智能语音行业研究报告》,我国已有约250家企业参与智能语音市场。阅读听书平台要借此东风,加快有声内容智能化转型的步伐。

有声内容提供方角度。专业的人工录播投入成本高,首先需要编导、设备技术人员、主播等多角色参与,且按时计费,其次需要采用专用的设备、专业的录播场地。对于普通网民而言,声音录制对设备、场地要求低,但音频质量也低。因此,要保证人工语音的质量,就需要投入高昂的成本,而AI的成本为同水平人类的1/80000。[7]对于阅读听书平台而言,可以充分发挥AI版的优势,或将AI版作品作为探试市场的工具,以考虑后期是否出人工版。

3. 用户高点播、高评分与以贬为主的评论间的矛盾

需要说明的是,用户评论是评判用户接受的重要指标之一,但在评论观测过程中,笔者发现用户评论内容聚焦于质量方面,故将其置于上一节质量现状部分。根据该节的用户评论观测结果,用户对AI语音质量褒贬不一,甚至以贬为主。但从表1的分析结果看,实际上大部分用户选择收听AI版作品,且给出了高分。点播、评分、评论的主体均为用户,而三者表现出的用户接受为何会出现矛盾之处?

仔细观察后发现,差评用户以AI语音的新听众为主。“原来是机器人啊!”“主播能带点感情就好了”“这速度,主播是要赶着下班吗?”“这主播肺活量真好,感觉一口气能读完一本书啊”,从评论内容和语气看,这些听众刚知道甚至还不知道AI语音的存在。由于是AI语音新接触者,不习惯这一新事物,给出差评也是可以理解的。用户对AI语音的接受需要一个过程,相应地,新听众对AI语音也要多点耐心。目前的AI语音合成技术总体还处在初级智能阶段,进入阅读听书平台时间尚短,但质量已经有了较大的提升,老用户已经越来越习惯,有人甚至“爱上了这个宝藏声音”,而且“已经不习惯声情并茂、戏份过多的真人演绎”。例如《首席医官后传(AI有声书)》有些用户甚至听了3~6遍。①虽然依然有人吐槽AI语音像无感情的读书机器人,但今天AI合成语音的违和感已经很低了,自然度甚至达到并超过普通人水平,[8]技术服务提供商也在加大前进的步伐,并将质量提升作为重中之重,使AI合成语音不断向人性化迈进。

五、前景预测

综上,阅读听书平台的AI合成语音呈现多元化发展态势,用户接受赶超人工语音,但质量有待进一步提升。根据AI合成语音应用于阅读听书平台以来的走势,以及AI语音技术的发展方向,不难做出如下判断:阅读听书平台在保证基础服务,特别是产品质量的基础上,后期的工作重心将放在AI语音产品的二次开发上,力求通过文化和发展模式的创新,为用户带来更丰富的产品和体验。

1. AI主播类型进一步丰富

首先,丰富AI主播选项成为阅读听书平台的开发空间。在线阅读平台方面,各平台主播可选范围区别较大,如连尚免费读书平台只有一个AI主播,而掌阅、QQ阅读等平台有十多个AI主播选项;有声平台方面,目前用户端AI主播不可选,此场景下,大众音、普通话是保证播放量的做法,但这不利于听众个性化需求的满足。其次,方言成为满足用户个性化需求的新入口。方言作为可选项,有利于增进听众的亲切感。内容方角度上,目前提供方言服务的平台有掌阅、QQ阅读、咪咕阅读、米读小说;技术方角度上,方言领域走在前端的讯飞有声支持200种声音,但大部分的方言还不行。再次,个性化语音定制将成为趋势。早在2013年,科大讯飞为高德地图定制了林志玲、郭德纲的导航语音包,[9]这种专业定制声音的方式,现在普通网民用户也可以轻易实现。2018年9月,讯飞阅读推出定制声音功能,用户按要求朗读1 000字左右的指定文本,上传声音后,系统会自动采集音色,使用户成为主播。2020年5月,与科大讯飞合作的咪咕阅读开始推出定制朗读语言包。相信语音定制服务在各阅读听书平台的普及指日可待,未来,每个人都可以自己当主播。

2. 场景服务理念进一步加强

首先,有望实现智能区分内容场景,分角色匹配AI语音。语音合成可以发展到根据文本内容,或人工对文本做特殊标识,AI自动区分情景,并为各发言人匹配对应的AI角色语音,甚至匹配适合该场景的情感,通过情景代入演绎出更完美的声音。其次,有望实现场景分发机制,为听众提供基于“场景+兴趣”的AI语音推荐。用户在不同时间、地点、场合,倾向于选择收听的内容、AI主播类型、音量等均可通过该用户的大数据分析得出,通过绘制千人千面的个人场景图谱,完成场景分发,逐步实现从感知智能向认知智能的跨越。

3. 智能融合思維进一步深化

首先,通过融入AI语音识别理解技术方便听众互动可能会成为阅读听书平台的刚需性应用。人们听书常处于双手、双眼不便时,所以,交互操作如果能通过语音唤醒、语音交互、人机对话指令来完成,听书将能适应更多的场景,而这可以通过融入AI语音识别理解技术来实现。该技术是指将语音信息自动转换成数字设备可理解的文本信息,并给出正确的回应。[10]目前,语音识别系统对普通话的识别准确率可达98%,方言准确率可达80%,[11]且支持中英语音混合输入,语音识别理解技术已被应用于智能客服、智能电子设备(如小爱音箱)等领域。因此,阅读听书平台已经具备通过语音指令实现人机交互的技术条件。其次,为了迎接“5G+物联网”的时代变革,阅读听书平台已经开始对接智能家居、智能穿戴、智能车载系统等声音驱动设备,未来,融合将进一步加深,AI语音系统格局将被拓宽,阅读场景越来越丰富,听书越来越便捷。

结语

AI合成语音改变了阅读听书的方向,为语音信息的生成和传播提供了新的选择,且更加高效、便捷。用户的支持和热情使阅读听书越来越成为AI合成语音技术重要的应用场景,但AI语音质量提升需要技术商和内容商的共同发力。作为具有颠覆性的技术,AI合成语音带来的影响是深远的。作为初入局的阅读听书平台,对其轻视可能意味着与强者地位失之交臂。[12]在AI语音技术取得日新月异发展的当下,阅读听书平台要做好灵活应对甚至切换赛道的准备。相信在价值坚守与创新驱动的双重加持下,AI语音与阅读听书的融合可以更好地服务社会,促进文化的传播。

参考文献:

[1] 王秋:2022年中国将成有声书市场第一大国 用户将达5.62亿[EB/OL].[2020-10-20].http://finance.sina.com.cn/meeting/2020-10-21/doc-iiznezxr7205015.shtml.

[2] 牛禄青. 智能语音时代来临——专访清华大学电子工程系副教授吴及[J]. 新经济导刊,2013(7):32-37.

[3] 郝丽娜. 新媒体形势下智能语音的发展[J]. 新媒体研究,2018(5):35-36.

[4] 姚争,刘力军,张树楠. 智能语音技术视域下播音与主持专业应变策略研究——基于申报国家一流专业建设点的数据分析[J]. 吉林艺术学院学报,2020(4):48-59.

[5] IT之家. 微软人工智能语音技术支持“多情感程度”调节,细腻演绎“人声”[EB/OL].[2021-04-12].https://baijiahao.baidu.com/s?id=1696822476206922372&wfr=spider&for=pc.

[6] 喻国明,王文轩,冯菲,等. 合成语音新闻的传播效果评测——关于语速影响的EEG证据[J]. 国际新闻界,2021(2):6-26.

[7] 刘一鸣,高玥. 人工智能语音在有声读物中的应用研究[J]. 出版发行研究,2019(11):35-39.

[8] 张建中. 声音作为下一个平台:智能语音新闻报道的创新与实践[J]. 现代传播,2018(1):148-153.

[9] 于继栋,刘胜男. 当传媒业遇到智能语音技术[J]. 中国传媒科技,2015(7):14-17.

[10] 李刚. 智能语音识别技术的架构与设计[J]. 电脑知识与技术,2018(18):175-177.

[11] 朱飞虎,徐康生. 智能语音平台上媒体的发展逻辑[J]. 新聞世界,2018(10):36-38.

[12] 石群峰. 智能语音催生传媒发展新机遇[J]. 中国传媒科技,2015(7):18.

Application Progress, Quality Status and User Acceptance of  AI Synthetic Voice on Reading and Listening Platforms

SUN Yan-hua(College of Communication, Qingdao University of Science and Technology, Qingdao 266061, China)

Abstract: AI synthetic voice has the advantages of intelligence, standardization and low production threshold, and increasingly become a new favorite on the audiolization of reading and listening platforms. The evaluation observation, listening and proofreading experiment results show that there is still much room to improve the AI synthetic voice quality on the reading and listening platforms. As to the problems of weak emotion, a lack of smoothness and fast speed, we can improve them by the combination of AI technology and manual labor, emphasizing the role of punctuation, designing original speed as 270-290 words / min, proofreading and so on. Judging from the playback volume and rating, the users' acceptance of the AI versions is better than that of the manual version, which is related to the timely updating, less interruption and price advantage of the AI version. Providing users with richer products and better services through the secondary development of AI voice products will become the focus of the reading and listening platforms in the future stage.

Key words: reading and listening platform; AI synthetic voice; application; quality; user acceptance

猜你喜欢

质量应用
质量守恒定律的应用
二年级下册期末质量检测(一)
多媒体技术在小学语文教学中的应用研究
分析膜技术及其在电厂水处理中的应用
GM(1,1)白化微分优化方程预测模型建模过程应用分析
煤矿井下坑道钻机人机工程学应用分析
气体分离提纯应用变压吸附技术的分析
会计与统计的比较研究
如何搞好期末复习
睡个好觉