新一代微软语音合成技术简介
2009-03-07为本
为 本
随着微软最新的个人电脑操作系统Windows Vista推出,微软新一代语音合成与语音识别技术,即Text-To-Speech和Speechrecogintion技术也进入了千家万户。而此前语音合成技术主要应用在电信等行业,例如常见的电话语音服务。目前国内外有相当多的公司推出了成熟的语音合成与语音识别技术和产品,支持的语言有英文、德语、法语、西班牙语、俄语、意大利语、荷兰语、日语、韩语、中文等等。微软看来也准备在该领域凭借自己在个人电脑操作系统上的优势继续发挥令人瞩目的作用。
微软英文版Windows Vista内置一个高质量的语音合成引擎——美国英语Anna语音引擎,而简体中文Windows Vista同时内置了两个高质量的语音合成引擎——美国英语Anna和汉语普通话Lili,这两个女声语音引擎,音质相当不错,并且汉语普通话Lili语音引擎支持中英文混读,较前一操作系统Windows XP上的仅有的Sam英语语音引擎,音质音色有了质的飞跃,与其他专业的语音合成与语音识别技术公司的产品已不相上下。
电脑用户可以使用Windows Vista或XP上默认安装的语音合成软件、如Win-dows XP上的Narrator,来让电脑朗读文件,这就可以减少眼睛疲劳,保护视力,另外对于语言学习也很有用。也可以从网上下载免费软件,如panopreter,它具备中文、英文界面,与微软语音合成技术相互兼容,支持多种语言的语音引擎朗读,并且能批量地把文件转化为MP3文件,是一款功能较强的语音合成产品。由于中文XP系统只默认安装了一个英语语音引擎,其语音效果不如VISTA系统上的语音,XP用户建议安装cepstral语音朗读引擎。
微软将语音技术投入于主流使用,从而促生了一些产品,例如:Speech Server,应用于电话的语音系统等。有理由相信微软将推出更多更好的产品,拭目以待吧!