APP下载

语音交互及语音智能设备

2018-04-23墨汁做寿

电脑爱好者 2018年7期
关键词:音箱手表智能家居

墨汁做寿

语音交互与语音识别

与我们已经习惯的所见即所得操控交互方式不同,语音操控可以让用户无需接触输入设备进行远程操控,在很多情况下设备也会以语音方式进行回馈,所以用户也无需注视设备。无需接触和注视设备的交互和操控方式,在很多情况下有着非常重要的意义,例如在运动、驾驶时,可以对多媒体、通讯设备等进行操控(图1),无需使用双手和转移视线,显然更加安全。

与PC时代和早期的语音识别技术不同,目前语音交互中最关键的语音识别和语义解释能力,大部分并不是基于本机的数据库和计算能力,而是通过互联网连接到厂商的语音引擎,甚至可能是厂商购买的各大语音引擎提供商的相应服务器上进行处理的。借助服务器端提供的超大数据库和强大的计算能力,现代语音交互的能力当然可以远超单机端,不过不同的智能产品,实际的交互能力还是从限定的单词到比较随意的日常语言都有,其使用的方便程度恰恰就反映出这些智能产品的智能程度。

语音交互能力實测

在选择语音设备的时候,应该注意哪些问题呢?其实从很多发布会的演示就可以看出来,影响语音交互能力的主要就是识别能力,而识别能力的内在是数据库和计算能力,外在则是拾音效果。不过,科技大佬们在展台上的讲话和演示实在距离我们太远,因此我们自己也进行了一些测试,来看看不同设备和使用状况究竟会对语音交互能力造成怎样的影响。

外部环境测试中,我们采用手机安装识别率非常好的讯飞语音引擎进行测试,分别在特意靠近至离嘴部仅有30cm,以及距离1m左右的典型使用距离下,还使用了外接蓝牙耳机。同一台手机在30cm距离上的语音识别效果很好,基本可以做到不遗漏地执行所有操作和输入任务(图2),在1m处则出现了一些识别错误,且加大声音也不能获得完美效果,这应该与外界干扰和拾音的定向能力有关(图3)。需要注意的是,我们的测试为相对安静的室内环境,如果在室外或行车途中,因为会收录到更多的环境噪声,识别率还会下降。

在外设测试中,我们使用了多款蓝牙和有线耳麦,测试过程中出现了非常有趣的问题,部分蓝牙与有线耳机的识别效果与在近处使用手机麦克风类似,识别能力很不错,但也有通话质量非常好的耳机出现了与语音软件的兼容性问题。另一方面,有些耳机自带语音控制键(图4),可启动大部分手机、平板电脑等设备自带的语音软件,也可以明显提升语音互动功能的易用性。

内在能力的测试与各个厂商的技术有关,由于各个厂商甚至各个版本的着重点不同,在各个方面的表现可能出现特别明显的差异,我们更需要的是与设备定位最适合的能力,而难以判断哪一个厂商的产品是最好的。所以我们尝试进行了另一项测试,那就是使用同样引擎的产品,是否会有性能差异,例如内地厂商广泛采用的讯飞引擎,在不同的设备和APP中是否会有不同的表现。

我们使用多个基于讯飞语音引擎的手机自带语音互动程序和基于讯飞语音引擎的APP,如语点数码、咪咕灵犀、讯飞输入法等等。另外笔者也有幸接触过一些机器人生产商,并进行过一些实际体验,这些机器人产品的语音智能部分,同样大都是使用讯飞的技术。从笔者的测试看,这些产品除了定位功能不同外,竟然也存在着语音识别的差异,这可能与各个软硬件厂商自身的一些优化设计有关,也可能与其购买的讯飞服务等级有关系。

从以上的结果可以看出,即使是使用同一技术或同一品牌,甚至同型号不同档次的语音互动设备,都可能存在着性能的差异,大家在实际选购时应该予以重视。

语音交互设备

前面已经提到,语音交互是目前智能化产品中使用最广泛的智能交互方式,几乎所有类型的智能设备,如智能手机与平板电脑、智能穿戴设备、智能家居等,都大量使用了这一交互模式。我们以下介绍的只是其中一些常见或典型的产品,仅供大家了解或参考选择。

小米AI音箱

AI音箱是近期智能硬件的热点之一,市场嗅觉一向灵敏的小米当然也不会放过这个领域,小米AI音箱就是一款性能全面、价格实惠的产品。虽然价格并不昂贵,但这款音箱的定位却相当高,它并非是简单的陪伴式互动产品,而是加入了智能家居控制、自我学习与记忆能力,大大提升了实用性(图5)。

小米AI音箱的最基本功能是各种语音交互和陪伴能力,例如可以用语音操控其音量、播放,也可以要求它播放一首歌、念一首诗、读一篇童话故事或是询问今天的天气等。如果家中有兼容的智能家居,还可以将其与智能家居连接,作为智能家居的中心,通过语音直接操控这些智能家居产品。通过学习与记忆能力,用户可以让其逐渐了解自己的欣赏习惯、保留语音备忘、设置闹钟等。再进一步,用户可以让它提供更智能化的服务,例如起床、离家或回家后,只需要一个特定命令,就能通过小米AI音箱同时指挥多个智能家居提供服务。如离家时向小米AI音箱道别,就会自动关闭一些电器和灯光等,而归家后只需打个招呼,就可以开启灯光、热水器、咖啡机等。

科大讯飞阿尔法小蛋

目前很多所谓的机器人,实际上就是一种基于语音交互的智能前端设备,例如科大讯飞自己推出的阿尔法蛋系列产品。阿尔法蛋有多种产品,尺寸差异较大,但外形设计和基本能力類似,搭载讯飞淘云TY OS智能系统,主打陪伴市场(图6)。

阿尔法小蛋主要面向儿童市场,可以提供语音互动、云端资源、双语教学、生活查询等功能,其中语音互动则包括与家长的远程聊天和通过讯飞技术与阿尔法蛋进行语音交流。其前端的屏幕可以显示多种表情或播放视频,让孩子获得更好的交互体验。

● 暴风Real 6智能投影机

暴风电视系列已经全面进入了AI智能时代,全面采用语音操控,而其面向大屏需求推出的“无屏电视”,即Max 6和Real 6投影机也具有相应的功能。相对于Max 6,更新的Real 6除了在亮度、投影性能等方面进行了升级,也提升了语音交互能力和智能表现,用户可以用日常语言对Real 6进行操控,并且可以同时布置多个任务。而Real 6除了能够自行分析用户语言,更准确地理解操控指令外,还可以分辨家庭内多个用户的语音,并通过各个用户的常用操作,猜测用户的喜好,针对性地进行个性化推荐(图7)。

暴风的其他电视机(图8)在语音互动和AI方面的表现也比较突出,相对于使用遥控器进行语音操控的很多其他品牌产品,暴风更强调直接语音操控,特别适合无法使用遥控器的场合,如厨房,或者不适合学习使用遥控器的用户,如儿童或老人。因此其“暴风大耳朵”系统就需要使用更灵敏、聚焦范围更广的拾音装置,并且能够更好地分辨人声与噪声、日常对话和命令语句。

Ticwatch 2悦动智能手表

智能手表,特别是偏向运动的智能手表,也是非常适合语音互动的智能设备,毕竟手表表盘的面积相对于我们的手指来说过于狭小了。Ticwatch 2悦动智能手表是一款高性价比的全能型产品,它在不足千元的价位上,提供了计步、心率、GPS定位等运动功能,同时支持手表听歌和离线支付功能,并且有多款色彩和大量表带设计可选。在不同的使用状况下,Ticwatch 2悦动智能手表的续航时间在12小时~48小时之间,基本可以满足日常使用和出游的需要, IP65的防护级别可以保证用户在户外运动时无惧雨雪,但不能佩戴它游泳和洗澡(图9)。

这款手表的语音助手支持拨打电话、查询地图和各种信息、翻译、设定闹钟等多种功能,配合其特色的手势操作、表壳触控等,可以快捷地进行各种操控。Ticwatch还提供了多个系列和定位的智能手表产品,均支持语音互动,对自主通话、NFC、高端防护等有需求的用户,可以选择Ticwatch的其他智能手表产品(图10)。

其他

作为一种特色鲜明,同时门槛相对较低的智能互动方式,语音互动设备和相关产品非常多。例如一些蓝牙耳机就自带语音互动按键,在与兼容的手机配对后,可以很方便地呼出语音助手。另外还有一些大家可能很少了解的产品,例如支持语音的鼠标(图11)、可通过语音进行遥控的电视遥控器等,它们同样会带给用户新鲜便捷的使用体验,而且大都价格并不昂贵,对语音互动方式感兴趣的朋友不妨考虑入手。

猜你喜欢

音箱手表智能家居
KEF推出新一代LS50 Wireless Ⅱ音箱
Polk(普乐之声)推出高端Reserve系列音箱
是谁拿了手表
谁偷走了手表?
小音箱,大精彩 B&W 805 D3尊贵版书架音箱
多一对音箱,多一份惊喜Marantz AV8805
基于Zigbee的无线通信技术在智能家居中的应用
嘻嘻猴手表
关于智能家居真正需求的探讨
基于LD3320的智能家居控制