APP下载

低功耗智能蓝牙云交互耳机的设计与实现

2018-01-04陈飞

电脑知识与技术 2018年28期

陈飞

摘要:该文针对蓝牙耳机功能单一、续航能力短等问题,选取QuickLogic音频芯片和CSR蓝牙芯片,基于Iflytek AI智能语音服务设计了具有云交互能力的智能耳机。该耳机通过语音唤醒关键字控制、发送语音信息,实现获取新闻、问题、音乐等内容;通过关键字命令控制,无须手动切换,实现音频播放控制,极其方便实用。功耗模块设计能检测耳机的工作状态,灵活休眠、唤醒耳机设备,有效地提升了耳机的续航能力。

关键词:语音唤醒;云交互;智能耳机;功耗控制

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2018)28-0234-02

The Design and Implementation of a Low-Power Cloud Interactive Headphone Based on Bluetooth

CHEN Fei

(Shenzhen Grandsun Electronic Co., Ltd., Nanjing 211100, China)

Abstract: In view of few functions and short battery life of Bluetooth headphones, this article selects QuickLogic audio chip and CSR Bluetooth chip to design smart headphone with cloud interactive capabilities based on Iflytek AI intelligent voice service. The device awaken by keyword from deep sleep, and then the voice information is sent to cloud and parsed to obtain various news, questions, music and other content; through the keyword command control, user can conveniently control audio playback without manually operation. Power module can detect the working status of the headphone, flexible sleep, wake up the headphone device and effectively enhance power saving.

Key words: Sound wake-up; Cloud interaction; Smart headphone; Power control

藍牙技术是一种可靠的短距离无线连接技术,以2.4至2.485 GHz的ISM频段为载波进行通讯,目前最新的蓝牙5.0版本能够实现高达2Mbps的速率。因其低延时,低功耗高速率特性能实现高品质音乐传输,各式各样蓝牙耳机应运而生。蓝牙耳机最大的优势在于能实现高保真音乐播放,同时用户可以不用携带音频设备而在较大范围内随意移动,十分便利,因此应用空间极大。但功能单一,续航时间短是大多数蓝牙耳机普遍存在的问题。本文利用CSR蓝牙技术芯片[1]和Quicklogic音频处理芯片[2]与手机云处理应用相结合,设计一种智能的云交互蓝牙耳机,使用户能随时聆听感兴趣的音乐、问题、新闻等。新颖的命令模式,可以通过语音就能实现音频的播放、切换、音量调节等操作。配戴检测机制能及时检测耳机是否佩戴,从而灵活控制电源通断,从而延长续航时间。

1 系统结构

智能蓝牙耳机系统主要由三大部分组成,耳机系统、手机端云应用、云端。耳机系统包括音频处理模块,蓝牙模块,功耗控制模块。手机端云应用是自主设计的,工作于便携智能设备(如手机)上的应用程序,系统总统结构如图1。

音频模块负责音频采集,本地语音识别。语音识别用于唤醒云交互,或者控制音频播放。通过对硬件资源、处理能力的研究,选取Quicklogic芯片EOS S3(下文简称S3)实现音频处理,该芯片具有丰富的音频及输入输出端口,可以实现模拟或数字麦克风接入、音频数据采集或输出等功能。功耗控制模块的核心为距离探测传感器,当检测到未配戴时,使耳机系统进入休眠模式,达到省电效果。以CSR为核心的蓝牙模块实现耳机设备与手机端的连接和数据传输。语音数据从音频芯片读取,能实现蓝牙电话、持续音频数据流发送。手机设备端应用通过在云端处理蓝牙音频数据,解析语音的意图,根据解析结果做出相应处理。

2 系统硬件设计

2.1 EOS S3音频硬件实现

传感器芯片S3具有丰富的硬件接口和强大的音频处理能力,核心为Cortex-M4F及uDSP,可运行实时操作系统实现软件控制,高达512K SRAM确保软件高速运转,可实现音频算法如噪声抑制(ANS)[3],回声消除(AEC)[4]等。DMA及FIFO设计能加速内部音频数据传输,尽最大可能减少延时。两路I2S 和PDM接口适应模拟或数字麦克风连接,同时实现与外部I2S设备通信。8路带中断能力IO能轻松实现与外设的连接控制。UART通信端口可用来实现命令控制字传输。

本设计采用双数字麦克风与PDM接口相连,在芯片内部转换为PCM数据。UART,I2S与中断IO分别与蓝牙芯片CSR对于端口相连。图2中EOS S3是音频芯片的主要实现电路。

2.2 功耗控制电路

接近传感器芯片采用SFH7776,具有一路I2C和一路中断IO。通过I2C配置参数实现中断产生条件,如低于1CM或大于10CM时产生中断。图2所示,接近传感器与S3相连,上电时通过I2C在S3内编程配置,中断信号连接到S3,条件满足时,唤醒S3。S3根据实际状态,决定是否需要唤醒蓝牙模块。

2.3 蓝牙模块

CSR8670是专为高质量音频传输设计的可编程蓝牙处理芯片。集成双声道模式蓝牙音频,拥有一颗低功耗的DSP做音频处理。双声道16-bit ADC 高达48K采样率,双声道16bit DAC 高达96K采样率[3],高保真音频输出。 I2S接口支持主流的24bit音频数据格式。充电电路支持高达200ma电流输出,减少充电电路设计的额外开销。蓝牙电路硬件设计结构如图2中所示。图中ANT处为射频电路,是与远端数据交互的接口,UART、I2S、CSRIRQ,CSRWAKIRQ1网络标签与音频芯片S3对应连接,实现消息交互。

3 软件设计

3.1 EOS S3软件框架

S3音频采集、处理软件(如图3)基于FreeRTOS实现,该系统免费开源,具有可裁剪、可移植、调度灵活、多任务等特性。

音频数据采集与发送、语音唤醒、噪声消除、中断处理是需要实现的主要功能。系统上电复位,初始化时钟、中断、硬件资源,然后启动各任务线程。语音数据缓存满时,由中断内发送消息给噪声处理线程做ANC处理,然后再发送给语音关键字检测线程。经过ANC处理的数据除去大部分噪声,尽最大可能保留真实语音信息,能提高唤醒准确率。关键字算法检测分两种,一种为唤醒模式,一种为命令模式。唤醒模式只检测唤醒关键字,当检测到关键字时,发送中断到CSR8670,开启语音传输,与云端进行语音交互。命令模式检测不同的唤醒关键字,然后再检测命令,比如控制命令“艾伦,暂停”中,“艾伦”是关键字,“暂停”则为命令。命令由UART发送到CSR8670,经过处理后发送到手机端解析,执行相应操作。

3.2 蓝牙模块软件框架

蓝牙模块需要实现的功能有I2S主接收、UART接收、音频DAC输出、中断处理等。图4为软件处理流程图。蓝牙模块处理的数据有音频数据和控制命令两种。音频数据主要针对SCO、A2DP、语音交互等模式。语音交互时,音频数据直接发送给手机端云应用做语义分析。从UART端接收的控制命令需要解析与编码,针对不同的命令,如音量增加、暂停等做封装再发送。中断程序接收到S3的唤醒中断信号后,唤醒蓝牙芯片,进入工作模式。

3.3 云应用软件框架

手机端应用CloudEcho 基于Iflytek AI语音引擎实现,负责处理蓝牙音频信息,数据信息,音频播放,音频云端解析等任务。Iflytek的AI 语音引擎具有强大的语音处理能力,此处主要用语意理解,语音合成等服务。图5为应用与语音引擎之间的处理流程。语意理解的所有回答通过开放技能或自定义技能给出,返回结果为文字或者语音数据。为文字时,通过语音合成服务转换为语音以蓝牙播出,为音频数据时,直接通过蓝

牙播出。CloudEcho对耳机和云端的数据分别处理,实现智能问答、音频播放等。

4 结论

本文所设计的智能蓝牙云交互耳机具有友好的体验效果,双声道音频设计和高采样率DAC解析实现高品质音频播放。多样化本地命令控制轻松实现音乐播放控制。功耗控制方案有效节省闲时功耗。此方案所选取的硬件成本略高,但对于高端智能无线耳机的解决方案具有较好的参考价值。

参考文献:

[1] Cambridge Silicon Radio. BlueCore Bluetooth chipset. Online at https://www.qualcomm.com/products/bluetooth.

[2] QuickLogic, Introducing the new EOS S3 LV (Low Voltage) platform - the latest addition to the EOS S3 Voice and Sensor Processing Platform Family.[2018].https://www.quicklogic.com/platforms/sensor-processing/eos/.

[3] J. Thiemann “Acoustic Noise Suppression for Speech Signals Using Auditory Masking Effects” // Ph.D. thesis, Department of Electrical & Computer Engineering, McGill University, Montreal, Canada,2001.

[4] Y. Lu, R. Fowler, W. Tian, and L. Thompson, Enhancing echo cancellation via estimation of delay, IEEE Transactions on Signal Processing ,2005, 53(11):4159-4168.

【通聯编辑:唐一东】