人工智能实验:大班教学场景中语音识别演示实验教具的设计
2021-11-14于恺于方军
于恺 于方军
语音识别是一种广泛使用的人工智能技术,借助它可以实现交互对话、搜索新闻、天气查询等功能。使用语音识别技术的语音助手尽管种类很多,但是其工作原理大致相同,都经历了“识别—决策—控制”的过程。目前,使用如掌控板一类的教具已经很容易将此过程在演示实验中实现,即借助掌控板实现语音控制灯的开启和关闭,这样可以帮助学生理解语音识别技术并实现语音控制功能。
在大班教学的分组实验中,语音识别且反馈的过程是很快的,但这种“快”会掩盖语音识别的具体过程。为了让语音识别的过程显性化,笔者使用掌控板制作了一款语音识别演示教具(如图1)。识别步骤为:第1步,通过麦克风收集学生说出的指令;第2步,通过降噪等功能将学生说出的模拟信号转换为数字信号,掌控板生成录音文件;第3步,将录音文件上传到云端语音识别服务器;第4步,云端的语音服务器结合声学模型、语言模型对录音文件进行解析,生成文字信息并将文字信息传回到掌控板;第5步,根据文字内容进行条件判断,生成相应指令,并根据指令完成相应任务。这款演示教具的右下角是一个旋钮,从右向左,逆时针依次为:录音、生成音频、音频上传、文字下载、开灯和关灯。学生通过旋转旋钮来进行语音识别的各个步骤,教具将掌控板进行录音、声音数字化、录音上传、数据下载等步骤形象化,让学生感知云语音识别的过程,理解现有语音助手的工作过程,掌握云语音识别技术。
演示教具的控制系统设计
笔者设计的这款演示教具使用了两块掌控板,一般而言,如果是学生分组实验,一块掌控板就足够了。本演示教具使用两块掌控板的原因在于,一块作为控制板通过旋钮控制演示板上的各种输出设备发出动作或者亮光等效果,提醒学生注意语音识别的各种步骤;另一块则作为语音演示板,在控制板的远程控制下显示最终的控制效果。
同时,在控制板上连接一个旋钮控制器,通过旋转相应的角度实现对语音识别的过程分解,最终达到分步演示的效果,控制板上的OLED屏幕用于显示每个步骤的内容。旋钮旋转到语音识别的各个步骤,以下器材依次运动,以实现演示教具的演示功能。首先,舵机1控制代表声波图片卡摆动,表示语音识别过程中的录音步骤;其次,舵机2摆动表示将获取的声音数字化并存储的过程;再次,10灯珠灯带中流水灯向上向下的过程表现音频上传云语音识别服务器及识别后的文字下载过程;最后,控制板发出控制信号,语音演示板上的LED灯展示语音控制灯的开启和关闭(如图2)。
语音识别教具的程序流程
本语音识别教具的程序设计分为两部分,一部分为控制板的程序设计,另一部分为语音演示板的程序设计。控制板的程序需要通过旋钮控制器实现,分为7个部分:START、录音、生成音频、音频上传、文字下载、开灯、关灯。这个过程通过P0端口连接旋钮的输入值来实现对屏幕、舵机及灯带的控制。具体过程如图3所示。
语音演示板主要接受控制板的命令,根据广播的内容完成相应程序指令,实现控制LED灯的开启和关闭。语音演示板接收到廣播为“start”,清空屏幕;接收到广播为“kai”,清空显示开灯,3个LED灯亮白灯;接收到广播为“guan”,清空显示关灯,3个LED灯关闭。程序流程如下页图4所示。
在本程序中,语音识别演示板可以看作是一种通过无线连接的输出设备,该演示教具的重点是通过舵机、灯带、语音识别演示板表现线性结构,通过交互体现具体顺序,突出语音识别的核心过程,以便对单机版语音识别实验的过程展示得更直观、细致。
师生共同设计演示教具的教学意义
制作演示教具的目的是将抽象的知识直观展现出来,帮助学生理解抽象知识。在本语音识别演示教具的设计中,笔者以语音方式控制LED灯的开启和关闭为演示内容,并结合掌控板进行制作,引导学生理解语音助手的工作流程及相关技术,以期突破语音识别的教学难点。同时,教具的制作过程也可以让学生参与,并将教具的制作作为项目学习的课题,以引发学生对教具制作的深入思考及探究。
演示教具的设计是师生共同进行知识梳理,并用可视化的互动媒体手段实现的一种过程,这个过程在呈现上需要一定的技巧。例如,在音频文件需要上传语音服务器才能够实现语音识别、生成文字,然后将服务器数据下载到掌控板的过程中,笔者尝试了多种方案,最后选择了使用10灯珠灯带进行演示,并利用流水灯的方式体现数据的上传和下载过程。流水灯的效果是一种比喻,是为了让学生了解网络中“包”的作用,因为LED灯本身就是一个个的数据包。
虽然本语音识别演示教具直观展现了语音识别的过程,但还有很多需要改进的地方,如用旋钮演示各个步骤,理论上学生并不需要真正说话,就可以控制最后的灯光的状态。后续,笔者还将针对互动演示教具继续探究,希望将演示教具和分组教具更好地结合起来,真正达到环境育人的效果。