APP下载

智能英语语音训练平台建设研究

2021-07-14刘晓羽

江苏教育 2021年17期
关键词:南京市发音语音

刘晓羽

一、英语语音训练平台的建设背景

长期以来,因为缺乏母语环境,小学生英语表达能力相对较弱,哑巴英语的现象在一定范围内仍然存在。为此,2018年9月至12月,南京市电化教育馆、南京市教研室借助凤凰智能英语语音训练平台,举办了南京市小学生“讲故事—展风采”英语素养展示活动。本次活动全程使用线上微信小程序,搭载人工智能语音评分引擎,并遴选优秀教师研发语音训练内容。在多方共同努力下,全市238213名学生参与其中,成功收集语音数据8177175条,不仅提升了南京市小学生的英语听说能力,而且为南京市英语听说学习的数据分析打下了基础。

为了进一步巩固此次活动的成效,扩大活动的影响力,促进南京市小学生英语表达能力的提升,南京市电化教育馆与教研室从2019年起,逐年开发涵盖英语听说读写四个方面的数字化资源,与教育教学部门长期合作,开展常态化的英语语音训练活动。

二、英语语音训练平台的技术架构

语音训练平台主要基于微信小程序,包含学生训练、教师查询和后台管理、统计数据可视化服务三大功能模块。为学生、教师、教育主管部门提供同步的数据分享服务以及学习过程性数据报告,使数据分析为英语学科教学服务真正落到实处。

平台架构(如下页图1所示)采用公有云与私有云结合的方式部署,将微信小程序作为入口,将练习资源发布到公有云上,使用CDN加速,保障学生在大量用户同时请求的情况下能够正常访问;将分析功能、数据存储及备份放在私有云上,为将来的“人人通”空间数据共享做准备。

图1 英语语音训练平台架构

语音引擎是整个平台的关键。我们对多家公司的语音引擎进行测试,最后选择了微软亚洲研究院开发的语音引擎和语音合成技术。借助人工智能技术,语音训练平台能够为教师节省更多的时间和精力,成为教师掌握学情的重要工具。

三、英语语音训练平台的数据采集

经过前期的招标、开发和测试,2020年10月,微信小程序“英语蓝鲸灵”正式上线,该公益项目为南京市小学三至六年级近22万学生提供在线英语语音训练服务。在开通后的几个月内,一共采集了3万名学生的学习数据并进行数据分析,初步研究学生线上语音训练的行为规律。

“英语蓝鲸灵”微信小程序在南京市部分区试用,我们及时收集学生的训练反馈意见。学生进入小程序后选择训练章节,系统会自动推送本单元的训练内容,学生可以依次完成五种题型训练,也可以随时退出,以后再继续练习。学生每完成一个训练内容,系统会自动给出分数,也可以集中查看自己每个题型的练习成绩。在整个训练过程中,系统采集了大量的学生学习过程数据,比如:学生的登录和退出时间、选择了哪些学习内容、训练后语音引擎给出的分数以及学生发音的录音文件等。

四、英语语音训练平台的使用情况

随着平台使用人数的增加,我们对平台使用情况做了统计。通过数据分析,市教研室对全市学生的学习规律和习惯有了初步了解。

1.样本年级人数构成。

以3万名小学生作为样本,并根据全市各年级学生使用“英语蓝鲸灵”小程序人数的比例确定各年级样本人数。同时确定样本性别比例构成:其中男性7420人,女性22580人,男女比例约为1:3。样本性别数据来源于微信小程序官方授权信息,虽然小程序的使用者是学生,但小学生大多是借用家长的手机及微信号,因此,该数据反映的主要是家长的性别构成。数据显示,小学生的家庭中大多数是由母亲负责督促和陪伴孩子进行英语语音学习。

2.使用时长统计。

我们选取2020年10月1日至12月6日这个时间段,统计单日内用户在线学习平均时长分布,单用户每日在线学习平均时长为387.98秒(约为6.5分钟)。学生每日在线学习平均时长的高峰和低谷区反映学生的主要学习时段集中在16:30~20:30。以10月5日至10月25日这三周为研究周期,分析每周全体用户在线学习时长的变化。第一周在线学习时长为参考值,第二周达到峰值,第三周回落。这些数据说明学生课后训练英语口语和听力的热情会随着时间的推移下降,需要我们及时引导或激励。

3.学习进度分析。

为了研究学生在线学习的进度与学校教学进度之间的关系,我们抽取了200名学生首次学习各个单元的时间与教学进度的时间进行对比,发现大部分学生在最初使用“英语蓝鲸灵”小程序的时候,训练进度绝大部分滞后于教学进度,但也有部分学生尝试训练没有学过的章节,这说明学生能够根据自己的学习情况自行调节学习进度,进行预习、复习。基于此,教师要及时予以引导,同时鼓励学生根据自己的需要进行个性化学习。

五、英语语音训练平台引发教与学变革

小学是学生英语学习的开始阶段,也是英语发音形成特点的阶段,如果学生在小学学习英语时就能进行系统训练,对将来提高英语听说能力很有帮助。正是基于这个原因,很多小学家长和教师都很重视语音发音训练,对这个平台的训练效果也非常认可。英语语音训练平台的使用引发了教与学方式上的变革,让人工智能语音引擎发挥了更大的作用。

1.教师能够精准掌握学情,因材施教。

教师通过后台分析,了解学生的训练进度和训练情况,以及他们的口语和听力水平。教师可以把分数较低的学生作为重点辅导和训练对象,因材施教。从采样数据的分析看,学生英语口语发音的准确性和得分率确实随着训练时长的增加在进步。由于采用了人工智能语音引擎去完成训练评分,高质量的训练资源由教研室统一制作,减轻了教师的工作量,提高了工作效率,也让教师的教学方式发生了变化。

2.学生口语训练方式发生改变。

以前学生的口语训练主要是通过课堂朗读和课后背诵来实现,通过磁带和光盘来锻炼口语和听力,训练效果无法及时反馈。而使用训练平台后,语音引擎会根据评分标准进行评分,学生能够立刻看到自己的训练分数,系统还能分别用绿色和红色标记凸显发音好和不好的单词,让学生能够更直观地发现问题。学生也可以回放自己的发音,与标准的发音进行比对。同时,学生也能看到同班同学的训练情况,内心的竞争意识会促使他们更好地训练。

3.促进优质训练资源的开发。

南京市教研室每学期组织南京市优秀名师,根据教学进度、学生年龄和学段特点制作训练资源。目前支持题型包含:听力选文本、听力选听力、跟读、复述、情景问答。为了保证资源的质量和权威性,教研室还专门请专业教材配音人员录制听力内容,统一绘制插图,使资源从题目质量到制作质量都达到了教材级别。根据学生训练数据对资源内容和难度进行调整,随着资源不断积累和增加,逐渐形成一个完整的语音训练资源库。每年举办的“讲故事—展风采”活动也不断为平台添加课外读本和绘本等听说训练资源,让学有余力的学生有更多选择。

4.为教育教学提供数据分析服务。

后台数据统计内容包含:学生训练的题量、完成度、总分数,听力时长,口语时长,学习总时长,训练单词量,语音完成度,发音准确度,发音流利度,语速,课标知识点分布数据等。随着学生训练时间的累积,采集的数据量越来越多,通过数据分析,可以更科学地为学生提出训练建议,也为教师提供了教学参考。

5.促进学生学习习惯的养成。

很多事情只有长期坚持,才会形成习惯,英语学习亦是如此。任课教师每天查看数据统计结果,对没有坚持下来的学生及时督促和提醒,有利于学生良好学习习惯的养成。

六、英语语音训练平台的后续开发

接下来,我们将在平台功能和学习资源上进行开发和升级。通过对学生学习过程数据的分析和挖掘,发现有价值的规律和结果,进一步提升英语教学的效率。英语作文的自动批改已经能够帮助学生检查出语法和单词上的错误,并且可以根据句子的意思推荐更恰当的表达方式,有利于学生提高写作水平。目前的语音识别很多还停留在“speech-to-text”的阶段,需要继续向“speech-to-meaning”的阶段发展。语意识别仍是技术难点,很多研究机构正在进行研究,现在的技术解决的是计算机“听得见”的问题,而在未来“听得懂”才是需要解决的最为关键的问题。自然语言处理的进展还没有找到理想的突破口,若想要达到人类的理解层次,还需要走很长的路。

运用新技术的进步,不断完善英语语音训练平台,并且在平台现有功能的基础上开发学习工具、分析工具以及习惯培养模型,通过规律性和科学性的训练,让学生能够对自己的学习情况有更直观的了解和更好的规划,这对学生形成良好的学习习惯起到促进作用。通过这些年的研究发现,好的学习习惯和科学的记忆方法是学生学习效率高和成绩好的重要因素,通过合适的工具和方法引导学生养成良好的学习习惯是我们对这个平台寄予的希望。

猜你喜欢

南京市发音语音
刘辉
顽皮的云
魔力语音
基于MQ3与MP3的价廉物美的酒驾语音提醒器
数字滤波在语音信号降噪中的应用
对方正在输入……
南京市长
Playing with h
Playing with /eI/
Playing with u_e