APP下载

人工智能技术在微课制作中的应用研究

2023-10-18阳有明

科教导刊 2023年22期
关键词:字幕语音人工智能

阳有明

(广西师范大学职业技术师范学院 广西 桂林 541004)

微课作为一种以微视频为核心的教育资源,以其独特的特性,如精炼的教学内容、随时随地的学习便利性,以及以学习者为中心的教学方法,为教育工作者和学习者带来了全新的学习契机。

2018 年,教育部发布《教育信息化2.0 行动计划》,倡导构建教育资源开发和利用的大平台,并强调利用人工智能和大数据技术汇聚各种优质的教育资源,以实现从“专用资源服务”向“大资源服务”的重要转变[1]。2023 年5 月,美国高等教育信息化专业组织(EDUCAUSE)在其发布的《2023 地平线报告:教与学版》中,已连续四年将“人工智能”技术列为将对未来高等教育产生重大影响的新兴/关键技术和实践[2],进一步凸显了人工智能对于高等教育改革的重大贡献。虽然人工智能在教育领域的应用已得到了广泛的研究,但对于微课制作的应用研究仍相对较少。

1 人工智能技术在教育领域中的应用

1.1 人工智能技术概述

人工智能(Artificial Intelligence,简称AI)起源于20 世纪50 年代,被定义为计算机系统或机器模拟人类智能过程的科学,包括学习(理解新的信息和规则)、推理(运用规则以达到大概或确定的结论)、问题解决、知觉、语言理解等[3]。根据实现的方式和功能,人工智能可以分为弱人工智能和强人工智能。弱人工智能主要关注在特定环境下模拟人的智能行为,如Google 的搜索引擎和AlphaGo。强人工智能则期望在所有智能活动领域达到或超越人的水平,但至2021 年为止,强人工智能仍处于研究和开发阶段。

目前,机器学习和深度学习是人工智能的主要研究和应用方向。机器学习是人工智能的一个重要分支,它通过从数据中学习,改进模型的性能;深度学习是机器学习的一种方法,它试图模拟人脑的神经网络结构,以实现对复杂数据的高效学习。近年来,人工智能技术的快速发展和广泛应用,对社会经济的各个方面都产生了深远影响,教育领域亦是如此。

1.2 人工智能在教育领域的应用情况

人工智能技术已经成为一个创新性的驱动力量,渗透到教育的各个层面,颠覆并重塑了教育领域的许多传统教学方法、教学模式和学习体验。首先,借助深度学习、机器学习等前沿技术,人工智能赋能教学平台与系统,以此实现个性化的教育。具体表现为:智能教学系统能够提供独特的、因人而异的学习计划,对学生的学习过程实行精准追踪并实时反馈与调整,这种适应性的教学方式极大地提高了学习效率。其次,人工智能在学生评估领域的作用也十分突出。AI 系统能够实时监测学生的学习行为,通过深度数据分析预测学生的学习效果及其可能存在的问题,并在关键时刻提供及时而精准的反馈。此外,通过自动批改作业和试卷,AI 显著减轻了教师的工作负担,释放了教师的时间和精力。最后,AI 在教学内容创新方面的潜力也不可忽视。在课程设计和微课制作环节,AI 图像技术、AI 语音识别和合成技术等的应用,显著提升了微课的制作效率和质量,为教学内容的创新和质量提升开辟了新的途径。

2 人工智能技术在微课制作中的典型应用场景

2.1 AI 语音识别技术快速生成微课字幕

字幕,是视频、电影或者视频包装必不可少的一部分,对画面内容起到必要的补充和修饰作用。张宝等(2021 年)研究表明,在微课中增加字幕,可使表述内容更加清晰,学生理解更容易[4]。传统制作字幕需要六个步骤,即听音识字―Word 断句―去除标点―上轨调位―设置格式―校对字幕,制作流程复杂且非常耗时。自动语音识别(Automatic Speech Recognition,简称ASR)是人工智能技术的重要应用之一。它借助深度学习模型(例如递归神经网络或者Transformer 模型)解析语音信号,并将其转换为文字。在微课制作中,这种技术可以自动将教师的讲解或者课程视频中的语音部分转化为文字,从而生成微课字幕。

AI 语音识别技术快速生成微课字幕的工具软件有很多。一类是剪辑软件自带的语言识别生成字幕功能,如剪映、Adobe Premiere CC(2022 以上版本);另一类是第三方(非剪辑软件自带)语言识别生成字幕工具,如网易见外、Arctime 等。AI 智能识别视频语音和生成微课字幕的过程,不仅能节约大量的人工转录时间,而且能保证字幕的准确性和一致性。此外,对于有特殊需求的用户,例如听力障碍者、非母语学习者,或者在学习过程中需要文本辅助的学习者,ASR技术的应用能够极大地提高他们的学习体验。

2.2 AI 语音合成技术生成微课配音与解说

人工智能的语音合成技术,又称为文语转换(Text-To-Speech,TTS)技术,是直接将文本信息转化为语音的技术[5]。在传统微课制作环境中,配音和解说的环节不仅需要大量的时间和资源投入,对于非普通话母语,或者方言比较浓厚的教师,更是一项艰巨的挑战。然而,随着AI 语音合成技术的应用,教师能够将预设的文本信息轻松转换为自然且充满表现力的语音,从而赋予微课更多的活力和生动性。

AI 语音合成技术在微课配音与解说生成方面的优势主要体现在两个方面:一是其个性化的配音能力。基于AI的语音合成技术,教师可以选择不同的语言、口音、音色,甚至控制语音的语调、语速和情感表达,从而达到更为个性化、更符合教学需求和学习者喜好的配音效果。二是其支持多语种的特性。在全球化的教育背景下,教学资源的多语种化成为一个重要的需求。AI 语音合成技术能够支持多种语言的语音生成,通过与自动翻译技术的结合,可以将教学内容翻译成不同的语言,并生成对应的语音讲解,让来自不同语言背景的学习者都能享受到优质的微课资源,从而使微课能够覆盖更广泛的学习者群体。

2.3 AI 图像技术重塑微课制作的视觉体验

AI 图像技术是指通过人工智能的深度学习和机器视觉技术,处理和解析图像或视频的一系列技术。AI 图像技术可以从图像或视频中提取有价值的信息,主要应用在图像识别、图像分割、图像生成、图像恢复、目标追踪、3D 重建等方面,在微课制作中影响广泛、潜力深远,对微课制作的视觉呈现有极强的深度优化作用。

2.3.1 AI 图像分析与解析:引领智能化微课制作

微课制作过程中会用到大量的视频素材、图片素材、音频素材,教师面对剪辑软件中海量的素材,往往心生焦虑、无从下手。AI 图像分析与解析通过深度学习的图像识别算法,使得AI 能够准确地识别并理解图像中的内容,包括人物、物体、场景等。这一功能可以自动完成微课制作素材的自动标注和分类等基础性工作,建立智能精选,方便素材管理归档和搜索。

2.3.2 AI 图像处理与优化:提升微课视觉质量

AI 图像处理技术能对微课的视觉表现层进行各种优化与修饰,如色彩校正、去噪、抠像等,大幅提升微课的视觉质量。其中,尤其值得关注的是AI 智能抠像技术。该技术通过算法将教师或教学物品从复杂的背景中准确提取出来,极大程度地降低了微课的制作难度,并为后续编辑与合成流程提供便利。AI 智能抠像技术有三大显著优势:一是硬件要求低,它不依赖专业级别的摄像设备或特定的拍摄环境,即使是使用简单的相机或手机在非专业的照明环境下拍摄的视频,也能满足抠像要求,这意味着可以大幅降低制作微课的设备和人力成本。二是处理复杂背景,应对复杂背景的自然图像抠像,系统能自动选择识别前景对象,高效处理人物毛发边缘,还原保留各种细节而看不出处理痕迹,抠像不再需要复杂的绿幕或者蓝幕,教师拍摄微课将不再受时间、空间和拍摄场景的限制。三是易用性高,AI 智能抠像技术的操作门槛较低,教师可以通过简单的一键操作完成抠像过程。

2.3.3 AI 图像生成:创造逼真的视觉元素

AI 图像生成技术以生成对抗网络(GANs)为核心,已成为微课内容制作中一种重要的视觉元素丰富手段,它甚至可以创造全新的教学场景,以此实现教学内容的高度视觉化。该技术在微课内容制作中具体体现为根据教学内容的具体需求,生成相关的图像或动画。首先,AI 动画的运用对于微课来说至关重要。动画作为微课的视觉亮点,不仅提升了观看者的沉浸体验,也大幅度提升了教学内容的吸引力。传统的动画制作对艺术性和技术性的要求较高,而使用AI 技术则可以实现动画制作的高效与便捷。具体而言,AI 技术可以快速生成动画场景和角色,大大降低了手动绘制的时间和工作量。其次,AI 绘画在微课制作中也发挥了重要作用。在微课制作中,素材的运用固然充满挑战,却也是无法忽视的关键环节。教师在创作微课时,可能会遇到无法有效呈现自己创新思想的困境,这时,AI技术的介入就能实现创新想法的有效呈现。

2.3.4 AI 驱动的自动化制作流程:提升微课制作效率

AI 图像技术在微课制作流程的自动化方面也具有重要的应用价值。AI 自动剪辑技术是以算法为基础,通过对原始视频素材进行精确的分析和解析,智能地实现视频中的关键元素检测,如场景变换、讲解要点等。在此基础上,AI技术能进一步自动剔除视频中的瑕疵和重复内容,如卡顿、喘息声等,同时根据教学内容的逻辑,智能地完成视频的粗剪和合并。主流的AI 自动剪辑软件包括Adobe Premiere Pro、Magisto、InVideo、Animoto、Wibbitz、Quik 等,这些软件以其强大的自动剪辑功能,满足了不同需求的微课制作,无论是快速制作短视频,还是海量音乐库的提供,都给微课制作带来了极大的便利。

2.4 AI 智能辅助工具:微课制作的智能化锐器

微课制作的进程正在由于AI 智能辅助工具的运用而经历深刻的变革。这些工具依托于其自动化、精确性和高效率的特点,为微课制作带来了显著的提升,从而大幅度地提升了制作效率和内容的质量。AI 自动配乐工具,如AIVA等,以其先进的算法,能够根据微课的教学内容和情绪氛围生成适配的音乐和音效,丰富了微课的感官体验。AI自动检索工具通过高级的“识图”和“识音”功能,可以自动索引相关的图片、视频、文档等教学资源,显著提高资源检索的速度和精准度。AI 全自动抠图工具可以快速精确地将目标人物或物品从复杂的背景中分离出来,大大简化了后续的编辑和合成过程。另外,AI人声提取工具如Audionamix、iZotope RX 等,能够精确地从复杂的音频环境中提取教师的讲解,保证了语音的清晰度和可理解性。同时,这类工具也能获取干净、稀缺的音乐伴奏,如lalal.ai、UVR5、Amadeus code等,为微课的音频环节增加了更多的可能性。另外,AI 智能辅助工具还能生成数字人、虚拟人,创作出不同角色的教师形象或属于自己的数字人(D-ID),创设情境,增强微课内容的感染力。

3 结语

AI人工智能技术正在蓬勃发展,其在微课制作中的广泛应用已对教育领域产生了巨大的影响。通过AI 语音识别、AI语音合成以及AI图像技术等多元创新技术的实施,教师们得以跨越技术的阻隔,将注意力集中在微课教学内容的设计与创新上,以设计出高质量的教学微课程。在这个科技瞬息万变的时代,AI人工智能技术将继续为我们揭示更为广阔的想象空间和无穷的可能性,期待AI 人工智能技术在微课制作领域中创造更多的价值,引领在线教育领域向着更大的创新与进步迈进。

猜你喜欢

字幕语音人工智能
Word和Excel联手字幕添加更高效
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
2019:人工智能
对方正在输入……
人工智能与就业
数读人工智能
一种基于单片机16×32点阵动态字幕的设计
下一幕,人工智能!