信息技术实验:计算机如何对声音进行“录制”存储
2017-12-07张渤
张渤
数字化技术是信息技术课程中的基础内容之一,尤其是数字化的原理、用途、特点及相关技术的特色,比较难以理解,通过信息技术实验,用數据与作品输出技术原理及应用,可以更容易地探索其技术特点。例如,在音频处理中,可以通过音频处理软件观察计算机将自然界声音进行转换,存储为音频文件的过程、方法、结果,加深计算机对数据进行处理的认识和理解。
实验目的
(1)具体感知计算机采集处理声音的一般过程,掌握声音录制所需的硬件设备和软件设置等基础知识。
(2)通过观察波形,结合采样频率的设置,了解计算机采集声音的基本原理。
(3)通过更改设置录音的不同参数、改变存储格式等,对比分析计算机采集声音的共性特征、不同参数和格式对音频文件存储容量的影响。
实验原理
自然界的声音信号,我们称之为模拟信号。根据学过的物理知识,我们知道自然界的声音信号都是连续的波形。计算机是采用二进制进行数据存储和处理,所以将自然界的声音录制到电脑中,其实就是把连续的模拟信号转换成为使用0或1表示的数字信号的过程,这个过程称为模拟/数字转换(通常称为声音的数字化)。自然音源只有转换为数字信号后,才能在计算机中作进一步加工处理。
声音数字化包含两个关键步骤——采样和量化。
采样就是每隔一定时间读一次声音信号的幅度,而量化则是将采样得到的声音信号幅度转换为数字值。从本质上来说,采样是时间上的数字化,每隔一定时间就对声音进行抽取,单位时间内的采样次数称为采样频率(采样过程可以类比数学上的描点作函数图像)。采样频率越高则采样时间间隔越小,采样得到的数据越接近原来的波形。而量化则是幅度上(音量高度)的数字化,通常采用采样位数对模拟音频信号进行数字化。采样位数越高(度量越精确),数字化后的信号就越接近原始信号(如图1)。
根据奈奎斯的采样理论,采样频率要高于输入信号最高频率的两倍,而正常人的听觉频率为20Hz~20KHz,所以采样频率应在40KHz左右,常用采样频率有44.1KHz、48KHz等。采样位数决定了模拟信号数字化后的动态范围,常用的有8位、12位和16位。从模拟/数字转换角度来看,影响音频文件质量的主要因素就是采样频率和采样位数。
数字化后的声音信号在通过电脑进行回放处理时,需要再次将数字信号按照一定的规则还原成连续的模拟信号,这就是在音频编辑软件中看到声音仍然是连续波形的原因。另外,数字化时采样频率和采样位数越高,还原效果就越接近原来的声音(如图2、图3)。
数字化后的声音信号要存储和再处理,都需要按照一定的规则把信号进行编码。因为编码会把数据冗余部分去掉,所以经过编码压缩后的音频信号也会有不同程度的质量损失,存储占用空间也不尽相同。我们常采用的音频压缩编码格式有PCM、WAV、APE、FLAC、MP3、MP3PRO、AMR、AAC等,对应有无损压缩和有损压缩等不同品质的音频文件。
除此之外,不同声道数的音频信号也会影响人的听觉感受。
实验设备
电脑、耳麦、音频编辑软件(如Cool Edit Pro或GoldWave、Auditio等)、歌曲一首或多首。
实验内容
(1)进行录音前的设备调试准备(录制外界声音或人声与录制电脑自身发出声音设置有差异)。
(2)新建不同采样频率、采样位数的音频文件,进行录音,并采用不同格式进行存储,对比分析其听觉差异和文件容量差异。
(3)记录数据,并分析推理实验结论(如左下表)。
通过听觉感受前后对比,重点区分音频文件的清晰度能否真实反映原声音,以及有何不同,不能单纯以好或不好作为描述。
实验思考
(1)如何设置实验,对比分析观察某一参数变化所造成的影响?
(2)为避免不同音源录音所造成的差异影响实验效果,应如何保证音源的一致性?
(3)如何观察采样后的波形其实是原始信号的抽样结果?(请把观察截图附在本题后)
(4)比较常见的音频文件的品质区分方式是KBPS,通常称为码率,代表着音频文件每秒内所含的信息量,一般码率越高信息越丰富,音乐也会更“真”,细节也会更饱满。通过你的观察分析,你认为影响码率的主要因素是什么?其规律是什么?endprint