关于“采样率”的必会知识!新人课堂:数字音频基础系列
数字音频是什么?
数字音频(digital audio)是一种利用数字化手段对声音进行录制、存放、编辑、压缩或播放的技术,它是随着数字信号处理技术、计算机技术、多媒体技术的发展而形成的,相对于模拟声波(analog wave)来说,一种新的声音处理手段。
也可以说,它是我们在计算机系统中存储、重新创建和操作音频信息的系统。模拟声波的某些特性,如频率和振幅,被转换为计算机软件可以读取的数据。这使我们能够在基于软件的环境中管理、编辑和安排音频。
音频采样和音频采样率是什么?
音频采样(audio sample),用通俗易懂的话来说,就是把声音从模拟信号转换为数字信号。在声波中的特定时刻采集样本,记录振幅,然后将此信息转换为二进制数据。
系统每秒进行数千次测量。如果我们能够以足够多的可能振幅值极快地进行大量测量,我们就可以有效地使用这些快照来重建模拟声波的分辨率和复杂性。
系统进行这些测量的速度,就称为音频采样率(audio sample rate),以kHz(千赫兹)为单位,同时也是所得的数字信号的每秒样本数。音频采样率决定了数字音频中捕获的频率范围。
在大多数 DAW 中,你会在音频选项中找到可调整的采样率选项,它可以控制项目中音频的采样率。
你一般在 DAW 中看到的选项(44.1 kHz,48 kHz)可能看起来有点随机,但事实并非如此! 我们用一个正弦波来演示:
为了测量这个正弦波的频率,我们需要能够检测和定义一个周期。任何波段的一个完整周期都要包含正负阶段。要知道这个周期的长度(波长),我们需要检测这两个阶段。因此,我们需要在每个完整周期至少测量两次以保证准确捕获其频率。
这意味着我们要想捕获和重建原始正弦波的频率,其音频采样率至少是其频率的两倍,称为奈奎斯特率(Nyquist rate)。相反,系统可以捕获和重新创建高达音频采样率一半的频率,这一限制称为奈奎斯特频率(Nyquist frequency)。
如果高于奈奎斯特频率的信号没有被音频数字转换器(ADC)正确记录,在奈奎斯特频率上反射回来并在过程中引入人工频率,被称为混叠(Aliasing)。
为防止混叠,音频数字转换器之前通常装有低通滤波器,可在音频到达转换器之前消除高于奈奎斯特频率的频率。这将防止原始音频中不需要的超高频导致混叠。早期的滤波器可能会污染音频,但随着更好的技术引入,这个问题正在被最小化。
为什么标准音频采样率为 44.1 kHz?
你能看到的最常见的音频采样率为 44.1 kHz,即每秒 44,100 个样本。这是大多数消费类音频的标准,用于 CD 等格式。
这不是一个随意的数字。人类可以听到 20 Hz 到 20 kHz 之间的频率,虽然大多数人在一生中失去了听到高频的能力,最多只能听到高达 15 kHz 至 18 kHz 的频率,但这个“20 到 20”的规则仍被认为是我们能听到的一切的标准范围。
计算机应该能够重新创建频率高达 20 kHz 的波,以保留我们可以听到的一切。因此,从技术上讲,40 kHz 的采样率应该可以解决问题,不是吗?
确实如此,但你需要一个非常强大的(有时也是昂贵的)低通滤波器来防止可听混叠。而44.1 kHz 的采样率在技术上允许记录频率高达 22.05 kHz 的音频。通过将奈奎斯特频率置于我们的听力范围之外,我们可以使用更适中的滤波器来消除混叠,而不会产生太多杂音的听觉效果。
其他音频采样率:48 kHz、88.2 kHz、96 kHz等
虽然 44.1 kHz 是消费类音频可接受的音频采样率,但在某些情况下会使用更高的采样率。有些是在数字音频的早期引入的,当时强大的抗混叠滤波器还很昂贵。将奈奎斯特频率调得更高,我们可以将滤波器放置得越来越远离人类听觉,因此对音频的影响更小。
48 kHz 是另一种常见的音频采样率。从技术上讲,更高的采样率意味着每秒更多的测量和更接近原始音频的再现,因此 48 kHz 通常用于“专业音频”环境而不是音乐环境。例如,它是视频音频的标准采样率。该采样率将奈奎斯特频率移至 24 kHz 左右,从而在需要滤波之前提供更多缓冲空间。
一些音频工程师选择以更高的音频采样率工作,往往会是 44.1 kHz 或 48 kHz 的倍数。88.2 kHz、96 kHz、176.4 kHz 和 192 kHz 的采样率导致更高的奈奎斯特频率,这意味着可以记录和重新创建超音速频率。低通滤波器对声音的影响更小,每秒采样数更多,从而可以更高清地再现原始音频。
能听出不同音频采样率之间的差异吗?
一些有经验的声音工程师可能会听出不同采样率之间的差异。然而,随着滤波和模拟/数字转换技术的改进,会越来越难以听到这些差异。
请看下面这个视频,听听同一段音频不用采样率之间的差异:
音频采样率越高越好吗?
理论上,以更高的音频采样率工作并不是一个坏主意,比如 176.4 kHz 或 192 kHz。文件会更大,但音质可能会很好。不过最终音频可能会转换为 44.1 kHz 或 48 kHz。
比如zoom F8n,支持192kHz的采样率
从数学上讲,将 88.2 转换为 44.1 以及将 96 转换为 48 会容易得多,因此最好在整个项目中保持一种格式。但是,通常的做法是在 44.1 kHz 或 48 kHz 下工作。
如果系统设置为 48 kHz 的采样率并且我们使用了 44.1 kHz 的音频文件,则系统读取样本的速度会比它本应该的更快。结果就是,音频听起来会加快并且音调略高。
如果系统采样率在 44.1 kHz 范围内并且音频文件在 48 kHz 范围内,则会发生相反的情况:音频声音变慢且音调略低。
超高音频采样率也有一个有趣的创造性用途。如果你曾经降低过标准 44.1 kHz 音频文件的音高,你可能已经注意到高音会变得有些空旷。高于 22.05 kHz 的频率在转换之前被过滤掉,因此没有频率内容可以降低,从而导致高音出现空洞。
但是,如果此音频以 192 kHz 的频率录制,则原始音频中高达 96 kHz 的频率将被录制。这显然超出了人类可以听到的范围,但是降低音频会导致这些听不见的频率变得可听了。因此,你可以在保留高频内容的同时大幅降低录音的音调。
下篇文章中,我们将继续为大家介绍数字音频的其它基础知识!敬请期待!
对声音制作感兴趣的朋友可以加入我们的声音制作讨论群,添加小编服务微信LocationSound,简单介绍自己即可。
影像声音制作集训报名中!
业内大咖,小班授课,
名额有限,报满即止!
(点击下图了解)
同期录音网
公众号|locationsound_cn
服务微信|locationsound
同期录音网
公众号|locationsound_cn
服务微信|locationsound