当前位置:首页-others 其它类录音机综合-正文

关于“采样率”的必会知识!新人课堂:数字音频基础系列

如今,数字音频已经基本替代模拟音频,成为行业内必会的知识了。无论是渴望进入音频制作领域的新手们,还是声音行业的专业人士,都可以通过我们这一系列文章学习/巩固一下关于数字音频的基础知识。

尤其是很多新手小白,在一开始还没有学习计算机实际处理音频的基础知识,就很容易感觉计算机上制作音频的概念都很抽象难懂:每项指标分别有什么作用?怎么才能让声音听起来符合我的要求?

在这一系列文章中,我们将介绍数字音频的一些基本概念,以及它们如何影响音频制作的过程。

本文中,我们将重点关注音频采样率,以及与它相关的一些问题,希望能帮新手们揭开数字音频工作原理背后的一些谜团。 

数字音频是什么?

数字音频(digital audio)是一种利用数字化手段对声音进行录制、存放、编辑、压缩或播放的技术,它是随着数字信号处理技术、计算机技术、多媒体技术的发展而形成的,相对于模拟声波(analog wave)来说,一种新的声音处理手段。

也可以说,它是我们在计算机系统中存储、重新创建和操作音频信息的系统。模拟声波的某些特性,如频率和振幅,被转换为计算机软件可以读取的数据。这使我们能够在基于软件的环境中管理、编辑和安排音频。

音频采样和音频采样率是什么?


音频采样(audio sample),用通俗易懂的话来说,就是把声音从模拟信号转换为数字信号。在声波中的特定时刻采集样本,记录振幅,然后将此信息转换为二进制数据。

系统每秒进行数千次测量。如果我们能够以足够多的可能振幅值极快地进行大量测量,我们就可以有效地使用这些快照来重建模拟声波的分辨率和复杂性。


系统进行这些测量的速度,就称为音频采样率(audio sample rate),以kHz(千赫兹)为单位,同时也是所得的数字信号的每秒样本数。音频采样率决定了数字音频中捕获的频率范围。


在大多数 DAW 中,你会在音频选项中找到可调整的采样率选项,它可以控制项目中音频的采样率。

你一般在 DAW 中看到的选项(44.1 kHz,48 kHz)可能看起来有点随机,但事实并非如此! 我们用一个正弦波来演示:


为了测量这个正弦波的频率,我们需要能够检测和定义一个周期。任何波段的一个完整周期都要包含正负阶段。要知道这个周期的长度(波长),我们需要检测这两个阶段。因此,我们需要在每个完整周期至少测量两次以保证准确捕获其频率。


这意味着我们要想捕获和重建原始正弦波的频率,其音频采样率至少是其频率的两倍,称为奈奎斯特率(Nyquist rate)。相反,系统可以捕获和重新创建高达音频采样率一半的频率,这一限制称为奈奎斯特频率(Nyquist frequency)。

如果高于奈奎斯特频率的信号没有被音频数字转换器(ADC)正确记录,在奈奎斯特频率上反射回来并在过程中引入人工频率,被称为混叠(Aliasing)

为防止混叠,音频数字转换器之前通常装有低通滤波器,可在音频到达转换器之前消除高于奈奎斯特频率的频率。这将防止原始音频中不需要的超高频导致混叠。早期的滤波器可能会污染音频,但随着更好的技术引入,这个问题正在被最小化。

为什么标准音频采样率为 44.1 kHz?

你能看到的最常见的音频采样率为 44.1 kHz,即每秒 44,100 个样本。这是大多数消费类音频的标准,用于 CD 等格式。

这不是一个随意的数字。人类可以听到 20 Hz 到 20 kHz 之间的频率,虽然大多数人在一生中失去了听到高频的能力,最多只能听到高达 15 kHz 至 18 kHz 的频率,但这个“20 到 20”的规则仍被认为是我们能听到的一切的标准范围。

计算机应该能够重新创建频率高达 20 kHz 的波,以保留我们可以听到的一切。因此,从技术上讲,40 kHz 的采样率应该可以解决问题,不是吗?

确实如此,但你需要一个非常强大的(有时也是昂贵的)低通滤波器来防止可听混叠。而44.1 kHz 的采样率在技术上允许记录频率高达 22.05 kHz 的音频。通过将奈奎斯特频率置于我们的听力范围之外,我们可以使用更适中的滤波器来消除混叠,而不会产生太多杂音的听觉效果。



其他音频采样率:48 kHz、88.2 kHz、96 kHz等

虽然 44.1 kHz 是消费类音频可接受的音频采样率,但在某些情况下会使用更高的采样率。有些是在数字音频的早期引入的,当时强大的抗混叠滤波器还很昂贵。将奈奎斯特频率调得更高,我们可以将滤波器放置得越来越远离人类听觉,因此对音频的影响更小。

48 kHz 是另一种常见的音频采样率。从技术上讲,更高的采样率意味着每秒更多的测量和更接近原始音频的再现,因此 48 kHz 通常用于“专业音频”环境而不是音乐环境。例如,它是视频音频的标准采样率。该采样率将奈奎斯特频率移至 24 kHz 左右,从而在需要滤波之前提供更多缓冲空间。

一些音频工程师选择以更高的音频采样率工作,往往会是 44.1 kHz 或 48 kHz 的倍数。88.2 kHz、96 kHz、176.4 kHz 和 192 kHz 的采样率导致更高的奈奎斯特频率,这意味着可以记录和重新创建超音速频率。低通滤波器对声音的影响更小,每秒采样数更多,从而可以更高清地再现原始音频。

能听出不同音频采样率之间的差异吗?

一些有经验的声音工程师可能会听出不同采样率之间的差异。然而,随着滤波和模拟/数字转换技术的改进,会越来越难以听到这些差异。


请看下面这个视频,听听同一段音频不用采样率之间的差异:

音频采样率越高越好吗?

理论上,以更高的音频采样率工作并不是一个坏主意,比如 176.4 kHz 或 192 kHz。文件会更大,但音质可能会很好。不过最终音频可能会转换为 44.1 kHz 或 48 kHz。


比如zoom F8n,支持192kHz的采样率

从数学上讲,将 88.2 转换为 44.1 以及将 96 转换为 48 会容易得多,因此最好在整个项目中保持一种格式。但是,通常的做法是在 44.1 kHz 或 48 kHz 下工作。

如果系统设置为 48 kHz 的采样率并且我们使用了 44.1 kHz 的音频文件,则系统读取样本的速度会比它本应该的更快。结果就是,音频听起来会加快并且音调略高。

如果系统采样率在 44.1 kHz 范围内并且音频文件在 48 kHz 范围内,则会发生相反的情况:音频声音变慢且音调略低。

超高音频采样率也有一个有趣的创造性用途。如果你曾经降低过标准 44.1 kHz 音频文件的音高,你可能已经注意到高音会变得有些空旷。高于 22.05 kHz 的频率在转换之前被过滤掉,因此没有频率内容可以降低,从而导致高音出现空洞。

但是,如果此音频以 192 kHz 的频率录制,则原始音频中高达 96 kHz 的频率将被录制。这显然超出了人类可以听到的范围,但是降低音频会导致这些听不见的频率变得可听了。因此,你可以在保留高频内容的同时大幅降低录音的音调。


下篇文章中,我们将继续为大家介绍数字音频的其它基础知识!敬请期待!


对声音制作感兴趣的朋友可以加入我们的声音制作讨论群,添加小编服务微信LocationSound,简单介绍自己即可。


影像声音制作集训报名中!

业内大咖,小班授课,

名额有限,报满即止!

(点击下图了解)


同期录音网

公众号|locationsound_cn

服务微信|locationsound

同期录音网

公众号|locationsound_cn

服务微信|locationsound

所属专题: