将连续的模拟音频信号转换为离散数字数据点——决定后期音质和文件大小。所有数字录音的基础。
在片场或后期制作中,我们每天都会接触到采样——而且通常不假思索。麦克风拾取的声音是连续的、模拟的。要将其转换为数字信号,必须以固定的间隔“采样”这个连续的流——也就是说,进行瞬时测量。这些测量点称为采样点。每秒采样的频率越高,我们就能越精确地重现原始波形。
采样率——以赫兹或千赫兹为单位测量——决定了基础。48 kHz 是电影的标准:这意味着我们每秒进行 48,000 次测量。奈奎斯特定理强制要求我们:我们能正确捕捉的最高频率是采样率的一半——即最高 24 kHz。这足以满足人耳(我们听到的最高频率约为 20 kHz),但是:如果采样率低于 48 kHz——例如 CD 音频的 44.1 kHz——高频的清晰度就会明显下降。反之,96 kHz 在戏剧电影中带来的好处并不大;但数据量会显著增加。
在实践中,如果采样不当,错误会立即显现。这种现象称为混叠:高于奈奎斯特频率的高频音调会被错误解释,产生令人讨厌的伪影——金属般的嗡嗡声,无法解释的低沉噪音。因此,音频接口会使用一个抗混叠滤波器来限制输入频率。在剪辑中,这早已发生;采样率决定了我们计算效果、移调或拉伸时间的精度。
第二个维度是字长或位深度:16 位(CD 标准)或 24 位(专业)。它决定了我们对每个采样点的幅度进行多精细的量化——即在静音和最大值之间有多少个音量级别。24 位提供 1600 万个级别,16 位只有 65,536 个。在对话录音中,尤其是在处理弱信号或动态范围大的信号时,24 位的好处显而易见:更大的动态余量,后期处理中更精细的控制,更少的量化噪声。
在同步或多轨录音中,有一条规则:所有音轨必须使用相同的采样率。混合 48 kHz 和 44.1 kHz 的素材会导致相位误差和时序问题,这些问题修复起来非常麻烦。降采样、插件和数字音频工作站——所有这些都基于这个采样率工作。只有在最终混音或渲染到输出格式时才能进行转换,但即使那样也会损失一些透明度。