Processo de converter áudio analógico contínuo em pontos de dados digitais discretos — determina qualidade sonora e tamanho do arquivo. Base de toda gravação digital.
No set ou na pós-produção, encontramos a amostragem diariamente — e geralmente sem pensar muito. O som captado por um microfone é contínuo, analógico. Para convertê-lo para o digital, é preciso "amostrar" esse fluxo contínuo em intervalos regulares — ou seja, tirar instantâneos. Esses pontos de medição são chamados de amostras. Quanto mais frequentemente amostramos por segundo, mais precisamente reproduzimos a onda original.
A taxa de amostragem — medida em Hertz ou Kilohertz — define a base. 48 kHz é o padrão em cinema: ou seja, tiramos 48.000 valores de medição por segundo. O teorema de Nyquist nos força aqui: a frequência mais alta que podemos captar corretamente está na metade da taxa de amostragem — portanto, no máximo 24 kHz. Isso é mais do que suficiente para ouvidos humanos (ouvimos até cerca de 20 kHz), mas: quem amostra abaixo de 48 kHz — como 44,1 kHz, como no áudio de CD — já perde consideravelmente em brilho. Por outro lado, 96 kHz não traz muitas vantagens em filmes dramáticos; o volume de dados, no entanto, aumenta significativamente.
Na prática, o erro se manifesta imediatamente se a amostragem for incorreta. Aliasing é o nome desse fenômeno: tons de alta frequência que estão acima do limite de Nyquist são interpretados incorretamente e geram artefatos perturbadores — zumbidos metálicos, ruídos inexplicáveis. Por isso, as interfaces de áudio utilizam um filtro anti-aliasing que limita as frequências de entrada. Na edição, isso já ocorreu há muito tempo; ali, a taxa de amostragem determina a precisão com que podemos calcular efeitos, alterar o pitch ou esticar o tempo.
A segunda dimensão é a profundidade de bits ou resolução: 16 bits (padrão de CD) ou 24 bits (profissional). Ela determina o quão finamente podemos granular a amplitude de cada amostra — quantos níveis de volume existem entre o silêncio e o máximo. 24 bits nos dão 16 milhões de níveis, 16 bits apenas 65.536. Na gravação de diálogos, especialmente com fontes fracas ou dinâmicas, 24 bits se mostram vantajosos: mais headroom, controle mais fino na pós-produção, menos ruído de quantização visível.
Na sincronização ou na gravação multipista, vale o seguinte: todas as trilhas devem operar na mesma taxa de amostragem. Uma mistura de material de 48 kHz e 44,1 kHz leva a erros de fase e problemas de timing que são difíceis de reparar. Desirings, plugins e DAWs — todos trabalham nessa taxa. Somente no mixdown final ou ao renderizar para o formato de saída é possível converter, mas mesmo assim se perde um pouco de transparência.