Quais são as diferenças entre MP3, FLAC e outros formatos de áudio?

Publicados: 2022-01-29

O áudio digital existe há muito tempo, então deve haver uma infinidade de formatos de áudio por aí. Aqui estão alguns dos mais comuns, o que os diferencia e para que usá-los.

Antes de falarmos sobre os formatos de áudio do dia a dia, é importante que você entenda o básico, e isso significa entender o PCM. Depois disso, abordaremos os formatos compactados.

Áudio PCM: onde tudo começa

A Modulação por Código de Pulso foi criada em 1937 e é a aproximação mais próxima do áudio analógico. Ou seja, uma forma de onda analógica é aproximada em intervalos regulares. O PCM é caracterizado por duas propriedades: taxa de amostragem e profundidade de bits. A taxa de amostragem mede a frequência (em vezes por segundo) da amplitude da forma de onda e a profundidade de bits mede os possíveis valores digitais. Em termos de formatos de áudio, isso é praticamente a base.

O som verdadeiro, no mundo real, é contínuo. No mundo digital, não é. De alguma forma, isso é mais confuso com o áudio do que com o vídeo, então vamos ver o vídeo como um ponto de comparação. O que interpretamos como “movimento” ou pensamos como “fluido” e em constante movimento é, na verdade, uma série de imagens estáticas. Da mesma forma, a amplitude das ondas sonoras em formato digital não é “fluida” ou em constante mudança. Está mudando com base em certos critérios em intervalos pré-definidos.

Imagem da Wikipédia

Eu sei que há muita coisa aqui que pode não ser uma segunda natureza, a menos que você seja um engenheiro, físico ou um audiófilo, então vamos reduzir ainda mais com uma analogia.

Propaganda

Digamos que a água que flui de uma torneira aberta é sua fonte de áudio “analógica”. A temperatura da água podemos comparar com a amplitude de uma onda de áudio; é um imóvel que precisa ser medido para que você possa aproveitá-lo adequadamente. Amostragem é o número de vezes por segundo que você mergulha o dedo na água corrente. Quanto mais você mergulha o dedo nele, mais “contínuas” as mudanças de temperatura se tornam. Se você enfiar o dedo na água corrente 44.100 vezes por segundo, é quase como manter o dedo lá embaixo o tempo todo, certo? Essa é a ideia básica por trás da amostragem.

A profundidade de bits é um pouco mais complicada. Em vez de usar o dedo, digamos que você usou um termômetro muito ruim. Basicamente dizia "Quente" para qualquer coisa acima da temperatura ambiente e "Fria" para qualquer coisa abaixo. Independentemente de quantas vezes você o mergulhou na água, não lhe daria muita informação útil. Agora, se em vez de apenas 2 opções, digamos que o termômetro tivesse 16 valores possíveis que você poderia usar para medir a temperatura da água. Mais útil, certo? A profundidade de bits funciona da mesma maneira, pois valores mais altos permitem que mudanças mais dinâmicas na amplitude do som sejam retratadas com precisão.

Como mencionado anteriormente, o PCM é a base do áudio digital, juntamente com suas variantes. O PCM tenta modelar uma forma de onda, tanto quanto possível em sua glória não compactada. É especial, está pronto para ser preso em um processador de sinal digital e é mais ou menos universalmente jogável. A maioria dos outros formatos manipula o áudio por meio de algoritmos, portanto, eles precisam ser decodificados durante a reprodução. O áudio PCM é considerado “sem perdas”, não é compactado e, portanto, ocupa muito espaço no disco rígido.

O grupo não compactado: WAV, AIFF

Imagem por codepo8

Ambos WAV e AIFF são formatos de contêiner de áudio sem perdas baseados em PCM, com algumas pequenas alterações no armazenamento de dados. O áudio PCM, para a maioria das pessoas, vem nesses formatos, dependendo se você usa Windows ou OS X, e eles podem ser convertidos entre si sem degradação da qualidade. Ambos também são considerados “sem perdas”, não são compactados e um arquivo de áudio PCM estéreo (2 canais), amostrado a 44,1 kHz (ou 44100 vezes por segundo) a 16 bits (“qualidade de CD”) equivale a aproximadamente 10 MB por minuto. Se você estiver gravando em casa para fins de mixagem, é isso que você deseja usar porque é de qualidade total.

Imagem por CyboRoZ

Formatos sem perdas: FLAC, ALAC, APE

O Free Lossless Audio Codec, o Apple Lossless Audio Codec e o Monkey's Audio são todos formatos que compactam áudio, da mesma forma que qualquer coisa é compactada no mundo digital: usando algoritmos. A diferença entre arquivos compactados e arquivos FLAC é que o FLAC é projetado especificamente para áudio e, portanto, possui melhores taxas de compactação sem perda de dados. Normalmente, você está vendo cerca de metade do tamanho dos WAVs. Ou seja, um arquivo FLAC para áudio estéreo com “qualidade de CD” roda aproximadamente 5 MB por minuto.

A vantagem é que, se você quiser fazer manipulação de áudio, poderá converter novamente para WAV sem perda de qualidade . Se você é um audiófilo e ouve muita música com faixas dinâmicas, esses formatos são para você. Se você tiver um ótimo conjunto de alto-falantes, latas ou fones de ouvido, esses formatos realçarão os tons para mostrá-los.

Formatos com perdas: MP3, AAC, WMA, Vorbis

Imagem de Patrick H Lauke

A maioria dos formatos que você vê no dia-a-dia são “com perdas”; algum grau de qualidade de áudio é sacrificado em troca de um ganho significativo no tamanho do arquivo. Um MP3 médio com “qualidade de CD” roda cerca de 1 MB por minuto. Grande diferença em relação ao PCM, não? Isso é chamado de compactação, mas, diferentemente dos formatos sem perdas, você não pode realmente recuperar essa qualidade depois de desmontá-la em formatos com perdas. Diferentes formatos com perdas usam algoritmos diferentes para armazenar dados e, portanto, geralmente variam em tamanho de arquivo para qualidade comparável. Os formatos com perdas também usam a taxa de bits para se referir à qualidade do áudio, que geralmente se parece com “192 kbit/s” ou “192 kbps”. Números mais altos significam que mais dados estão sendo extraídos, portanto, há mais preservação de detalhes. Aqui estão alguns detalhes para os formatos mais populares.

MP3: MPEG 1 Audio Layer 3, o codec de áudio com perdas mais comum atualmente. Apesar de um monte de problemas de patentes, ainda é incrivelmente popular. Quem não tem MP3s por aí?
Vorbis: Um formato com perdas gratuito e de código aberto usado com mais frequência em jogos de PC, como Unreal Tournament 3. Os fãs de FOSS, como muitos usuários de Linux, certamente verão bastante esse formato.
AAC: Advanced Audio Coding, um formato padronizado agora usado com vídeo MPEG4. É fortemente suportado por causa de sua compatibilidade com DRM (por exemplo, FairPlay da Apple), suas melhorias em relação ao mp3 e porque nenhuma licença é necessária para transmitir ou distribuir conteúdo neste formato. Os fãs da Apple provavelmente terão muito em AAC.
WMA: Windows Media Audio, formato de áudio com perdas da Microsoft. Ele foi desenvolvido e usado para evitar problemas de licenciamento com o formato MP3, mas devido a grandes melhorias e compatibilidade com DRM, bem como uma implementação sem perdas, ainda está por aí. Era muito popular antes do iTunes se tornar o campeão da música DRMed.

Propaganda

Formatos com perdas são o que você usa para todas as coisas que você ouve e armazena. Eles são projetados para economizar espaço no disco rígido. Qual formato você escolhe depende de qual player de áudio digital você usa, quanto espaço você tem, quão grande você é um nitpicker de qualidade e um monte de variáveis. Hoje em dia, os computadores tocam qualquer coisa, a maioria dos players de áudio (exceto os da Apple, é claro) fazem vários formatos com perdas, e cada vez mais fazem FLAC e APE. A Apple adere ao MP3, ALAC e AAC.

A qualidade do áudio não é subjetiva?

Absolutamente, é. Em última análise, são seus ouvidos que estão consumindo a maior parte dessas coisas, mas isso é mais uma razão para pensar seriamente na qualidade. Quando comecei a criar minha coleção de música digital, não sabia dizer a diferença entre MP3s de 128kbit e CDs de áudio. Aos meus ouvidos, não houve diferença perceptível. Com o tempo, no entanto, notei que 256 kbit soava muito melhor, e depois que ganhei um conjunto de fones de ouvido muito bom (e caro!), voltei aos CDs de áudio em tempo integral! Também depende do gênero musical.

Imagem de jonchoo

Há MUITAS variáveis aqui, pessoal, não se engane sobre isso. Demorou um pouco até eu decidir usar FLAC para algumas músicas e MP3 de 320kbps para o resto. O ponto que estou tentando mostrar é que você deve experimentar para ver o que funciona melhor para você e sua música, mas esteja ciente de que, à medida que seus gostos mudam, suas percepções, seu equipamento e a importância da qualidade também mudam.

E todas essas coisas ficam ainda mais complicadas quando você não está falando apenas sobre música, mas sobre faixas de voz, efeitos sonoros, ruído branco e marrom, etc. Há um mundo inteiro de sons por aí, então não desanime! Aprendendo o que você pode e ouvindo por si mesmo, você pode usar essas informações a seu favor em seus futuros projetos de áudio. Vou deixá-lo com alguns dos melhores conselhos que já recebi: “faça o que simplesmente parece bom”.