Quali sono le differenze tra MP3, FLAC e altri formati audio?

Pubblicato: 2022-01-29

L'audio digitale è in circolazione da molto tempo, quindi è inevitabile che ci siano una miriade di formati audio là fuori. Ecco alcuni dei più comuni, cosa li differenzia e per cosa usarli.

Prima di parlare dei formati audio di tutti i giorni, è importante comprendere le basi e ciò significa comprendere il PCM. Successivamente, affronteremo i formati compressi.

Audio PCM: dove tutto ha inizio

Pulse-Code Modulation è stata creata nel 1937 ed è l'approssimazione più vicina all'audio analogico. Cioè, una forma d'onda analogica viene approssimata a intervalli regolari. PCM è caratterizzato da due proprietà: frequenza di campionamento e profondità di bit. La frequenza di campionamento misura la frequenza (in volte al secondo) dell'ampiezza della forma d'onda e la profondità di bit misura i possibili valori digitali. In termini di formati audio, questa è praticamente la base.

Il vero suono, nel mondo reale, è continuo. Nel mondo digitale, non lo è. In qualche modo questo crea più confusione con l'audio che con il video, quindi consideriamo il video come punto di confronto. Ciò che interpretiamo come "movimento" o che consideriamo "fluido" e in continuo movimento è, in realtà, una serie di immagini fisse. Allo stesso modo, l'ampiezza delle onde sonore in un formato digitale non è “fluida” o in continua evoluzione. Sta cambiando in base a determinati criteri a intervalli predefiniti.

Immagine da Wikipedia

So che ci sono molte cose qui che potrebbero non essere una seconda natura a meno che tu non sia un ingegnere, un fisico o un audiofilo, quindi riduciamolo ulteriormente con un'analogia.

Annuncio pubblicitario

Diciamo che l'acqua che scorre da un rubinetto aperto è la tua fonte audio "analogica". Possiamo confrontare la temperatura dell'acqua con l'ampiezza di un'onda audio; è una proprietà che deve essere misurata per poterne godere a pieno. Il campionamento è il numero di volte al secondo che immergi il dito nell'acqua che scorre. Più spesso ci si immerge il dito, più “continuo” diventano gli sbalzi di temperatura. Se infili il dito nell'acqua corrente 44.100 volte al secondo, è quasi come tenerlo lì sotto per tutto il tempo, giusto? Questa è l'idea alla base del campionamento.

La profondità di bit è un po' più complicata. Invece di usare il dito, supponiamo che tu abbia usato un termometro davvero scadente. Fondamentalmente diceva "caldo" per qualsiasi cosa al di sopra della temperatura ambiente e "freddo" per qualsiasi cosa al di sotto. Indipendentemente da quante volte lo hai immerso nell'acqua, non ti darebbe davvero molte informazioni utili. Ora, se invece di sole 2 opzioni, supponiamo che il termometro avesse 16 possibili valori che potresti usare per misurare la temperatura dell'acqua. Più utile, giusto? La profondità di bit funziona allo stesso modo, in quanto valori più elevati consentono di rappresentare con precisione i cambiamenti più dinamici nell'ampiezza del suono.

Come accennato in precedenza, il PCM è la base per l'audio digitale, insieme alle sue varianti. PCM tenta di modellare una forma d'onda, nella maggior parte possibile della sua gloria non compressa. È speciale, è pronto per essere inserito in un processore di segnale digitale ed è più o meno universalmente riproducibile. La maggior parte degli altri formati manipola l'audio tramite algoritmi, quindi devono essere decodificati durante la riproduzione. L'audio PCM è considerato "senza perdita di dati", non è compresso e quindi occupa molto spazio sul disco rigido.

Il mazzo non compresso: WAV, AIFF

Immagine di codepo8

Sia WAV che AIFF sono formati contenitore audio lossless basati su PCM, con alcune modifiche minori nella memorizzazione dei dati. L'audio PCM, per la maggior parte delle persone, è disponibile in questi formati, a seconda che si utilizzi Windows o OS X, e possono essere convertiti l'uno nell'altro senza degrado della qualità. Entrambi sono anche considerati "lossless", non sono compressi e un file audio PCM stereo (2 canali), campionato a 44,1 kHz (o 44100 volte al secondo) a 16 bit ("qualità CD") ammonta a circa 10 MB per minuto. Se stai registrando a casa ai fini del missaggio, questo è quello che vuoi usare perché è di piena qualità.

Immagine di CyboRoZ

Formati Lossless: FLAC, ALAC, APE

Free Lossless Audio Codec, Apple Lossless Audio Codec e Monkey's Audio sono tutti formati che comprimono l'audio, più o meno allo stesso modo in cui qualsiasi cosa è compressa nel mondo digitale: utilizzando algoritmi. La differenza tra i file compressi e i file FLAC è che FLAC è progettato specificamente per l'audio e quindi ha tassi di compressione migliori senza alcuna perdita di dati. In genere, stai vedendo circa la metà delle dimensioni dei WAV. Cioè, un file FLAC per audio stereo con "qualità CD" esegue circa 5 MB al minuto.

Il lato positivo è che se vuoi eseguire la manipolazione dell'audio, puoi riconvertire in un WAV senza alcuna perdita di qualità . Se sei un audiofilo e ascolti molta musica con gamme dinamiche, questi formati fanno per te. Se hai un ottimo set di altoparlanti, lattine o auricolari, questi formati metteranno in risalto i toni per metterli in mostra.

Formati lossy: MP3, AAC, WMA, Vorbis

Immagine di patrick h lauke

La maggior parte dei formati che vedi nell'uso quotidiano sono "con perdita"; un certo grado di qualità audio viene sacrificato in cambio di un aumento significativo della dimensione del file. Un MP3 medio di "qualità CD" esegue circa 1 MB al minuto. Grande differenza rispetto al PCM, no? Questa si chiama compressione, ma a differenza dei formati senza perdita di dati, non puoi davvero recuperare quella qualità una volta che la rimuovi in formati con perdita di dati. Diversi formati con perdita di dati utilizzano algoritmi diversi per archiviare i dati e quindi in genere variano nelle dimensioni del file per una qualità comparabile. I formati con perdita di dati utilizzano anche il bitrate per fare riferimento alla qualità dell'audio, che di solito assomiglia a "192 kbit/s" o "192 kbps". Numeri più alti significano che vengono espulsi più dati, quindi c'è una maggiore conservazione dei dettagli. Ecco alcuni dettagli per i formati più popolari.

MP3: MPEG 1 Audio Layer 3, il codec audio lossy più comune oggi. Nonostante un mucchio di problemi di brevetto, è ancora incredibilmente popolare. Chi non ha MP3 in giro?
Vorbis: un formato lossy gratuito e open source utilizzato più spesso nei giochi per PC come Unreal Tournament 3. I fan di FOSS, come molti utenti Linux, sono destinati a vedere molto di questo formato.
AAC: Advanced Audio Coding, un formato standardizzato ora utilizzato con video MPEG4. È ampiamente supportato grazie alla sua compatibilità con DRM (ad es. FairPlay di Apple), i suoi miglioramenti rispetto a mp3 e perché non è necessaria alcuna licenza per trasmettere o distribuire contenuti in questo formato. I fan di Apple probabilmente avranno molto in AAC.
WMA: Windows Media Audio, il formato audio con perdita di dati di Microsoft. È stato sviluppato e utilizzato per evitare problemi di licenza con il formato MP3, ma a causa di importanti miglioramenti e compatibilità DRM, nonché di un'implementazione senza perdita di dati, è ancora in circolazione. Era molto popolare prima che iTunes diventasse il campione della musica DRM.

Annuncio pubblicitario

I formati lossy sono ciò che usi per tutte le cose che ascolti e memorizzi. Sono progettati per essere un'economia di spazio su disco rigido. Il formato che scegli dipende dal lettore audio digitale che usi, da quanto spazio hai, da quanto sei grande come un nitpicker di qualità e da un sacco di variabili. Al giorno d'oggi, i computer riprodurranno qualsiasi cosa, la maggior parte dei lettori audio (tranne quelli di Apple, ovviamente) eseguiranno più formati con perdita di dati e sempre di più FLAC e APE. Apple si attacca a MP3, ALAC e AAC.

La qualità dell'audio non è soggettiva?

Assolutamente sì. In definitiva, sono le tue orecchie a consumare la maggior parte di questa roba, ma questo è un motivo in più per pensare seriamente alla qualità. Quando ho iniziato a creare la mia collezione di musica digitale, non riuscivo davvero a distinguere tra MP3 a 128 kbit e CD audio. Per le mie orecchie, non c'era alcuna differenza evidente. Col tempo, tuttavia, ho notato che 256 kbit suonavano molto meglio, e dopo aver ricevuto un paio di cuffie davvero belle (e costose!), sono tornato ai CD audio a tempo pieno! Dipende anche dal genere musicale.

Immagine di Jonchoo

Ci sono MOLTE variabili qui, gente, non fate errori su questo. Ci è voluto un po' prima che decidessi di usare FLAC per un po' di musica e 320kbps MP3 per il resto. Il punto che sto cercando di sottolineare è che dovresti sperimentare per vedere cosa funziona meglio per te e la tua musica, ma sii consapevole che quando i tuoi gusti cambiano, anche le tue percezioni, le tue attrezzature e l'importanza della qualità lo faranno.

E tutte queste cose diventano ancora più complicate quando non parli solo di musica, ma di tracce vocali, effetti sonori, rumore bianco e marrone, ecc. C'è un intero mondo di suoni là fuori, quindi non scoraggiarti! Imparando quello che puoi e ascoltando te stesso, puoi utilizzare queste informazioni a tuo vantaggio nei tuoi futuri progetti audio. Ti lascio con alcuni dei migliori consigli che abbia mai ricevuto: "fai ciò che semplicemente suona bene".