Jakie są różnice między MP3, FLAC i innymi formatami audio?

Opublikowany: 2022-01-29

Dźwięk cyfrowy istnieje od bardzo dawna, więc na pewno będzie mnóstwo formatów audio. Oto niektóre z bardziej powszechnych, co je wyróżnia i do czego ich używać.

Zanim porozmawiamy o codziennych formatach audio, ważne jest, abyś zrozumiał podstawy, a to oznacza zrozumienie PCM. Następnie zajmiemy się formatami skompresowanymi.

PCM Audio: od czego wszystko się zaczyna

Modulacja impulsowo-kodowa została stworzona w 1937 roku i jest najbliższym przybliżeniem analogowego dźwięku. Oznacza to, że przebieg analogowy jest aproksymowany w regularnych odstępach czasu. PCM charakteryzuje się dwiema właściwościami: częstotliwością próbkowania i głębią bitową. Częstotliwość próbkowania mierzy, jak często (w razach na sekundę) jest pobierana amplituda przebiegu, a głębokość bitowa mierzy możliwe wartości cyfrowe. Pod względem formatów audio jest to właściwie podstawa.

Prawdziwy dźwięk w prawdziwym świecie jest ciągły. W świecie cyfrowym tak nie jest. W jakiś sposób jest to bardziej mylące z dźwiękiem niż z wideo, więc przyjrzyjmy się wideo jako punktowi porównawczemu. To, co interpretujemy jako „ruch” lub o którym myślimy jako „płynne” i stale poruszające się, jest w rzeczywistości serią nieruchomych obrazów. W ten sam sposób amplituda fal dźwiękowych w formacie cyfrowym nie jest „płynna” ani ciągle się zmienia. Zmienia się w oparciu o określone kryteria w określonych odstępach czasu.

Obraz z Wikipedii

Wiem, że jest tu wiele rzeczy, które mogą nie być drugą naturą, chyba że jesteś inżynierem, fizykiem lub audiofilem, więc sprowadźmy to dalej za pomocą analogii.

Reklama

Załóżmy, że woda wypływająca z otwartego kranu jest Twoim „analogowym” źródłem dźwięku. Temperaturę wody możemy porównać do amplitudy fali dźwiękowej; to właściwość, którą należy zmierzyć, aby móc się nią właściwie cieszyć. Próbkowanie to liczba razy na sekundę, kiedy zanurzasz palec w płynącej wodzie. Im częściej zanurzasz w nim palec, tym bardziej „ciągłe” stają się zmiany temperatury. Jeśli włożysz palec do bieżącej wody 44 100 razy na sekundę, to prawie tak, jakbyś cały czas trzymał palec pod nią, prawda? To podstawowa idea samplowania.

Głębia bitowa jest nieco trudniejsza. Zamiast używać palca, powiedzmy, że użyłeś naprawdę gównianego termometru. Zasadniczo mówiło „gorące” dla wszystkiego powyżej temperatury pokojowej i „zimne” dla wszystkiego poniżej. Niezależnie od tego, ile razy zanurzałeś go w wodzie, tak naprawdę nie dałoby ci wielu przydatnych informacji. Teraz, jeśli zamiast tylko 2 opcji, powiedzmy, że termometr miał 16 możliwych wartości, których można użyć do pomiaru temperatury wody. Bardziej przydatne, prawda? Głębia bitowa działa w ten sam sposób, ponieważ wyższe wartości umożliwiają dokładniejsze odwzorowanie dynamicznych zmian amplitudy dźwięku.

Jak wcześniej wspomniano, PCM jest podstawą dźwięku cyfrowego, wraz z jego wariantami. PCM próbuje modelować przebieg fali w jak największym stopniu nieskompresowanej świetności. Jest wyjątkowy, można go utknąć w cyfrowym procesorze sygnałowym i można go mniej lub bardziej uniwersalnie odtwarzać. Większość innych formatów manipuluje dźwiękiem za pomocą algorytmów, więc muszą być dekodowane podczas odtwarzania. Dźwięk PCM jest uważany za „bezstratny”, jest nieskompresowany i dlatego zajmuje dużo miejsca na dysku twardym.

Nieskompresowana wiązka: WAV, AIFF

Obraz autorstwa codepo8

Zarówno WAV, jak i AIFF to bezstratne formaty kontenerów audio oparte na PCM, z niewielkimi zmianami w przechowywaniu danych. Dźwięk PCM dla większości ludzi jest dostępny w tych formatach, w zależności od tego, czy używasz systemu Windows, czy OS X, i można je konwertować między sobą bez pogorszenia jakości. Oba są również uważane za „bezstratne”, są nieskompresowane, a stereofoniczny (2-kanałowy) plik audio PCM, próbkowany z częstotliwością 44,1 kHz (lub 44100 razy na sekundę) przy 16 bitach („jakość CD”) wynosi około 10 MB na minuta. Jeśli nagrywasz w domu w celu miksowania, to właśnie tego chcesz użyć, ponieważ jest to pełna jakość.

Obraz autorstwa CyboRoZ

Formaty bezstratne: FLAC, ALAC, APE

Free Lossless Audio Codec, Apple Lossless Audio Codec i Monkey's Audio to wszystkie formaty, które kompresują dźwięk, podobnie jak wszystko, co jest kompresowane w świecie cyfrowym: za pomocą algorytmów. Różnica między plikami skompresowanymi a plikami FLAC polega na tym, że FLAC został zaprojektowany specjalnie dla dźwięku, dzięki czemu ma lepsze współczynniki kompresji bez utraty danych. Zazwyczaj widzisz około połowę rozmiaru plików WAV. Oznacza to, że plik FLAC dla dźwięku stereo w „jakości CD” działa z grubsza 5 MB na minutę.

Plusem jest to, że jeśli chcesz dokonać manipulacji dźwiękiem, możesz przekonwertować go z powrotem do formatu WAV bez utraty jakości . Jeśli jesteś audiofilem i słuchasz dużo muzyki z zakresami dynamicznymi, te formaty są dla Ciebie. Jeśli masz świetny zestaw głośników, puszek lub wkładek dousznych, te formaty wydobędą dźwięki, aby je zaprezentować.

Stratne formaty: MP3, AAC, WMA, Vorbis

Obraz autorstwa patrick h lauke

Większość formatów, które widzisz na co dzień, jest „stratna”; pewien stopień jakości dźwięku jest poświęcany w zamian za znaczny wzrost rozmiaru pliku. Przeciętny plik MP3 w „jakości CD” działa około 1 MB na minutę. Duża różnica w porównaniu do PCM, nie? Nazywa się to kompresją, ale w przeciwieństwie do formatów bezstratnych, tak naprawdę nie można odzyskać tej jakości po rozebraniu jej do formatów stratnych. Różne formaty stratne używają różnych algorytmów do przechowywania danych, dlatego zazwyczaj różnią się rozmiarem pliku w celu uzyskania porównywalnej jakości. Stratne formaty wykorzystują również bitrate w odniesieniu do jakości dźwięku, która zwykle wygląda jak „192 kbit/s” lub „192 kb/s”. Wyższe liczby oznaczają, że wypompowywanych jest więcej danych, dzięki czemu zachowana jest większa szczegółowość. Oto kilka szczegółów dotyczących bardziej popularnych formatów.

MP3: MPEG 1 Audio Layer 3, najpopularniejszy obecnie stratny kodek audio. Pomimo mnóstwa problemów patentowych, wciąż jest niesamowicie popularny. Kto nie ma plików MP3 leżących dookoła?
Vorbis: Darmowy, stratny format o otwartym kodzie źródłowym, używany częściej w grach komputerowych, takich jak Unreal Tournament 3. Fani FOSS, tacy jak wielu użytkowników Linuksa, z pewnością zobaczą wiele tego formatu.
AAC: Advanced Audio Coding, standardowy format używany obecnie z wideo MPEG4. Jest mocno wspierany ze względu na jego kompatybilność z DRM (np. FairPlay firmy Apple), jego ulepszenia w stosunku do mp3 i ponieważ nie jest wymagana żadna licencja, aby przesyłać strumieniowo lub dystrybuować treści w tym formacie. Fani Apple prawdopodobnie będą mieli w AAC mnóstwo.
WMA: Windows Media Audio, stratny format audio firmy Microsoft. Został opracowany i używany, aby uniknąć problemów licencyjnych z formatem MP3, ale ze względu na duże ulepszenia i kompatybilność z DRM, a także bezstratną implementację, wciąż jest dostępny. Był bardzo popularny, zanim iTunes stał się mistrzem muzyki DRMed.

Reklama

Stratne formaty są tym, czego używasz do wszystkich rzeczy, których słuchasz i przechowujesz. Zostały zaprojektowane z myślą o oszczędności miejsca na dysku twardym. Wybór formatu zależy od używanego cyfrowego odtwarzacza audio, ilości dostępnego miejsca, tego, jak duży jesteś jakościowym łowcą dziurek i wielu zmiennych. W dzisiejszych czasach komputery będą odtwarzać wszystko, większość odtwarzaczy audio (oprócz Apple oczywiście) obsługuje wiele formatów stratnych, a coraz więcej FLAC i APE. Apple trzyma się MP3, ALAC i AAC.

Czy jakość dźwięku nie jest subiektywna?

Absolutnie tak. Ostatecznie to twoje uszy pochłaniają większość tych rzeczy, ale to kolejny powód, aby poważnie myśleć o jakości. Kiedy po raz pierwszy zacząłem tworzyć swoją kolekcję muzyki cyfrowej, nie mogłem odróżnić 128kbitowych plików MP3 od płyt audio CD. W moich uszach nie było zauważalnej różnicy. Z biegiem czasu zauważyłem jednak, że 256 kbit brzmiało znacznie lepiej, a po tym, jak dostałem naprawdę fajny (i drogi!) zestaw słuchawek, wróciłem na stałe do płyt audio CD! Zależy to również od gatunku muzyki.

Obraz autorstwa jonchoo

Tutaj jest WIELE zmiennych, ludzie, nie popełnijcie tego błędu. Minęło trochę czasu, zanim zdecydowałem się na użycie FLAC do niektórych utworów i MP3 320 kb/s do reszty. Chodzi mi o to, że powinieneś poeksperymentować, aby zobaczyć, co działa najlepiej dla Ciebie i Twojej muzyki, ale pamiętaj, że wraz ze zmianą gustów, Twoje postrzeganie, Twój sprzęt i znaczenie jakości również.

A wszystkie te rzeczy stają się jeszcze trudniejsze, gdy nie mówisz tylko o muzyce, ale o ścieżkach głosowych, efektach dźwiękowych, białym i brązowym szumie itp. Istnieje cały świat dźwięków, więc nie zniechęcaj się! Ucząc się tego, co możesz i słuchając sam, możesz wykorzystać te informacje na swoją korzyść w przyszłych projektach audio. Zostawię ci jedną z najlepszych rad, jakie kiedykolwiek otrzymałem: „rób to, co po prostu brzmi dobrze”.