MP3、FLAC 和其他音频格式之间有什么区别?
已发表: 2022-01-29数字音频已经存在了很长时间,所以肯定会有大量的音频格式。 以下是一些较常见的,它们的区别以及它们的用途。
在我们谈论日常音频格式之前,了解基础知识很重要,这意味着了解 PCM。 之后,我们将处理压缩格式。
PCM 音频:一切从这里开始
脉冲编码调制创建于 1937 年,是最接近模拟音频的方法。 即,模拟波形以规则间隔近似。 PCM 具有两个特性:采样率和位深度。 采样率测量波形的幅度被采集的频率(以每秒为单位),位深度测量可能的数字值。 就音频格式而言,这几乎是基础。
真实的声音,在现实世界中,是连续的。 在数字世界中,它不是。 不知何故,这与音频比与视频更令人困惑,所以让我们将视频作为一个比较点。 我们解释为“运动”或认为是“流动”且不断运动的东西,实际上是一系列静止的图片。 同样,数字格式的声波幅度不是“流动的”或不断变化的。 它会根据某些标准以预定义的时间间隔发生变化。
图片来自维基百科
我知道这里有很多可能不是第二天性的东西,除非你是工程师、物理学家或发烧友,所以让我们用一个类比进一步简化它。
假设从打开的水龙头流出的水是您的“模拟”音频源。 我们可以将水的温度与音频波的幅度进行比较; 这是一个需要衡量的属性,以便您可以适当地享受它。 采样是指每秒将手指浸入流动水中的次数。 手指伸入其中的次数越多,温度变化就越“连续”。 如果你以每秒 44,100 次的速度将手指伸入流水中,这几乎就像把你的手指一直放在水里一样,对吧? 这就是抽样背后的基本思想。
位深度有点棘手。 假设您使用了一个非常糟糕的温度计,而不是使用您的手指。 它基本上对高于室温的任何东西都说“热”,而对低于室温的任何东西都说“冷”。 无论您将它浸入水中多少次,它都不会真正为您提供太多有用的信息。 现在,如果不是只有 2 个选项,假设温度计有 16 个可能的值,您可以使用它们来测量水温。 更有用,对吧? 位深度的工作方式相同,因为较高的值允许更准确地描绘声音幅度的动态变化。
如前所述,PCM 是数字音频及其变体的基础。 PCM 试图以尽可能多的未压缩光彩对波形进行建模。 它很特别,可以嵌入数字信号处理器中,并且或多或少可以普遍播放。 大多数其他格式通过算法处理音频,因此需要在播放时对其进行解码。 PCM 音频被认为是“无损”的,它是未压缩的,因此会占用大量硬盘空间。
未压缩包:WAV、AIFF
图片来自codepo8
WAV 和 AIFF 都是基于 PCM 的无损音频容器格式,在数据存储方面有一些细微的变化。 对于大多数人来说,PCM 音频采用这些格式,具体取决于您使用的是 Windows 还是 OS X,并且它们可以相互转换而不会降低质量。 它们也都被认为是“无损的”,是未压缩的,立体声(2 通道)PCM 音频文件,以 44.1 kHz(或每秒 44100 次)在 16 位(“CD 质量”)下的采样率约为 10 MB/分钟。 如果您在家中录制以进行混音,这就是您想要使用的,因为它具有完整的质量。
图片来自CyboRoZ
无损格式:FLAC、ALAC、APE
Free Lossless Audio Codec、Apple Lossless Audio Codec 和 Monkey's Audio 都是压缩音频的格式,与数字世界中压缩任何东西的方式非常相似:使用算法。 压缩文件和 FLAC 文件的区别在于 FLAC 是专为音频设计的,因此具有更好的压缩率而不会丢失任何数据。 通常,您会看到大约一半的 WAV 大小。 也就是说,“CD 质量”的立体声音频 FLAC 文件大约每分钟运行 5 MB。

好处是,如果您想进行音频处理,您可以转换回 WAV而不会损失任何质量。 如果您是发烧友并聆听大量具有动态范围的音乐,那么这些格式适合您。 如果您有一套很棒的扬声器、罐子或耳塞,这些格式将带出音调来展示它们。
有损格式:MP3、AAC、WMA、Vorbis
图片来自patrick h lauke
您在日常使用中看到的大多数格式都是“有损”的; 为了换取文件大小的显着增加,牺牲了一定程度的音频质量。 平均“CD 质量”的 MP3 播放速度约为每分钟 1 MB。 与PCM相比有很大的不同,不是吗? 这称为压缩,但与无损格式不同,一旦将其剥离为有损格式,就无法真正恢复质量。 不同的有损格式使用不同的算法来存储数据,因此它们通常在文件大小上有所不同以获得可比的质量。 有损格式也使用比特率来指代音频质量,通常看起来像“192 kbit/s”或“192 kbps”。 更高的数字意味着更多的数据被抽出,所以有更多的细节保存。 以下是更流行格式的一些详细信息。
- MP3:MPEG 1 Audio Layer 3,当今最常见的有损音频编解码器。 尽管存在大量专利问题,但它仍然非常受欢迎。 谁没有MP3?
- Vorbis:一种免费且开源的有损格式,在 Unreal Tournament 3 等 PC 游戏中更常用。FOSS 粉丝,如许多 Linux 用户,一定会看到很多这种格式。
- AAC:高级音频编码,一种现在用于 MPEG4 视频的标准化格式。 由于它与 DRM(例如 Apple 的 FairPlay)的兼容性,它对 mp3 的改进,并且因为以这种格式流式传输或分发内容不需要许可证,因此它得到了大力支持。 苹果粉丝可能会在 AAC 中拥有很多。
- WMA:Windows Media Audio,微软的有损音频格式。 它的开发和使用是为了避免 MP3 格式的许可问题,但由于重大改进和 DRM 兼容性以及无损实现,它仍然存在。 在 iTunes 成为 DRMed 音乐冠军之前,它真的很受欢迎。
有损格式是您用于收听和存储的所有内容的格式。 它们旨在节省硬盘空间。 您选择哪种格式取决于您使用的数字音频播放器、您有多少空间、您的挑剔质量有多大,以及一堆过度变量。 如今,计算机可以播放任何东西,大多数音频播放器(当然苹果除外)都会播放多种有损格式,而且越来越多的播放器会播放 FLAC 和 APE。 Apple 坚持使用 MP3、ALAC 和 AAC。
音频质量不是主观的吗?
绝对是。 最终,你的耳朵会消耗大部分这些东西,但这更有理由认真考虑质量。 当我第一次开始创建我的数字音乐收藏时,我无法真正区分 128kbit MP3 和音频 CD 之间的区别。 在我看来,没有明显的区别。 然而,随着时间的推移,我注意到 256 kbit 的声音听起来好多了,在我买了一套非常好(而且很贵!)的耳机后,我又回到了音频 CD 上! 这也取决于音乐的类型。
图片来自jonchoo
伙计们,这里有很多变量,请不要误会。 我花了一段时间才决定使用 FLAC 播放一些音乐,而使用 320kbps MP3 播放其余音乐。 我要说明的一点是,您应该尝试看看什么最适合您和您的音乐,但请注意,随着您的品味发生变化,您的感知、您的设备以及质量的重要性也会发生变化。
当您不仅在谈论音乐,还谈论音轨、音效、白噪声和棕色噪声等时,所有这些东西都会变得更加棘手。那里有一个完整的声音世界,所以不要气馁! 通过学习你能做什么并自己倾听,你可以在未来的音频项目中利用这些信息来发挥你的优势。 我会给你一些我曾经得到的最好的建议:“做一些听起来不错的事情。”