อะไรคือความแตกต่างระหว่าง MP3, FLAC และรูปแบบเสียงอื่นๆ?

เผยแพร่แล้ว: 2022-01-29

เสียงดิจิตอลมีมานานแล้วดังนั้นจึงต้องมีรูปแบบเสียงมากมายเหลือเฟือ ต่อไปนี้คือข้อมูลทั่วไปบางส่วน สิ่งที่ทำให้แตกต่าง และควรใช้เพื่ออะไร

ก่อนที่เราจะพูดถึงรูปแบบเสียงในชีวิตประจำวัน สิ่งสำคัญคือคุณต้องเข้าใจพื้นฐาน และนั่นหมายถึงการเข้าใจ PCM หลังจากนั้น เราจะจัดการกับรูปแบบที่บีบอัด

PCM Audio: จุดเริ่มต้นทั้งหมด

การมอดูเลตรหัสพัลส์ถูกสร้างขึ้นในปี 2480 และเป็นเสียงอะนาล็อกที่ใกล้เคียงที่สุด นั่นคือรูปคลื่นแอนะล็อกจะประมาณเป็นช่วงปกติ PCM มีคุณสมบัติสองประการ: อัตราตัวอย่างและความลึกของบิต อัตราสุ่มวัดความถี่ (เป็นครั้งต่อวินาที) แอมพลิจูดของรูปคลื่นถูกนำมาใช้ และความลึกของบิตจะวัดค่าดิจิทัลที่เป็นไปได้ ในแง่ของรูปแบบเสียง นี่เป็นพื้นฐานที่ค่อนข้างมาก

เสียงที่แท้จริงในโลกแห่งความเป็นจริงนั้นต่อเนื่อง ในโลกดิจิทัลมันไม่ใช่ ยังไงก็ตาม วิธีนี้จะทำให้เสียงสับสนมากกว่าวิดีโอ ดังนั้น ให้มาดูที่วิดีโอเพื่อเปรียบเทียบกัน สิ่งที่เราตีความว่าเป็น "การเคลื่อนไหว" หรือคิดว่าเป็น "ของไหล" และเคลื่อนไหวตลอดเวลา แท้จริงแล้วคือชุดของภาพนิ่ง ในทำนองเดียวกัน แอมพลิจูดของคลื่นเสียงในรูปแบบดิจิทัลจะไม่ "ไหล" หรือเปลี่ยนแปลงตลอดเวลา มีการเปลี่ยนแปลงตามเกณฑ์บางอย่างในช่วงเวลาที่กำหนดไว้ล่วงหน้า

ภาพจาก Wikipedia

ฉันรู้ว่ามีหลายอย่างที่อาจไม่ใช่ลักษณะที่สองเว้นแต่คุณจะเป็นวิศวกร นักฟิสิกส์ หรือออดิโอไฟล์ ดังนั้นเรามาเปรียบเทียบกันเพิ่มเติม

โฆษณา

สมมติว่าน้ำที่ไหลจากก๊อกน้ำแบบเปิดคือแหล่งกำเนิดเสียง "แอนะล็อก" ของคุณ อุณหภูมิของน้ำที่เราเปรียบเทียบได้กับแอมพลิจูดของคลื่นเสียง เป็นคุณสมบัติที่ต้องวัดเพื่อให้คุณสามารถเพลิดเพลินได้อย่างเหมาะสม การสุ่มตัวอย่างคือจำนวนครั้งต่อวินาทีที่คุณจุ่มนิ้วลงไปในน้ำที่ไหล ยิ่งคุณจุ่มนิ้วเข้าไปบ่อยเท่าไหร่ อุณหภูมิก็จะยิ่งเปลี่ยนแปลง "ต่อเนื่อง" มากขึ้นเท่านั้น ถ้าคุณเอานิ้วจุ่มลงไปในน้ำที่ไหล 44,100 ครั้งต่อวินาที มันเกือบจะเหมือนกับการเอานิ้วจุ่มลงไปในน้ำตลอดเวลาใช่ไหม? นั่นคือแนวคิดพื้นฐานเบื้องหลังการสุ่มตัวอย่าง

ความลึกของบิตนั้นซับซ้อนกว่าเล็กน้อย แทนที่จะใช้นิ้ว สมมติว่าคุณใช้เทอร์โมมิเตอร์แบบแครปเปอร์จริงๆ โดยทั่วไปแล้วจะพูดว่า "ร้อน" สำหรับสิ่งที่สูงกว่าอุณหภูมิห้องและ "เย็น" สำหรับสิ่งที่อยู่ด้านล่าง ไม่ว่าคุณจะจุ่มมันลงในน้ำกี่ครั้ง มันก็ไม่ได้ให้ข้อมูลที่เป็นประโยชน์แก่คุณมากนัก ทีนี้ ถ้าแทนที่จะมีแค่ 2 ตัวเลือก สมมุติว่าเทอร์โมมิเตอร์มีค่าที่เป็นไปได้ 16 ค่า ซึ่งคุณสามารถใช้วัดอุณหภูมิของน้ำได้ มีประโยชน์มากกว่า จริงไหม? ความลึกของบิตทำงานในลักษณะเดียวกัน โดยค่าที่สูงกว่านั้นช่วยให้สามารถแสดงการเปลี่ยนแปลงแบบไดนามิกมากขึ้นในแอมพลิจูดของเสียงได้อย่างแม่นยำ

ดังที่ได้กล่าวไว้ก่อนหน้านี้ PCM เป็นรากฐานสำหรับเสียงดิจิทัลพร้อมกับรูปแบบต่างๆ PCM พยายามสร้างแบบจำลองของรูปคลื่นในลักษณะที่ไม่บีบอัดให้มากที่สุด เป็นเรื่องพิเศษที่พร้อมจะติดอยู่ในตัวประมวลผลสัญญาณดิจิทัล และสามารถเล่นได้ในระดับสากลไม่มากก็น้อย รูปแบบอื่นๆ ส่วนใหญ่จะควบคุมเสียงผ่านอัลกอริธึม ดังนั้นจึงต้องถอดรหัสขณะเล่น เสียง PCM ถือว่า "ไม่สูญเสียข้อมูล" และไม่มีการบีบอัด ดังนั้นจึงใช้พื้นที่ฮาร์ดไดรฟ์เป็นจำนวนมาก

กลุ่มที่ไม่มีการบีบอัด: WAV, AIFF

ภาพโดย codepo8

ทั้ง WAV และ AIFF เป็นรูปแบบคอนเทนเนอร์เสียงแบบไม่สูญเสียข้อมูลโดยอิงจาก PCM โดยมีการเปลี่ยนแปลงเล็กน้อยในการจัดเก็บข้อมูล สำหรับคนส่วนใหญ่ เสียง PCM มาในรูปแบบเหล่านี้ ขึ้นอยู่กับว่าคุณใช้ Windows หรือ OS X หรือไม่ และสามารถแปลงเป็นและจากกันโดยไม่ทำให้คุณภาพลดลง ทั้งคู่ถือว่า "ไม่สูญเสีย" โดยไม่มีการบีบอัดและไฟล์เสียง PCM สเตอริโอ (2 ช่องสัญญาณ) สุ่มตัวอย่างที่ 44.1 kHz (หรือ 44100 ครั้งต่อวินาที) ที่ 16 บิต ("คุณภาพซีดี") จำนวนประมาณ 10 MB ต่อ นาที. หากคุณกำลังบันทึกที่บ้านเพื่อจุดประสงค์ในการมิกซ์ นี่คือสิ่งที่คุณต้องการใช้เพราะมันมีคุณภาพเต็มที่

ภาพโดย CyboRoZ

รูปแบบที่ไม่มีการสูญเสีย: FLAC, ALAC, APE

Free Lossless Audio Codec, Apple Lossless Audio Codec และ Monkey's Audio เป็นรูปแบบทั้งหมดที่บีบอัดเสียง ในลักษณะเดียวกับที่บีบอัดในโลกดิจิทัล: โดยใช้อัลกอริธึม ความแตกต่างระหว่างไฟล์ซิปและไฟล์ FLAC คือ FLAC ได้รับการออกแบบมาโดยเฉพาะสำหรับเสียง ดังนั้นจึงมีอัตราการบีบอัดที่ดีกว่าโดยไม่ทำให้ข้อมูลสูญหาย โดยทั่วไปแล้ว คุณจะเห็นขนาดของ WAV ประมาณครึ่งหนึ่ง นั่นคือไฟล์ FLAC สำหรับเสียงสเตอริโอที่ "คุณภาพซีดี" ทำงานประมาณ 5 MB ต่อนาที

ข้อดีคือ หากคุณต้องการปรับแต่งเสียง คุณสามารถแปลงกลับเป็น WAV ได้โดยไม่สูญเสียคุณภาพ หากคุณเป็นคนรักเสียงเพลงและฟังเพลงที่มีไดนามิกเรนจ์เป็นจำนวนมาก รูปแบบเหล่านี้เหมาะสำหรับคุณ หากคุณมีลำโพง กระป๋อง หรือเอียร์บัดดีๆ สักชุด รูปแบบเหล่านี้จะดึงโทนสีออกมาเพื่อแสดง

รูปแบบการสูญเสีย: MP3, AAC, WMA, Vorbis

ภาพโดย patrick h lauke

รูปแบบส่วนใหญ่ที่คุณเห็นในการใช้งานแบบวันต่อวันคือ "สูญเสีย"; คุณภาพเสียงบางระดับถูกเสียสละเพื่อแลกกับการเพิ่มขนาดไฟล์อย่างมีนัยสำคัญ MP3 “คุณภาพซีดี” โดยเฉลี่ยทำงานประมาณ 1 MB ต่อนาที ความแตกต่างอย่างมากเมื่อเทียบกับ PCM ใช่ไหม สิ่งนี้เรียกว่าการบีบอัด แต่ต่างจากรูปแบบที่ไม่มีการสูญเสีย คุณไม่สามารถดึงคุณภาพนั้นกลับคืนมาเมื่อคุณดึงมันออกมาในรูปแบบการสูญเสีย รูปแบบการสูญเสียที่แตกต่างกันใช้อัลกอริธึมที่แตกต่างกันในการจัดเก็บข้อมูล ดังนั้นโดยทั่วไปแล้วจะแตกต่างกันไปตามขนาดไฟล์เพื่อคุณภาพที่เทียบเท่ากัน รูปแบบ Lossy ยังใช้บิตเรตเพื่ออ้างถึงคุณภาพเสียง ซึ่งมักจะดูเหมือน “192 kbit/s” หรือ “192 kbps” ตัวเลขที่สูงขึ้นหมายความว่ามีการส่งข้อมูลออกไปมากขึ้น ดังนั้นจึงมีการรักษารายละเอียดไว้มากขึ้น ต่อไปนี้เป็นรายละเอียดบางส่วนสำหรับรูปแบบที่เป็นที่นิยมมากขึ้น

MP3: MPEG 1 Audio Layer 3 ซึ่งเป็นตัวแปลงสัญญาณเสียงที่สูญเสียบ่อยที่สุดในปัจจุบัน แม้จะมีปัญหาสิทธิบัตรมากมาย แต่ก็ยังได้รับความนิยมอย่างไม่น่าเชื่อ ใครไม่มี MP3 วางอยู่รอบตัว?
Vorbis: รูปแบบโอเพ่นซอร์สที่ฟรีและสูญหายซึ่งใช้บ่อยในเกมพีซีเช่น Unreal Tournament 3 แฟน ๆ FOSS เช่นผู้ใช้ Linux จำนวนมากจะต้องเห็นรูปแบบนี้มากมาย
AAC: การเข้ารหัสเสียงขั้นสูง ซึ่งเป็นรูปแบบมาตรฐานที่ใช้กับวิดีโอ MPEG4 ในขณะนี้ ได้รับการสนับสนุนอย่างมากเนื่องจากเข้ากันได้กับ DRM (เช่น FairPlay ของ Apple) การปรับปรุงมากกว่า mp3 และเนื่องจากไม่จำเป็นต้องมีใบอนุญาตเพื่อสตรีมหรือแจกจ่ายเนื้อหาในรูปแบบนี้ แฟน ๆ ของ Apple น่าจะมี AAC มากมาย
WMA: Windows Media Audio รูปแบบเสียงที่สูญเสียของ Microsoft ได้รับการพัฒนาและใช้เพื่อหลีกเลี่ยงปัญหาการอนุญาตให้ใช้สิทธิ์กับรูปแบบ MP3 แต่เนื่องจากการปรับปรุงที่สำคัญและความเข้ากันได้ของ DRM รวมถึงการใช้งานแบบไม่สูญเสียข้อมูลจึงยังคงอยู่ เป็นที่นิยมมากก่อนที่ iTunes จะกลายมาเป็นแชมป์ของเพลง DRMed

โฆษณา

รูปแบบ Lossy คือสิ่งที่คุณใช้สำหรับสิ่งที่คุณฟังและจัดเก็บทั้งหมด ได้รับการออกแบบมาให้ประหยัดพื้นที่ฮาร์ดไดรฟ์ รูปแบบที่คุณเลือกขึ้นอยู่กับเครื่องเล่นเสียงดิจิทัลที่คุณใช้ พื้นที่ว่างที่คุณมี คุณภาพของนิตพิคเกอร์ และตัวแปรมากมาย ทุกวันนี้ คอมพิวเตอร์จะเล่นอะไรก็ได้ เครื่องเล่นเสียงส่วนใหญ่ (ยกเว้นของ Apple แน่นอน) จะทำได้หลายรูปแบบที่สูญเสียไป และ FLAC และ APE ก็มีมากขึ้นเรื่อยๆ Apple ยึดติดกับ MP3, ALAC และ AAC

คุณภาพเสียงไม่ใช่อัตนัยใช่ไหม

แน่นอนมันเป็น ในที่สุด หูของคุณเท่านั้นที่บริโภคสิ่งนี้ส่วนใหญ่ แต่นั่นเป็นเหตุผลที่ควรพิจารณาคุณภาพอย่างจริงจังมากกว่า เมื่อฉันเริ่มสร้างคอลเลคชันเพลงดิจิทัลครั้งแรก ฉันไม่สามารถแยกแยะความแตกต่างระหว่าง MP3 ขนาด 128kbit และซีดีเพลงได้ สำหรับหูของฉันไม่มีความแตกต่างที่เห็นได้ชัดเจน อย่างไรก็ตาม เมื่อเวลาผ่านไป ฉันสังเกตว่า 256 kbit ฟังดูดีขึ้นมาก และหลังจากที่ฉันได้หูฟังดีๆ (และราคาแพง!) ฉันก็กลับไปใช้ซีดีเพลงเต็มเวลา! นอกจากนี้ยังขึ้นอยู่กับประเภทของเพลง

ภาพโดย jonchoo

มีตัวแปรมากมายที่นี่ ทุกคน อย่าพลาดเรื่องนี้ ต้องใช้เวลาสักพักกว่าที่ฉันจะใช้ FLAC สำหรับเพลงบางเพลงและ MP3 320kbps สำหรับส่วนที่เหลือ ประเด็นที่ฉันกำลังพยายามทำคือ คุณควรทดลองเพื่อดูว่าอะไรดีที่สุดสำหรับคุณและเพลงของคุณ แต่พึงระวังว่าเมื่อรสนิยมของคุณเปลี่ยนไป การรับรู้ของคุณ อุปกรณ์ของคุณ และความสำคัญของคุณภาพก็จะเปลี่ยนไปเช่นกัน

และสิ่งเหล่านี้จะยิ่งซับซ้อนขึ้นไปอีกเมื่อคุณไม่เพียงแค่พูดถึงดนตรี แต่เกี่ยวกับแทร็กเสียง เอฟเฟกต์เสียง นอยส์สีขาวและสีน้ำตาล ฯลฯ โลกทั้งใบเต็มไปด้วยเสียง อย่าท้อแท้! ด้วยการเรียนรู้สิ่งที่คุณทำได้และฟังด้วยตัวคุณเอง คุณสามารถใช้ข้อมูลนี้เพื่อประโยชน์ของคุณในโครงการเสียงในอนาคตของคุณ ฉันจะฝากคำแนะนำที่ดีที่สุดที่ฉันเคยได้รับมาให้คุณ: “ทำสิ่งที่ฟังดูธรรมดาๆ ดี”