اگر دوست دارید فایلهای صوتی را با کیفیت بالا و جزئیات زیاد گوش کنید یا دوست دارید فیلمهای جدید را با صدایی باکیفیت، هیجانانگیز و واضح بشنوید، حتما زیاد درگیر فرمتهای مختلف صوتی هستید و باتوجه به قابلیتها و ویژگیهای پلیرهای سختافزاری و نرمافزاری، دوست دارید بدانید کدام یک از فرمتها بهترین کیفیت را در اختیار شما قرار میدهند. از سوی دیگر حتما هنگام استفاده از نرمافزارهای مبدل فایلهای صوتی با تنظیمات و اصطلاحاتی مواجه شدهاید که با آنها آشنایی نداشتهاید و همین موضوع شما را سردرگم کرده است.
در ادامه با توضیح مفاهیم مرتبط با فرمتهای صوتی مختلف با بیانی ساده و همچنین مقایسهی این فرمتها با یکدیگر، تلاش میکنیم به سؤالهای احتمالی شما دررابطهبا این موضوع پاسخ دهیم.
مفاهیم مرتبط با فرمتهای صوتی فرمتفرمت روشی استاندارد برای رمزگذاری فایلهای صوتی و ذخیرهسازی آنها در کامپیوتر است. درحقیقت دادههای فرمتها دربردارندهی دادههای خام صوتی هستند. فرمتهای صوتی به دو دستهی فشرده و غیرفشرده تبدیل میشوند که در ادامه در مورد آنها توضیح خواهیم داد.
در لینک زیر میتوانید فهرست تمام فایلهای صوتی ایجاشده توسط سازندگان مختلف را مشاهده کنید؛ به دلیل اینکه بسیاری از این فرمتها تنها در موارد معدودی استفاده میشوند و چندان متداول نیستند و پلیرهای سختافزاری و نرمافزاری محدودی از آنها پشتیبانی میکنند، در بخش مقایسهی فرمتها تنها فرمتهایی را بررسی میکنیم که متداول هستند که شامل MP3، MP2، WAV، PCM، AIFF، AAC، AC3، OGG، WMA، FLAC، ALAC، Vorbis، DTS و AVC میشوند.
میتوانید از اینجا فهرست کاملی از فرمتهای صوتی را مشاهده کنید.
دادهی متا (Meta date)دادههای متای فایلهای صوتی شامل هنرمند سازندهی موسیقی (Artist)، آلبوم (Album)، تصویر کاور آلبوم (Album Artwork)، عنوان فایل (Track title)، شمارهی فایل (Track number) و ژانر (Genre) میشود.
فشردهسازی (Compressing) مقالهی مرتبط:فشردهسازی فایلهای موسیقی برای کاهش حجم آنها انجام میشود؛ البته در زمان فشردهسازی برخی از فایلها تمام اطلاعات آنها حفظ میشود که به آنها فایلهای صوتی Lossless گفته میشود و از میان این فایلها میتوان به FLAC و ALAC اشاره کرد. از سویی دیگر فایلهایی هستند که برخی از اطلاعات آنها در زمان فشردهسازی بهمنظور کاهش بیشتر حجم حذف میشوند. قطعا این کار کیفیت صدا را کاهش میدهد؛ اما در زمان حذف این اطلاعات معمولا اطلاعات و جلوههایی حذف میشوند که تأثیر چندانی در کاهش کیفیت ندارند و نویز ناشی از کاهش کیفیت با استفاده از روشها و استانداردهای خاص به حداقل میرسد. به این دسته از این فایلها گفته Lossy میشود و فایلهای MP3 و AAC نمونهای از این فایلها هستند. یادآوری میشود، در هر یک از این دو روش فشردهسازی دادههای متا حذف نمیشوند؛ البته برخی از فرمتها مثل WAV و AIFF اصلا فشرده نمیشوند و کیفیت بالایی دارند.
کانتینر (Container)کانتینر که برخی از افراد آن را با فرمت یکی میدانند یا آن را با فرمت اشتباه میگیرند، میتواند فرمتهای مختلفی را در خود جای دهد؛ بهعنوان مثال فرمت WAV درواقع یک کانتینر است که معمولا دربردازندهی فرمت PCM است.
نرخ فشردهسازی (Compression rate)نرخ فشردهسازی نشان میدهد که فایل صوتی تا چه حدی فشرده شده است. هر چقدر نرخ فشردهسازی بیشتر شود حجم و بلندی صدای فایل صوتی کمتر و بخشهای بیصدای فایل صوتی تقویت میشوند و درنتیجه فایل فشردهتر میشود؛ بهعنوان مثال نرخ فشردهسازی 2:1 بهمعنی فشردهسازی فایل به میزان یک دوم حجم فایل اصلی و نرخ فشردهسازی 8:1 بهمعنی فشردهسازی فایل به میزان یک هشتم فایل اصلی است.
ریپکردن (Ripping)اکسترکتکردن (خارجکردن از حالت فشرده) فایلهای Audio CD، کپیکردن آنها روی هارد و درنهایت تبدیل آنها به فرمتهای مختلف صوتی با استفاده از نرمافزارهای ripping را ریپکردن میگویند.
سیدی صوتی (Audio CD)به سیدیهای دربردارندهی فایلهای صوتی و موسیقی طراحیشده برای سیدی پلیرها گفته میشود: این سیدیها همان سیدیهای اورجینال موسیقی هستند که در فروشگاههای معتبر به فروش میرسند. ترکهای موجود روی این سیدی (فایلهای موسیقی) که معمولا دارای فرمت WAV هستند، فشردهشده نیستند و به همین دلیل کیفیت بالایی دارند.
استاندارد صوتی MPEGاین استاندارد برای فشردهسازی فایلهای صوتی بهکار میرود. حجم فایلهایی که با استفاده از این استاندارد فشرده میشوند، به میزان چشمگیری کمتر از فایل اصلی است؛ اما کاهش کیفیت آن نسبت به فایل اصلی چندان چشمگیر نیست.
رمزگذاری و رمزگشایی (Encoding and Decoding)رمزگذاری (که در اصطلاح به آن انکد هم گفته میشود) بهمعنی استفاده از الگوریمهای خاص برای فشردهسازی فایلها و خارجکردن آنها از حالت فشرده و همچنین تبدیل فایل صوتی به فرمتهای قابلشناسایی برای پلیرهای مختلف است. رمزگشایی فایلهایی صوتی هم بهمعنای تشخیص اطلاعات فایلها جهت خواندن آنها است.
کدک (Codec)کدک نرمافزاری برای اجرای الگوریتمی جهت رمزگذاری و رمزگشایی (دیکد) فایلهای صوتی است. درواقع هدف از بهکارگیری این الگوریتم ایجاد صدایی با کیفیت بالا و حفظ کیفیت آن با حداقل تعداد ممکن بیت است. با استفاده از کدکهای مختلف میتوان حجم فایلهای صوتی و پهنای باند موردنیاز برای پخش فایلها را کاهش داد.
کدک با فرمت تفاوت دارد؛ همانطور که گفتیم، کدک ابزاری برای رمزگذاری و رمزگشایی دادههای صوتی است؛ اما فرمت دربردارندهی این فایلها است؛ بهعنوان مثال MP3 یک فرمت و LAME یک کدک محسوب میشود.
کدک متنباز (Open source codec): کدکهای متنباز کدکهایی هستند که در اختیار همه قرار دارند و مختص سازندگان خاصی نیستند. علاوهبر کدکهای متنباز، فرمتهای متنباز نیز ایجاد شدهاند.
بیتریت یا نرخ بیت (Bitrate)بیتریت درواقع به تعداد بیتهایی از فایل گفته میشوند که در هر واحد زمانی پردازش میشوند و هر چقدر میزان بیتریت یک فایل بیشتر باشد، کیفیت و حجم صدای آن فایل هم بیشتر است. واحد سنجش بیتریت، کیلوبیت (kbps) در ثانیه است (مثلا ۱۲۸ کیلوبیت یا ۳۲۰ کیلوبیت در ثانیه). بیتریت فایلهای موسیقی معمولا بین ۹۶ تا ۳۲۰ کیلوبیت در ثانیه است؛ البته بیتریت فرمت DTS که معمولا برای فیلمهای دارای صدای فراگیر استفاده میشود، به ۱۵۰۹ کیلوبیت در ثانیه هم میرسد که باعث میشود کاربران صدایی هیجانانگیز را بشنوند و کاملا در فضای فیلم قرار بگیرند.
بیتریت فایلهای صوتی به دو دسته تقسیم میشوند؛ بیتریت ثابت و بیتریت متغیر. در بیتریت ثابت بیتریت در طول پخش فایل صوتی یا تصویری ثابت است یا تغییر بسیار کمی دارد؛ اما در بیتریت متغیر، میزان بیتریت متناسب با پیچیدگی فایل موسیقی و تعداد بیتهای درحال پردازش در هر ثانیه افزایش یا کاهش مییابد.
سمپل ریت یا نرخ نمونهبرداری (Sample Rate)به بیان ساده سمپل ریت به تعداد دفعاتی گفته میشود که یک سیگنال صوتی در زمان تبدیلشدن به سیگنال دیجیتالی، پردازش میشود و واحد سنجش آن هرتز یا کیلوهرتز در ثانیه است. درواقع سمپل ریت برای اندازهگیری فرکانس ایجاد شده است. سمپل ریت متداول صدای فیلمها و فایلهای موسیقی ۴۸ کیلوهرتز و بهترین سمپل ریت ۴۴٫۱ کیلوهرتز است که بهترین گزینه برای تولید حرفهای موسیقی و فایلهای صوتی نیز محسوب میشود. سمپل ریت برخی از فایلهای به ۱۹۲ کیلوهرتز نیز میرسد. درکل فایلهای صوتی با سمپل ریت بالاتر کیفیت بهتر و صدای بیشتری دارند.
عمق بیت (Bit Depth)عمق بیت که درواقع نشاندهنده وضوح و رزولوشن دادههای صوتی ایجادشده و ذخیرهشده در هر فایل صوتی است، عمق بیت به تعداد بیتهای اطلاعات در دسترس در هر بار نمونهبرداری (پردازش سیگنالها در زمان تبدیل سیگنالهای آنالوگ به دیجیتال) گفته میشود. عمق بیت در فایلهای صوتی سیدی ۱۶ بیت و در فایلهای صوتی دیویدی ۲۴ بیت است. عمق بیت بیشتر نیز بهمعنای کیفیت بالاتر و حجم صدای بالاتر است. درواقع با افزایش یک بیت، بلندی صدا نیز ۶ دسیبل افزایش مییابد.
کانالهای صدا (Audio channels)فایلهای صوتی از نظر تعداد کانال به فایلهای مونو یا تک کاناله، استریو یا دو کاناله و فراگیر تقسیم میشوند.
صدای مونودر فایلهای صوتی مونو که تقریبا دیگر منسوخ شده است، تمام اصوات از یک کانال پخش میشوند و از یکدیگر تفکیک نمیشوند. باتوجه به اینکه امروزه تقریبا تمام دستگاهها از صدای استریو پشتیبانی میکنند، تقریبا کسی دیگر از صدای مونو استقبال نمیکند؛ میتوان گفت صدای مونو تنها برای افرادی مناسب است که یک گوش آنها مشکل داشته باشد و میخواهند بخشهای مختلف صدا را بشنوند.
استریوصدای استریو نسل بعدی فناوری صوتی محسوب میشوند. صدای استریو از دو اسپیکر پخش میشود که یکی از آنها در سمت راست دستگاه و دیگری در سمت چپ آن قرار دارد؛ بنابراین گوش چپ و راست فرد صدا متفاوتی را میشوند. تفاوت بین صدای مونو و استریو زمانی بیشتر محسوس میشود که از هدفون استفاده کنید؛ بهعنوان مثال وقتی با هدفون در حال شنیدن موسیقی جذابی هستید که برای ساخت آن از دو ساز متفاوت استفاده شده است، صدای یکی از سازها را از گوش راست خود و صدای ساز دیگری را از سمت چپ میشنوید. صداهای استریو و سراند میتوانند تجربهی حضور در کنسرت زنده یا صحنههای هیجانانگیز فیلمها را شبیهسازی کنند یا این حس را به شما القا میکنند که کاملا در فضای فیلم یا بازی قرار دارید (البته صدای فراگیر این تجربه و حس را به مراتب بهتر ایجاد میکند).
صدای فراگیرصدای فراگیر که به آن صدای دالبی، سراند یا چند کاناله نیز گفته میشود. به صدای 5.1، 7.1، 9.1، 22.2 و دالبی اتموس تقسیم میشود. درواقع در صداهای چند کاناله بخشهای تشکیلدهندهی صدا مثل دیالوگها، صداهای محیطی و جلوههای صوتی از یکدیگر تفکیک و از اسپیکرهای جداگانه پخش میشوند و به این صورت کاربر صدای لذتبخشی را تجربه میکند.
صدای 5.1 و صدای 7.1صدای 5.1 از ۶ اسپیکر با موقعیت و زاویهی متفاوت از یکدیگر پخش میشوند که شامل سه اسپیکر در جلو، دو اسپیکر در عقب و یک سابووفر میشود. سه اسپیکر شامل اسپیکر سمت راست، مرکز و سمت چپ میشود و دو اسپیکر عقب در سمت راست و چپ قرار میگیرند. در این سیستم بلندگوی چپ و راست جلو در زاویه ۲۲ تا ۳۰ درجه، بلندگوی میانی درست در مقابل فرد و دو اسپیکر پشتی در زاویهی ۱۳۵ تا ۱۵۰ درجه از فرد مستمع قرار میگیرند. سابووفر هم به دلیل اینکه میتواند صدای باس را در همهی جهات پخش کند، میتواند در هر مکانی قرار گیرد؛ اما توصیه میکنیم آن را در گوشه و بین دو دیوار قرار دهید؛ این موضوع درمورد سایر سیستمهای صدای فراگیر نیز صدق میکند.
چنانچه اسپیکر مرکزی در فاصلهی ۳ متری یا هر فاصلهی دیگری از صندلی شما قرار دارد، اسپیکرهای سمت چپ و راست جلو و عقب که به آنها اسپیکرهای سراند هم گفته میشود، باید همان فاصله را با صندلی داشته باشند (در سایر سیستمهای صوتی سراند نیز باید فاصلهی همهی اسپیکرها با شما یکسان باشد)؛ به همین دلیل اسپیکرهای سراند و مرکزی نباید در یک خط صاف کنار هم قرار بگیرند؛ درضمن باید زاویهی قرارگیری اسپیکرهای سراند به گونهای باشد که به زاویهدار و ضربدری در مقابل یکدیگر باشند (اسپیکر سمت راست جلو در مقابل اسپیکر سمت چپ عقب و اسپیکر سمت راست عقب در مقابل اسپیکر سمت چپ جلو قرار بگیرند).
چنانچه اسپیکرها در مکان کاملا درستی قرار بگیرند، صدای هر چهار اسپیکر درست به سمت مکانی پخش میشود که فرد نشسته است (البته خود فرد هم برای تجربهی صدای فرگیر به بهترین شکل ممکن، باید درست در نقطهی مرکزی میان اسپیکرها بنشیند).در ضمن باید اسپیکرهای سراند پشتی را به صورتی قرار دهید که ۳۰ تا ۶۰ سانتیمتر بالاتر از سطح گوش شما و سه اسپیکر جلو هم باید در سطح گوش شما قرار داشته باشند. در صدای 5.1 جلوهای صوتی، صدای موسیقی و دیالوگها از سه بلندگوی جلو و صدای محیطی فیلم که شبیه صداهای واقعی هستند از بلندگوهای عقب پخش میشوند.
در سیستمهای صوتی 7.1 دو اسپیکر اضافی در سمت چپ و راست شما قرار میگیرند که فاصلهی آنها هم باید با شما کاملا یکسان باشند و در زاویهی ۹۰ تا ۱۱۰ درجه قرار بگیرند. در این سیستم جلوههای صوتی از بلندگوهای عقب، صداهای محیطی از بلندگوهای چپ و راست، موسیقی و دیالوگها از اسپیکر میانی و جلوههای ویژه صوتی هم از دو اسپیکر سراند چپ و راست پخش میشوند.
صدای 9.1در سیستم صدای فراگیر 9.1 علاوهبر ۶ بلندگوی قبلی دو بلندگوی دیگر نیز بهصورت عمودی در بالای بلندگوهای سراند جلو قرار میگیرند که باعث میشود یک بعد دیگر به صدای سراند افزوده شود؛ این بلندگوها حداقل باید ۹۰ سانتیمتر بالاتر از اسپیکرهای سراند نصب شوند. برای کسب اطلاعات بیشتر در مورد چینش اسپیکرهای سیستم صدای فراگیر به مقالهی «راهنمای چیدمان اسپیکرها در سینمای خانگی و سیستمهای صوتی» مراجعه کنید.
نحوه تفکیک صدا در سیستم 9.1 هم مانند سیستم 7.1 است با این تفاوت که دو اسپیکر بالایی هم برای برای حداکثررساندن تأثیر جلوههای صوتی به کار گرفته میشوند.
صدای 22.2در این سیستم که به تازگی ایجاد شده و در خلق صدای سهبعدی عملکرد بسیار بهتری نسبت به سایر سیستمهای صدای فراگیر دارد، از سه ردیف اسپیکر تشکیل شده است؛ لایهی بالایی دربردارندهی ۹ اسپیکر در سمت جلو، عقب و طرفین، لایهی میانی دربردارندهی ۱۰ اسپیکر با آرایشی مشابه و لایهی زیرین متشکل از سه اسپیکر در زیر نمایشگر برای ایجاد صداهای بم و عمقدار است.
دالبی اتموس مقالهی مرتبط:در سیستم دالبی اتموس که جدیدترین فناوری صدای فراگیر محسوب میشوند نیز یک اسپیکر در مرکز، چهار بلندگو در اطراف و دو بلندگو در سقف قرار میگیرد (البته میتوانید از ترکیبهای دیگری نیز استفاده کنید). تعداد کانالها در سیستم دالبی اتموس میتواند تا ۱۲۸ کانال (و ۳۴ اسپیکر) هم افزایش پیدا کند تا افراد صدایی کاملا ۳۶۰ درجه و شگفتانگیزی را تجربه کنند. برای لذتبردن از صدای دالبی اتموس میتوانید از سیستمهای صوتی مجهز به این فناوری استفاده کنید که از میان آنها میتوان به سیستم صوتی انکیو (ONKYO) D-309H و ساندبارهای HT-ST5000 سونی یا ساندبار آمبوی سنهاهیزر (Sennheiser Ambeo Soundbar) سامسونگ HW-N950 و... اشاره کرد؛ البته ممکن است بسیاری از این سیستمهای صوتی صدای دالبی اتموس واقعی را ارائه نکنند و تنها آن را شبیهسازی کنند.
درضمن میتوانید با ارتقای سیستم صوتی دالبی فعلی خود نیز آن را تبدیل به سیستم دالبیاتمس کنید. برای انجام این کار ابتدا باید دستگاه گیرندهی فعلی خود را با دستگاهی که از بلندگوهای بیشتری پشتیبانی میکند، تعویض کنید و پس از آن با استفاده از بلندگوهایی که توانایی هدایت صدا به سمت بالا را دارند (که در اصطلاح به آنها اسپیکرهای رو به بالا میگویند) یا استفاده از بلندگوهایی که میتوان آنها را در سقف نصب کرد، سیستم خود را ارتقا دهید. ترکیب سیستم شما میتواند پنج اسپیکر سراند، چهار اسپیکر رو به بالا و یک سابووفر یا هفت اسپیکر سراند، دو اسپیکر سقفی و یک سابووفر باشد.
بحث تخصصیتر در مورد صداهای فراگیر و سایر مفاهیم بیانشده نیازمند مقالههای جداگانهای است و به دلیل اینکه این موارد موضوع اصلی مقاله حاضر نیستند، به همین میزان توضیح در مورد آنها اکتفا میکنیم.
اکنون که به قدر کافی با مفاهیم تخصصی درمورد فرمتهای صوتی آشنا شدیم، اجازه دهید مقایسهی فرمتهای صوتی متداول را شروع کنیم.
MP3 یا MPEG-1 Audio Layer 3 معرفیکمتر کسی است که با فرمت MP3 آشنا نباشد. این فرمت که همیشه متداولترین و شناختهشدهترین فرمت فایل موسیقی بوده است در سال ۱۹۹۳ ایجاد شد. MP3 با سه هدف ایجاد شد؛ اولین هدف حذف دادههای صوتی فراتر از محدودهی شنوایی انسان؛ دومین هدف کاهش کیفیت اصواتی بود که شنیدن آنها برای انسان آسان نبود و سومین هدف فشردهسازی فایلها تا حد ممکن (تا میزانی که به کیفیت آسیبی نزند) بود.
مشخصات فنی نوع فشردهسازی: Lossy بیتریت: ۳۲ تا ۳۲۰ کیلوبیت در ثانیه سمپل ریت: ۴۴٫۱ تا ۴۸ کیلوهرتز کدکها: LAME MP3 عمق بیت: ۱۶ تعداد کانالها: مونو و استریر نرخ فشردهسازی: ۱:۲۰ مزایا امکان کاهش حجم یک فایل ۳۲ مگابایتی تا ۳ مگابایت با استفاده از این فرمت پشتیبانی اکثر پلیرهای سختافزاری و نرمافزاری از آن حجم کم (یک دهم فایل Audio CD) که امکان ذخیرهسازی ۱۰۰ تا ۱۵۰ ترک موسیقی با متوسط زمان ۵ دقیقه و بیتریت ۱۹۲ کیلوبیت در ثانیه را روی سیدی با ظرفیت ۷۰۰ مگابایت و ۸۶۰ تا ۹۳۰ ترک موسیقی روی دیویدی با ظرفیت ۴ گیگابایت را فراهم میکند. قابلیت تغییر میزان فشردهسازی (کاربر میتواند مطابق میل خود و کیفیتی که مدنظر دارد، میزان فشرده سازی را تغییر دهد). اشتراکگذاری و پخش آنلاین آسان تولید آنلاین (سازندگان فایلهای موسیقی میتواند فایلهای موسیقی خود را با این فرمت بهصورت آنلاین و بدون نیاز به استودیوی ضبط ایجاد کنند و توسعه دهند). دانلود آسان فایلها تنها در عرض چند دقیقه امکان ذخیرهسازی دادههای متا همراهبا فایل (با استفاده از برچسب ID3 یا ID3 tag) و ایجاد پلیلیست اختصاصی حفظ کیفیت فایلها پس از کپیشدن هزینهی کم تولید فایلهای MP3 نیازنداشتن به سختافزار قوی برای انکد و دیکدشدن معایب برخوردارنبودن از کیفیت عالی به دلیل فشردهبودن کپی آسان که باعث رعایتنشدن حق کپیرایت و افزایش فایلهای کپی از فایلهای اصلی میشود (برخی از فایلهای کپی کاملا بیکیفیت هستند) فراهمشدن امکان نفوذ بدافزارها و ویروسها به کامپیوتر از طریق این فایلها یا سایتها و سرویسهای ارائهدهندهی آنها پشتیبانینکردن از صدای چند کاناله امکانپذیرنبودن ارائهی فایلهایی با سمپل ریت بیش از ۴۸ کیلوهرتز و عمق بیت بیش از ۱۶ بیت مقایسهی MP3 و MP2MP2 درمقایسهبا MP3 حجم بیشتری دارد و کمتر فشرده شده است. نرخ فشردهسازی ام پی تو ۶:۱ و ۸:۱ و نرخ فشردهسازی ام پی تری ۱۰:۱ و ۱۲:۱ بوده و به همین دلیل MP2 کیفیت بیشتری دارد. MP2 برای پخش پادکست، ضبط و پخش صدای گویندگان رادیویی و سایر فایلهای صوتی مورداستفاده در رادیو و انتقال فایلهای صوتی در سایر موارد استفاده میشود. از دیگر مشخصات MP2 میتوان به صدای ۱۶ بیتی، سمپل ریت ۴۴٫۱ کیلوهرتز و بیتریت ۱۹۲ کیلوبیت در ثانیه اشاره کرد.
مقایسهی MP3 و M4AM4A نیز یکی دیگر از فایلهای مشابه MP3 با لایهی صوتی MPEG 4 است که نسبت به MP4 کیفیت بهتر و حجم کمتری دارد و بیتریت آن به ۲۵۶ کیلوبیت در ثانیه هم میرسد؛ البته تبدیل MP3 به M4A اصلا ضروری نیست.
WAV یا Waveform Audio File Format معرفی مقالهی مرتبط:WAV یکی از فرمتهای رایج فایلهای موسیقی به شمار میرود که مایکروسافت و IBM آن را با مشارکت یکدیگر در سال ۱۹۹۱ ایجاد کردند؛ بسیاری از افراد تصور میکنند که WAV یک فرمت غیرفشرده است؛ اما لزوما اینچنین نیست؛ زیرا این فرمت درواقع کانتینر است و میتواند فرمتهای فشرده و غیرفشردهی مختلفی را در خود جای دهد؛ البته این کانتینر بهندرت برای فایلهای فشرده استفاده میشود. WAV یکی از فرمتهای رایج فایلهای Audio CD محسوب میشود.
مشخصات فنی نوع فشردهسازی: غیرفشرده (البته در بیشتر موارد) بیتریت: بیتریت این فرمت تا ۱۴۱۱ کیلوبیت در ثانیه یا ۱۰ مگابیت در دقیقه هم میرسد سمپل ریت: از ۴۴٫۱ کیلوهرتز تا ۱۹۲ کیلو هرتز عمق بیت: ۱۶ تا ۲۴ بیت تعداد کانالها: مونو و استریو مزایا کیفیت بسیار بالا نسبت به MP3 (بیتریت ۱۴۱۱ کیلوبیت در ثانیه و سمپل ریت ۱۹۲ کیلوهرتز میتوانند صدایی فوقالعاده باکیفیت با حجم زیاد برای افراد به ارمغان بیاورند). حفظ تمام اطلاعات فایلهای موسیقی و کاهشنیافتن کیفیت آن در صورت استفاده از این فرمت مناسب برای ضبط و ساخت موسیقی بهصورت حرفهای مناسب برای ویرایش موسیقی در زمان استفاده از نرمافزارهای ویرایش موسیقی بهدلیل سادهبودن ساختار متداولبودن (بعد از MP3 یکی از فرمتهای رایج موسیقی محسوب میشود) تفاوت کم کیفیت فایلهای دارای این فرمت با فایلهای اورجینال پشتیبانی از صدای چند کاناله پشتیبانی بدون مشکل در ویندوز و مک تاثیرکم روی پردازنده معایب حجم بالا (کیفیت بالای WAV باعث میشود حجم فایلهای دارای این فرمت به ازای هر دقیقه ۱۶٫۴۸ مگابایات باشد؛ اما حجم یک فایل ام پی تری ۵ دقیقهای با کیفیت قابلقبول ۱۲۸ کیلوبیت در ثانیه تنها ۵ یا ۶ مگابایت یا حتی کمتر است) پشتیبانینکردن پلیرهای سختافزاری قدیمی از آن دشواربودن به اشتراکگذاری و پخش آنلاین WMA یا Windows Media Audio معرفیمایکروسافت این فرمت را در سال ۱۹۹۹ ابداع کرد و از آن زمان تاکنون تغییرات زیادی پیدا کرده است. WMW با هدف رفع نواقص مربوط به فشردهسازی در فرمت MP3 ایجاد شد. مایکروسافت تاحدودی در این کار موفق شد؛ زیرا این فرمت کیفیت فشردهسازی نسبت به MP3 برتری دارد و درنتیجه از کیفیت بهتری هم برخوردار است؛ البته چون یک فرمت اختصاصی است و پلیرهای زیادی از آن پشتیبانی نمیکنند، نتوانست در رقابت با MP3 به اندازهی فایلهایی همچون WAV و AAC پیروز شود؛ البته WMA در دو فرمت استاندارد (Standard WMA) و حرفهای (Professional WMA) ایجاد شده است؛ اولین فرمت بهمنظور رقابت با MP3 و بهبود کیفیت در بیتریت پایین و دومین فرمت به منظور تقویت خود فرمت WMW در بیتریت بالاتر ایجاد شد.
مشخصات فنیفایلهای WMA دارای کدکهای متفاوتی هستند که تفاوتهای محسوسی با یکدیگر دارند. در ادامه برخی از این کدکهای متفاوت را بههمراه ویژگیهای فنی و غیرفنی آنها بیان میکنیم.
WMA 9 نوع فشردهسازی: Lossy بیتریت: ۶۴ تا ۱۹۲ کیلوبیت در ثانیه سمپل ریت: ۴۴٫۱ تا ۴۸ کیلوهرتز عمق بیت: ۱۶ بیت پشتیبانی از بیتریت متغیر قابل اجرا با نسخههای قدیمی ویندوز مدیا پلیر امکان بهرهمندی از قانون کپیرایت با استفاده از آن کیفیتی مشابه با کیفیت فایلهای Audio CD WMA 10 Professinal نوع فشردهسازی: Lossless بیتریت: ۲۴ تا ۹۶ کیلوبیت در ثانیه برای صدای استریو و ۱۲۸ تا ۲۵۶ کیلوبیت در ثانیه برای صدای 1 (البته زمانیکه برای صدای 7.1 با نرخ فشردهسازی ۲:۱ فشرده میشود، بیتریت آن به ۷۶۸ کیلوبیت در ثانیه هم میرسد) سمپل ریت: ۹۶ کیلوهرتز عمق بیت: ۲۴ بیت افتنکردن کیفیت پس از فشردهسازی پشتیبانی از صدای استریو، 5.1 و 7.1 قابلیت ادغام صدای چند کاناله در صدای دوکاناله در صورت پشتیبانینکردن پلیر سختافزاری از صدای چندکاناله WMA 9 Lossless بهترین کدک برای فشردهسازی WMA بهدلیل حفظ تمام اطلاعات و ایجاد تمام بیتهای فایل اصلی در فایل فشردهشده نرخ فشردهسازی ۲:۱ و ۳:۱ افزایش میزان حجم صدا تا ۱۲ دسیبل در صورت استفاده از ویندوز مدیا پلیر ۹ WMA 9 voice مناسب برای ایجاد فایلهای صوتی متشکل از موسیقی و صدای انسان مناسب برای ایجاد فایلهای صوتی با بیشترین میزان فشردهسازی (فایلهایی با بیتریت و سمپل ریت بسیار پایین مثل فایلهای صوتی تبلیغاتی، کتابهای صوتی، پادکستها و صدای گویندههای رادیویی و تلویزیونی) و امکان کاهش بیتریت و سمپل ریت تا ۴ کیلوبیت و ۸ کیلوهرتز در ثانیه مزایا کیفیت قابلقبول در بیتریت کم (کیفیت مناسب با اندازهی مناسب) کیفیت بهتر نسبت به MP3 (فایلهای که با کدک LAME انکد نشدهاند) در بیتریت متداول ۱۲۸ کیلوبیت در ثانیه اجرای راحت در پلیرهای مورد استفاده در ویندوز معایب پشتیبانی کمتر نسبت به MP3 کیفیت کمتر WMA Standard به فایلهای MP3 انکدشده با کدک MP3 (این کدک کدکی با بیتریت متغیر است که کیفیت چندان بالایی ندارد؛ اما فایلهای انکدشده با آن بیشترین سازگاری را دارند. متداولنبودن Professional WMA با وجود کیفیت بهتر نسبت به LAME MP3 بهدلیل پشتیبانینکردن بسیاری از پلیرها از آن AC3 معرفیAC3 یکی از فرمتهای رایج صدای فراگیر برای دیویدی و بلوری محسوب میشود که در سال ۱۹۸۷ در لابراتورهای دالبی ایجاد شد. این فرمت درحالحاضر یکی از فرمتهای رایج صدای سراند به شمار میرود؛ البته کیفیت AAC نسبت به AC3 بهتر است و در بیتریت یکسان (مخصوصا بیتریتهای پایین) کیفیت بهتری نسبت به AC3 دارد؛ بنابراین در صورتیکه پلیر جدید و قدرتمندی دارید که از AAC پشتیبانی میکند و کیفیت بهتر را به حجم کمتر ترجیح میدهید، فرمت AAC را برای صدای فراگیر انتخاب و چنانچه حجم کمتر برایتان اهمیت بیشتری دارد، از AC3 استفاده کنید. AC3 باعنوان فرمت دالبی دیجیتال (Dolby Digital) و دالبی دیجیتال پلاس (Dolby Digital Plus) هم شناخته میشود. Dolby Digital نسخهی Lossless هم دارد که به آن Dolby TrueHD گفته میشود. این فرمت میتواند صدایی با وضوح بسیار زیاد ایجاد کند.
مشخصات فنی نوع فشرده سازی: Lossy بیتریت: ۱۹۲ تا ۶۴۰ کیلوبیت در ثانیه (متوسط بیتریت این فرمت برای صدای 5.1 ۳۸۴ کیلوبیت در ثانیه است) سمپل ریت: ۸ تا ۹۶ کیلوهرتز عمق بیت: ۱۶ بیت تعداد کانال: استریو، صدای 5.1 (دالبی دیجیتال) و 7.1 (دالبی دیجیتال پلاس) مزایا پشتیبانی از این فرمت در پلیرهای نسبتا قدیمی پشتیبانی از صدای ۸ کاناله حجم کمتر نسبت به فایلهای AAC معایب بیتریت ۴۴۸ کیلوبیت در ثانیه برای صدای 5.1 (حداکثر میزان ممکن) حجم بیشتر فایل نسبت به AACمشخصات فنی Dolby True HD
نوع فشردهسازی: lossless (نرخ فشردهسازی ۲:۱) بیتریت: حداکثر ۱۸ مگابیت در ثانیه در حالت غیرفشرده و ۹ مگابیت در حالت فشرده (البته حداکثر میزان عملی درحالت غیرفشرده ۱۳ مگابیت در ثانیه است) سمپل ریت: ۹۶ تا ۱۹۲ کیلوهرتز عمق بیت: ۲۴ بیت تعداد کانال: امکان پشتیبانی از ۱۴ کانال را دارد؛ اما برای ایجاد صدای 5.1 کاناله و 7.1 استفاده میشود. AAC یا Advanced Audio Coding معرفیAAC در سال ۱۹۹۷ پس از MP3 معرفی شد و با اینکه به فرمتی متداول تبدیل شد و درحالحاضر یکی از فرمتهای رایج برای صدای فیلمها محسوب میشود، هرگز نتوانست جای MP3 را بگیرد. الگوریتم مورداستفاده برای فشردهسازی فایلهای AAC پیشرفتهتر و تکنیکیتر از الگوریتم مورداستفاده برای فایلهای MP3 است و به همین دلیل در بیتریت یکسان کیفیت بهتری نسبت به فایلهای MP3 دارد؛ البته کیفیت این فایلها اصلا به اندازهی فایلهای Audio CD، فایل WAV و فایلهای WMW انکدشده با کدک WMA 10 Professinal نیست.
اگرچه MP3 فرمت رایجتر و محبوبتری بهشمارمیرود، AAC به میزان بیشتری استفاده میشود و فرمت استاندارد برای فشردهسازی و پخش فایلهای صوتی در اندروید، iOS، iTunes، یوتیوب و کنسولهای نینتندو و پلیاستیشن به شمار میرود.
کیفیت AAC برای صدای فراگیر اصلا بهاندازهی DTS نیست
فایلهای AAC معمولا با دو کدک Faac و Lav انکد میشود. کدک Lav با بیتریتی درحدود ۲۵۶ کیلوبیت در ثانیه کیفیت بهتری نسبت به کدک Faac با بیتریت ۱۹۲ کیلوبیت دارد؛ البته باتوجه به اینکه فرمت AAC برای ایجاد صدای چند کاناله استفاده میشود. هر دو کدک به نسبت فرمت DTS (در ادامه در مورد این فرمت توضیح میدهیم) کیفیت مطلوبی را ارائه نمیدهند؛ البته بیتریت برخی از فایلهای AAC با بیتریت ثابت به ۵۱۲ کیلوبیت در ثانیه هم میرسد که کیفیت نسبتا مناسبی محسوب میشود؛ اما حتی کیفیت همین بیتریت هم یک سوم بیتریتی است که فرمت DTS ارائه میدهد. نکتهی دیگری که باید در زمان استفاده از این دو کدک به آن توجه کنیم، پشتیبانی پلیر موردنظرمان از آنها است.
فایلهای AAC به دو دستهی HE و LC تقسیم میشوند. فایلهای HE با استفاده از استاندارد MPEG 4 فشرده میشوند و فرمت LC برای ایجاد و پخش فایلهایی با بیتریت کم مثل فایلهای صوتی که آنلاین پخش میشوند، مورد استفاده قرار میگیرد.
مشخصات فنی نوع فشردهسازی: Lossless (و Lossy در برخی از موارد) بیتریت: ۶۴ تا ۵۱۲ کیلوبیت در ثانیه (بیتریت متداول ۱۲۸، ۱۹۲ و ۲۵۶ کیلوبیت در ثانیه است) سمپل ریت: ۸ تا ۹۶ کیلوهرتز عمق بیت: ۱۶ تا ۲۴ بیت مزایا کیفیت بهتر و شفافیت و حجم بیشتر صدا نسبت به MP3 کیفیت بالا (حتی با نرخ فشردهسازی ۱۰:۱) پخش سریع فایلها (زمان دیکدشدن این فرمت کمتر از نیم ثانیه است) قابلیت انکدشدن با سطوح کیفی مختلف پشتیبانی اکثر پلیرهای جدید از این فرمت حجم کمتر نسبت به MP3 نیازنداشتن به پهنای باند زیاد برای پخش آنلاین و مصرف کمحجم اینترنت در زمان پخش فایلهای دارای این فرمت پشتیبانی از بیتریت متغیر پشتیبانی از صدای استریو و چند کاناله (پشتیبانی تا ۴۸ کانال!) معایب درگیرشدن پردازنده بهمیزان محسوس در زمان پخش فایل طولانیبودن فرایند تبدیل سایر فرمتها به این فرمت (بهعنوان مثال تبدیل یک فایل WAV استریوی چهار دقیقهای به AAC ده ثانیه طول میکشد) درگیری کامل (۱۰۰ درصد) پردازنده در زمان تبدیل سایر فرمتها به این فرمت حذف برخی از اطلاعات فایل اصلی در زمان فشردهسازی (البته تنها در صورتی متوجه حذف این اطلاعات میشوید که هر دو فایل فشردهشده و اصلی را با کارت صوت و هدفون حرفهای پخش و گوش کنید) پشتیبانینکردن برخی از پلیرهای قدیمی از این فرمت محسوسنبودن کیفیت بالاتر پس از افزایش بیتریت (البته کیفیت فایلهای در بیتریت ۱۹۲ کیلوبیت در ثانیه یا کمتر، واقعا خوب است) درست نمایشدادهنشدن دادههای متا در برخی از پلیرها انکدشدن با پسوندهای مختلف ازجمله .aac و .m4a که میتواند پشتیبانی و پخش این فرمت را دچار مشکل کند. OGG معرفیOGG نه مخفف یک عبارت است و نه فرمت صوتی محسوب میشود؛ درواقع میتوان OGG را کانتینری دانست که میتواند هر نوع فرمت فشرده را در خود جای دهد. متداولترین فایل مورداستفاده در فایلهای OGG فایل صوتی Vorbis است؛ به همین دلیل معمولا OGG را معمولا با نام OGG Vorbis میشناسند.
OGG در سال ۲۰۰۰ برای نخستین بار عرضه شد و به دو دلیل توانست به کانتینر محبوبی تبدیل شود؛ نخست اینکه برپایهی اصول فرمتهای متنباز ایجاد شد و دوم اینکه از نظر کیفیت به نسبت حجم نسبت به بسیاری از فرمتهای lossy دیگر عملکرد بهتری دارد یا به عبارت دیگر، در حجم کمتر کیفیت بهتری نسبت به آنها دارد.
OGG با اینکه در ابتدای پیدایش خود باید با رقبای سرسختی نظیر MP3 و AA3 رقابت میکرد و بسیاری از پلیرها هم از آن پشتیبانی نمیکردند (درحالحاضر نیز تاحدودی اینچنین است)؛ اما با گذشت زمان توانست جایگاه خوبی پیدا کند و اکنون به یکی از کانتینرهای محبوب برای علاقهمندان به فرمتهای متنباز تبدیل شده است.
مشخصاتنوع فشردهسازی: Lossy
بیتریت: ۳۲ تا ۵۰۰ کیلوبیت در ثانیه
سمپل ریت: ۸ تا ۱۹۲ کیلوهرتز
عمق بیت: ۸ تا ۱۶ بیت
تعداد کانال: صدای چند کاناله: ۲۵۵ کانال
مزایا کیفیت بهتر نسبت به سایر فرمتها در بیتریت یکسان تفاوتنداشتن کیفیت با فایل اصلی با حجمی به اندازهی ۱۰ تا ۲۰ درصد فایل اصلی متنباز و رایگانبودن امکان سفارشیسازی فهرست دادههای متا ترکیبکردن صدای کانالهای چپ و راست در صدای استریو برای کاهش حجم فایل امکان کاهش بیتریت فایل فشردهشده نسبت به فایل اصلی بدون کاهش کیفیت امکان پخش آنلاین معایب کاهش شدید کیفیت سایر فایلهای lossy در هنگام تبدیلشدن به این فرمت محبوبیت کمتر نسبت به سایر فرمتها پشتیبانینکردن برخی از پلیرهای قدیمی از آن FLAC یا Free Lossless Audio Codec معرفی مقالهی مرتبط:FLAC یکی از بهترین فرمتها برای پخش موسیقی محسوب میشود و کیفیت آن درست به اندازهی فایل اصلی است. FLAC فرمتی فشرده به شمار میرود؛ اما در فرایند فشردهسازی آن تمام اط?