03 января 2021      2419    

Lossy — альтернатива MP3

Lossy - альтернатива MP3

Казалось бы, ещё несколько лет назад доминирование MP3 в сфере музыкальных форматов было очевидно. Однако на сегодня (согласно исследованию 2019 года) это уже не так. Правда, в соответствующем исследовании речь идёт не только о самостоятельных звуковых форматах, но и о форматах сжатия звука в видео, но картина всё равно показательна. На вопрос «какие аудиокодеки вы используете» 88 % респондентов ответило AAC, MP3 – 49 %. 8 и 7 % пришлось на OPUS и VORBIS (OGG) соответственно. Это чуть больше, чем доля самого популярного формата без потерь качества — FLAC (им пользуется 6 % респондентов).

AAC

Как мы видели выше, этот кодек вышел на первое место по распространённости. Его используют, к примеру, такие популярные платформы, как Apple Music и YouTube. Люди слушаю музыку на Apple Music, смотрят видео на YouTube – и всё это AAC. Более того: автор этих строк буквально на днях испробовал бесплатную версию потокового сервиса классической музыки IDAGIO, и как вы думаете, в каком формате поступает музыка (а также реклама платной версии) пользователю бесплатной версии? Всё в том же AAC. Кстати, если увидите файл с расширением .m4a, то знайте: под этим расширением также «спрятан» ACC.

Формату помогло в продвижении то, что он изначально создавался как улучшенный преемник MP3, поэтому был включён в семейство форматов MPEG, то есть стал частью стандарта. К созданию формата приложили руку уже знакомые нам лаборатории Белла, Институт Фраунгофера, а также компании SONY и Nokia. Сама аббревиатура AAC расшифровывается как Addvanced Audio Coding, то есть Продвинутое Кодирование Аудио. В чём же состоит эта продвинутость?

Во-первых, это лучшее соотношение размера файла и его качества (правда, тут есть нюансы, потому что есть несколько альтернативных вариантов кодека от разных компаний). В формате используется улучшенный алгоритм преобразования сигнала при кодировании, ставший после все улучшений ещё более эффективным. Введены новые функции коррекции ошибок кодирования. Формат ведёт себя совершенно по-разному в зависимости от того, какую цель ему поставить при кодировании, комбинируя разные алгоритмы. Иными словами, AAC AAC рознь, а возможности тонкой подстройки формата гораздо выше, чем в MP3 (чем активно пользуются крупные музыкальные серверы, предлагая слушателям файлы, конвертированные с оптимальными для того или иного жанра параметрами). Также может меняться длина кодируемого блока информации.

При сравнении форматов AAC и MP3 можно заметить и следующее: стало больше поддерживаемых частот дискретизации (от 8 до 96 кГц), а также каналов звука (до 48).

OGG

Формат ogg Vorbis – один из давних, но всё ещё актуальных конкурентов MP3. Среди его новшеств по сравнению с MP3 – представление стереозвука в виде суммы «центрального» и «периферийного» каналов (а не правого и левого), возможность большего числа каналов, более гибкие настройки степени сжатия и частоты дискретизации). Наконец, это более продвинутая модель самого сжатия, серьёзно отличающаяся от алгоритма MP3 (и дающая более чистый звук практически на всех битрейтах).

Всё это оттеняется несколькими минусами. Первый – это «тяжесть» и нерасторопность самого кодека. Компьютеру надо хорошо и крепко «подумать», чтобы пересчитать звук в OGG. Значит, для потоковой передачи аудио формат OGG не подходит. Всевозможные популярные музыкальные серверы обходят этот формат стороной, c AAC он конкурировать здесь не в состоянии.

Если файл слушать не в режиме реального времени – тогда пожалуйста. Однако и раскодировка сигнала нагружает процессор сильнее, чем в случае MP3. Для компьютера это пустяки, а вот для портативных плееров может быть чревато несколько более быстрой разрядкой аккумулятора.

Файл, кодированный в OGG с максимальным качеством, «весит» уже почти столько же, сколько FLAC. В этом нет большого смысла: уж лучше воспользоваться форматом без потери данных. Поэтому обычно OGG используют не на «максимальных» настройках. Но и здесь формат может преподнести сюрприз: битрейт у него переменный «по умолчанию», поэтому, сжимая музыку на качестве, примерно соответствующем битрейту 320 кбит/с, нельзя исключать возможность среднего итогового битрейта порядка 280 или 380.

Ещё один недостаток – это не такая массовая поддержка, как у MP3. Такова цена свободы и независимости формата, хотя для независимого формата OGG добился впечатляющего успеха.

OPUS

Скорее всего, вы уже встречались с этим форматом, хотя, вполне возможно, и не подозревали об этом. Если вы когда-нибудь играли в PlayStation 4 или даже попросту сталкивались с голосовыми сообщениями во вконтакте или в вотсапе, вы имели дело именно с opus. А вы когда-нибудь задумывались, сколько весят те же голосовые сообщения? Так вот: весят они очень мало (битрейт зачастую меньше 20 кбит/с), при этом звучат для такого сверхсильного сжатия очень неплохо.

Изначально формат и создавался под нужды голосовой связи: чтобы данные очень быстро кодировались, передавались по сети и при этом занимали мало места. Занимались этой проблемой специалисты из Skype, и плодом их изысканий стал аудиокодек под названием SILK. Авторы кодека opus взяли всё лучшее из этой разработкой и дополнили продвинутым психоакустичеким алгоритмом кодека CELT, позволявшим кодировать не только голос, но и музыку. После существенной переработки обоих исходных кодеков и получился OPUS. Доработанные CELT и SILK внутри OPUSа ведут себя по-разному в зависимости от того, какой тип кодирования файла задан изначально: голосовой или музыкальный. Как несложно догадаться, музыка кодируется в основном алгоритмами CELT.

Если говорить именно о кодировании музыки, то формат показывает себя очень достойно, особенно на сравнительно небольших битрейтах (128-196 кбит/c). На них он выдаёт качество существенно выше, чем у конкурентов. Потягаться здесь с ним может, пожалуй, лишь ogg Vorbis, но и тот с существенным «но»: транзиенты opus умеет кодировать даже не столько точнее, сколько естественней для человеческого слуха, без пресловутого эффекта «обратного эха». Это, на самом деле, прорыв в технологии, потому что именно транзиенты долгое время были головной болью форматов сжатия музыки с потерями.

Менее точно кодирует OPUS басы, что для массового слушателя также вполне приемлемо: откровенно говоря, большинство акустических систем точностью баса и так не блещет. Зато точнее всего кодируются частоты, лучше всего слышимые человеческим ухом.

И, наконец, главная фишка формата — это его универсальность. Им можно закодировать голосовое сообщение, аудиокнигу, музыкальный альбом… Кроме того, он изначально хорошо приспособлен для потоковой передачи — что особенно актуальным оказалось в 2020 году. Я не знаю статистики по использованию аудиокодеков за этот год, но почти наверняка opus стали использовать гораздо более массово, поскольку формат позволяет реализовывать дистанционно даже самые смелые аудиопроекты.

WMA

Наш разговор о конкурентах MP3 был бы неполным, если бы мы не упомянули ещё об одном формате, потихоньку уходящем в историю, но сыгравший некогда в ней не последнюю роль. Это Windows Media Audio (WMA) от Microsoft. По замыслу своих создателей кодек должен был составить качественную конкуренцию и MP3, и даже несжатому звуку. Однако действительные возможности формата оказались значительно скромнее разрекламированных, что породило довольно стойкое неприязненное к нему отношение. Проще говоря, формат обманул ожидания слушателей.

Однако это ещё не означает, что формат плох сам по себе. Действительно, WMA так и не стал форматом, обеспечивающим качество, близкое к CD, даже при не самом маленьком битрейте. Однако его по-прежнему поддерживает большое количество устройств, а результаты его применения звучат чуть качественнее, чем MP3. И если ваше устройство поддерживает только эти форматы (такое особенно может случиться на старых устройствах), то имеет смысл присмотреться к детищу Mircosoft.

Нельзя не упомянуть об одной характернейшей особенности, присущей именно алгоритму обработки звука WMA. Это, если можно так выразиться, «избирательное шумоподавление». Создатели формата рассудили, что нет никакого смысла сохранять в записи информацию, похожую на шум, если этот шум сильно тише основного сигнала. Иными словами, в тихих местах записи кодировщик оставляет шум почти нетронутым (чтобы шумоподавление не сказалось на тихом и чувствительном к любому вмешательству полезном сигнале), но как только уровень записи становится громче, WMA начинает вычищать всё больше шума на высоких частотах. Причём чем громче сигнал – тем более низкие частоты шумоподавитель «вычищает». И действительно: зачем тратить лишнее место, кодируя и так почти не слышный шум? Всё это хорошо, но за одним исключением: если Вы переведёте в WMA уж очень сильно шумящий файл (например, оцифровку с подразмагниченной аудиокассеты), то переход между «тихой» шумящей и «громкой» частью без шума будет заметен на слух.

Кодек WMA предусматривает улучшенные «профессиональный» и «lossless» режимы, но большого распространения они так и не получили.

© 2024 CanoraSound · Копирование материалов сайта без разрешения запрещено
Политика конфиденциальности I Публичная оферта I Sitemap