Скорее читай!

Разобраться в цифровых аудиоформатах совсем не просто. Сделать однозначный вывод, в каком именно формате лучше слушать музыку, и того сложнее. Если посмотреть сравнительную таблицу аудиоформатов в «Википедии», в глазах начнёт рябить от столбиков молчаливых цифр. Попробуем разобраться, что за этим стоит.

Cразу оговоримся, что статья говорит ТОЛЬКО об общих характеристиках и не будет включать в себя некоторые подробности. В будущем Лайфхакер проведёт собственное беспристрастное исследование. А сегодня попробуем обобщить уже так или иначе известный опыт.

Есть аналог и цифра.

Аналог — хорошо, но недолговечно и неудобно. Поэтому аналоговые носители, несмотря на высокие продажи винила, не вернутся.

Аудиоцифра может быть трёх основных типов:

в формате, не использующем сжатие
в формате, использующем сжатие без потерь (lossless)
в формате, использующем сжатие с потерями (lossy)

На первый взгляд, более перспективны форматы, использующие сжатие без потерь. Это не всегда так, о чём мы подробнее расскажем в одном из следующих материалов. Форматы без сжатия не имеют какого-либо смысла, кроме хранения мастер-записей, необходимых при создании аудиоконтента. Они легче поддаются восстановлению. Для хранения и прослушивания домашних записей излишни.

Из множества параметров цифрового аудио пользователя в первую очередь должны волновать частота дискретизации (точность оцифровки аналогового сигнала по времени), разрядность (точность оцифровки по амплитуде — громкости), битрейт (количество содержащейся в файле информации в пересчёте на секунду).

Сегодня поговорим о lossy.

Для сжатого звука очень важно понятие психоакустической модели — представления учёных и инженеров о том, как человек воспринимает звук. Ухо воспринимает весь спектр поступающих на него акустических волн. Однако обрабатывает сигналы мозг.

"Справочная величина слышимого человеком диапазона составляет от 16 Гц до 20 кГц, но одновременно слышать и осознавать все поступающие звуки он не способен".

Слух дискретен, и его звуковая восприимчивость нелинейна.

Современные психоакустические модели достаточно точно оценивают человеческий слух и постоянно улучшаются. На деле, несмотря на заверения любителей музыки, музыкантов и аудиофилов, для среднестатистического нетренированного слуха первоначальный вид MP3 в максимальном качестве стал предельно воспринимаемым. Исключения есть, их не может не быть. Но они не всегда легко заметны при слепом прослушивании.

Форматы, использующие психоакустические модели сжатия
Таких форматов для сжатия аудио с потерями довольно много. Наиболее распространены сегодня следующие.

OGG (Vorbis)
Вообще, файл с расширением *.ogg является «контейнером»: внутри могут находиться несколько звуковых записей с собственными тегами и характеристиками. Чаще всего хранимые в нём файлы сжимаются кодеком Ogg Vorbis, хотя могут использоваться и другие, в том числе MP3 или FLAC.

В качестве его основных преимуществ стоит назвать большой диапазон возможных параметров при кодировании: частота дискретизации звука может достигать 192 кГц, разрядность — 32 бит. По умолчанию OGG использует переменный битрейт (хотя при отображении свойств это не указывается), который может достигать 1 000 кбит/с.

MP3
В отличие от свободного OGG, MP3 разработан очень важным для современной акустики Обществом Фраунгофера — объединением институтов прикладных исследований Германии. В среде аудиофилов, кстати, это крайне уважаемая контора, правда, признаваться они в этом не любят. Но за их разработками пристально следят.

В отличие от OGG, может обладать как переменным (VBR), так и постоянным битрейтом (CBR). Кстати, именно благодаря MP3 обнаружилось, что не всякая запись может быть качественно кодирована с переменным битрейтом (причины смотрите выше, алгоритмы кодирования и их результаты в данном случае могут быть различны при кодировании одного и того же источника).

Ввиду преклонного возраста MP3 имеет значительные ограничения: разрядность может быть 16–24 бита, частота дискретизации выражается только в дискретных значениях (8, 11,025, 12, 16, 22,05, 24, 32, 44,1, 48), битрейт ограничен 320 кбит/с. К тому же в обычной версии MP3 число каналов ограничено двумя.

AAC
Те же грабли, только в профиль. Тоже разработка Общества Фраунгофера. Более поздняя и использует другую психоакустическую модель, более современную. Общедоступная информация позволяет сделать вывод: да, им удалось улучшить собственное творение.

Даже если опираться на самые простые цифры, AAC — более гибкий формат. Разрядность файлов, полученных при помощи этой разработки, составляет от 16 до 24, частота дискретизации тоже при желании позволит не потерять звуковой картины и лежит в диапазоне 8–192 кГц. Поток данных вообще приближается к таковым у lossless-форматов (до 512 кбит/с), при том что максимальное число каналов AAC-файлов достигает 48.

#musacademy_сми
  • Просмотров: 279

Комментарии (0) :

Нет добавленных комментариев...

Добавить комментарий:

NETDO.RU

Лучший конструктор сайтов