Бит против килогерца: что важнее?

Бит против килогерца: что важнее?

Размышления об успехе 12-битной драм-машины E-Mu SP-1200 и довольно узкая динамика поп/рок-репертуара зародил еретические мысли. Оптимальны ли характеристики наших цифровых протоколов?

Любители студийного мастер-звука могут сердиться сколько угодно, но факт остается фактом. Формат Red Book при немыслимом для цифровых технологий возрасте 35 лет все еще остается основным контейнером для коммерческих фонограмм. Даже если вы слушаете ощипанный трек в MP3 или iTunes, его пропорции описаны в тех же 16 битах на опорные 44,1 кГц дискретизации. Много это или мало? Смотря что мерить.

Компакт-диск или файл в аналогичном формате в состоянии обеспечить 16 х 6 = 96 дБ между самым тихим и громким пассажем. Это очень даже немало. Техническим сигналом для лабораторных испытаний можно заставить ЦАП выдать такой показатель, но я не знаю реальных музыкальных событий с подобным размахом. Даже тот самый «1812» с пушечкой — там 60 дБ в самых пиковых моментах и чуть больше 20 дБ в среднем. В современной фонограмме показатели динамического диапазона сужены обычно раза в три.

По преданиям, Philips сначала хотела остановиться на 14-битном разрешении; умножаем 14 на 6 = 84 дБ, это по-прежнему выше уровня рокота самых дорогих виниловых трактов. Первое поколение ЦАПов Philips TDA1540 оперировало именно с 14 бит и ничего, многие винтажисты очень довольны этим чипом по сей день.

Первое поколение CD-плееров использовало 14-битный ЦАП Philips TDA1540

В общем, CD-качества вроде бы хватает с головой для самых смелых аудиозадач. И все-таки, когда сравниваешь мастер в Hi-Res и полученный из него стандартный Red Book CD, кажется, что-то утеряно. Где-то больше, где-то не очень — зависит от контента. Но и не забывайте, что ресемплинг и понижение битности понижается различными алгоритмами, так что итоговое качество для CD-печати получается гадательным.

Мой личный опыт возни с записью, редактированием и воспроизведением цифрового аудио по большому счету имеет две точки мнительности. Первая выглядит вполне технически обоснованной.

Мне категорически не нравится, что на аудиопотоке с дискретностью 44,1 кГц граничная частота лежит слишком низко, в области 20 кГц. Вроде бы там особо и не должно быть слышно, но как показывают графики работы цифровой фильтрации ЦАПа, в окрестностях творится черт знает что. Жесткий срез спектра записи, хотя в жизни имеет место пологое падение. Или наоборот, ранний завал из-за специфики фильтра. А еще какие-то паразитные гармоники на высоких частотах. Удельный вес относительно общего сигнала у них не очень большой, но все равно картинка получается неприглядная. Все вот эти оверсемплинги требуются из-за невозможности установить на 22,05 кГц нормальный аналоговый фильтр.

Было бы прекрасно, если бы в начале 80-х стандартом оставили дискретизацию 50 кГц первых цифровых рекордеров Soundstream. А еще лучше, если бы она составила примерно 60 кГц. Таким образом, мы бы получили достаточно протяженную АЧХ, обеспечивающую плавный спад всех музыкальных штрихов и нюансов до 30 кГц, как в хорошем магнитофоне или SACD. Вот выше уже действительно ничего нет. Но в итоге получилось по-другому.

До анонса компакт-диска цифровые рекордеры Soundstream записывали звук с параметрами 16 бит / 50 кГц

Sony выбрала значение 44,1 кГц из-за совместимости со стандартом PAL. Профессиональные видеомагнитофоны Betacam и VHS позволяли делать запись PCM-кода аудио. Три значения укладывались в каждую из 588 строк видеосигнала PAL, передаваемого с частотой 25 кадров в секунду: 3 х 588 х 25 = 44100. Вот такая арифметика.

Видеомагнитофон Sony с помощью процессора PCM-F1 мог записывать цифровой аудиокод

Дальнейшее развитие цифровых технологий записи и воспроизведения использовало кратное умножение базовых форматов CD и DAT — 44,1 и 48 кГц: т.е. 88,2, 96 кГц и так далее. Конечно, появилась возможность отодвинуть помехи квантования подальше в ультразвук, но ведь и кратно росли размеры аудиофайлов. А еще прибавка в полтора раза при переходе с 16 на 24 бит. А если это будет 32 бит? И при попытке сделать этот огромный аудиомассив чуть меньше меня добивает вторая мнительность.

Казалось бы, разрешение 24 бит и выше подразумевает выборку далеко за пределами человеческого слуха. Шутка ли, 24 х 6: нет такой ни техники, ни фонограмм, чтобы они плясали в диапазоне 144 дБ. Для того 24 бит и затевались в студиях — вынести любые ошибки наложения при редактуре куда подальше. Но стоит подвергнуть такой файл децимации, даже просто ресемплингу из 192 в 96 кГц, и что-то неуловимо меняется. Чуть другие уровни, чуть более плоский и тупой саунд, который мне не очень нравится в сравнении. Поэтому я выбираю оригинальные хайрезы не за абстрактную частотку, а лишь за отсутствие шрамов, которыми обрастает мастер-файл по пути вниз. Попытаемся оценить эти увечья.

Для экспериментов был выбран питомец лейбла 2L, который предлагает некоторые свои DXD-записи для свободного скачивания. Надо сказать, репертуар, как это бывает у аудиофильских контор, довольно тягостный и медлительный. Но, к счастью, там нашлась и выручила «Детская увертюра» Эжена Бозза. Эта фонограмма довольно энергично брякает, чтобы судить об изменении саунда при трансформации мастер-файла.

Изначально 5 с половиной минут DXD-оригинала «Детской увертюры» с характеристиками 24 бит / 352,8 кГц занимает целых 437 мегабайт. И это еще сжатое во FLAC, практически размер целого CD! На чем будем экономить?

На заре цифрового звука еще не существовало эффективных моделей борьбы с ошибками квантования. Да и вычислительным мощностям процессоров было многое не под силу. Шкворчание 8-битного саунда первых компьютерных игр стало стереотипом на долгие поколения вперед, но сейчас вы сами убедитесь, что 8 бит сегодня может играть вполне прилично. Чудодейственной панацеей стал так называемый дизеринг (dither), а если еще точнее — его разновидность, нойз-шейпинг (noise shaping).

В весьма толковой статье разработчика iZotope Алексея Лукина дается наглядный пример, как подмешивание горстки шума выручает картинку при снижении разрешения до 4 бит с 16-ю градациями яркости. Просто чудо, когда видишь, как ошибки квантования (так называемая постеризация изображения) практически сходят на нет. То же самое происходит и со звуком.

В отличие от общего случая дизеринга, нойз-шейпинг генерируется не во всей полосе полос, а лишь на высокочастотной области, что менее заметно на слух. Рассуждения о заметности схожи с помыслами разработчиков MP3-алгоритма, с той лишь разницей, что эти в частотный диапазон добавляют, а не режут. Нойз-шейпинг позволяет увеличить динамический диапазон фонограммы, от души его применяют в DSD кодировании и также видны следы его работы при записи «Детской увертюры».

Итак, с помощью ресемплера и фирменного нойз-шейпинга iZotope MBIT+ был сгенерирован целый ворох «Детских увертюр». Получилась стопочка FLAC-ов с разрядностью 8, 12, 16, 20 и 24 бит на кратной дискретизации 44,1 или 88,2 кГц. Также не обошлось без пары образцов МР3 битрейтом 320 кб/с. Один был опрокинут из файла 24 бит / 88,2 кГц, другой из 16 бит / 44,1 кГц, которые также представлены в этом списке. Архив можно скачать и самостоятельно решить, кому что нравится.

Понятное дело, четче и лучше всех отыграла самая полная версия 24/88, практически неотличимо от оригинала. Я надеялся, что понижение до 20 бит не скажется на качестве, но не тут-то было. Значит, начнем двигаться с другой стороны списка.

Сортировка в папке по размеру показала, что самым маленьким оказался образец 8 бит / 44,1 кГц. Менее 12 мегабайт после 400! Несмотря на слышимый шумок, звучит он весьма задорно и это не иллюзия — после всей математики уровень фонограммы немного подрос. Следующими по объему ожидаемо шли МР3. Не знаю как вам, но мне из всего набора проверять их было скучнее всего. И это при том, что в паузе у таких файлов было все чисто и аккуратно. Ну не мое, и все тут. Скомканный серый звук без огонька. Приятнее слушать пусть шумноватый, но лосслесс с низкой битностью, напоминает кассету. Вот на них и выруливаем дальше.

В полтора раза больше чем МР3 оказалась пара образцов на 12 бит / 44,1 кГц и 8 бит / 88,2 кГц. Размер — 19,7 и 23,5 Мб соответственно. По сравнению с базовым CD-разрешением (28,5 Мб) дополнительный шум заметен разве что в 8-битном треке, да и то в наушниках. Я не смог отдать однозначное предпочтение какой-то одной версии.

Субъективно файл более высокой битности играет быстрее, напористей, особенно это касается 24 бит / 44,1 кГц. Но и у 8- и 12-битного аудио на более высокой частоте дискретизации 88,2 кГц имеются несомненные плюсы. Более «гибкие» послезвучия, глубже строится сцена в отсутствие цифрового фильтра в слышимой области. Вы также можете сгруппировать треки по размерам и сравнить их самостоятельно.

По коэффициенту качество/размер я бы выделил следующую тройку, и вся она, увы, опирается на повышенную частоту дискретизации 88,2 кГц:

• 12 бит / 88,2 кГц (13-кратное уменьшение оригинала)

• 8 бит / 88,2 кГц (18,5-кратное уменьшение оригинала)

• 16 бит / 88,2 кГц (10-кратное уменьшение оригинала)

Подытоживая этот обзор, если можно было перезапустить всю цифровую индустрию заново, я бы предпочел использовать следующую градацию PCM-протоколов:

• Частота дискретизации 60 кГц в качестве индустриального стандарта

• Частота дискретизации 120 кГц для ответственных High-End задач

• Длина разряда в 10 бит для потокового аудио (10 бит / 60 кГц)

• Длина разряда в 14 бит для стандартной дистрибуции музыки (14 бит / 60 кГц)

• 22 бит для студийной работы и аудиофильских изданий музыки (22 бит / 60 кГц или 22 бит / 120 кГц)

76.23 дБ +

Комментарии

#

Вот-вот...

И из статьи, которую я постоянно привожу в пример:

CONCLUSIONS
This article has reviewed the issues surrounding the transmission of high-resolution digital audio. It is suggested that a channel that attains audible transparency will be equivalent to a PCM channel that uses:
• 58kHz sampling rate, and
• 14-bit representation with appropriate noise shaping, or
• 20-bit representation in a flat noise floor, i.e. a ‘rectangular’ channel
This conclusion has the following obvious implications:
• The CD channel with 44.1kHz 16-bit coding (even with noise shaping to extend the resolution) is inadequate
• Even 48kHz sampling is not quite high enough
• Sampling at 88.2kHz or 96kHz is too high, and therefore wasteful of data
• The use of sampling rates above 96kHz to convey a wider audio bandwidth cannot currently be justified


- 53.01 дБ +
⇡ в ответ @zome_bear #

я сначала тоже ориентировался на 20 бит, но потом все-таки решил дать headroom +2 бит

- 61.46 дБ +
⇡ в ответ @YG #

Там 20 bit предлагается (-лось) не совсем "простых".

Кстати, это статья 1995 года, если я не ошибаюсь.

И речь там про именно предлагаемый потребителю уже продукт - в результате они сделали MQA ;-)

А лично я за поток "без шаманства" для своего личного пользования.

- 50 дБ +
⇡ в ответ @zome_bear #

а вы сравнивали эти файлы детской увертюры?

я конечно рассчитывал, что народ тоже поделится своими соображениями от сравнения

- 50 дБ +
⇡ в ответ @YG #

Ещё пока нет физической возможности послушать, но уже перенёс себе их на облако.

P.S.

Я тут себе к Benchmark ADC1 добавил Lynx Hilo TB, так и доберусь как-нибудь до рассмотрения картинки на выходе ЦАП-ов...

- 50 дБ +
⇡ в ответ @zome_bear #

Отслушал всё, кроме 8 bit, Amarra или Duet не шмАгли...

Для меня 24-битные варианты на первый взгляд (надо будет ещё раз в разной последовательности) предпочтительнее, то есть лучше понижение частоты сэмплирования, чем разрядности.

Между всеми образцами разница заметная и... я не ожидал, что будет такая разница между исходником и остальными, несмотря на то, что Amarra делала его SRC до 88.2, у Duet максимум 96 кГц...

upd.

Не, 20/88 предпочтительнее, чем 24/44,1, примерно так же и между остальными.


Попозже повторю на Hugo.

- 50 дБ +
⇡ в ответ @zome_bear #

24/44 какойто пустой как барабан

плоский звук на 44,1

- 50 дБ +
⇡ в ответ @YG #

А 16/44.1 вообще ужас, угу...

Зная разницу с тем, что было изначально, становится неприятно как минимум, но привыкаешь...

P.S.

Пришла в голову хорошая мысль, слушал я на дельта-сигме, действительно надо проверить эту разницу на r2r и альтернативе в виде Chord.

Проверю.

- 50 дБ +
⇡ в ответ @zome_bear #

но данный трек конечно синтетический случай, чтобы было видно ступени

обычно в 24/44 все и мастырится

- 50 дБ +
⇡ в ответ @YG #
но данный трек конечно синтетический случай, чтобы было видно ступени

Что лично для меня делает этот набор файлов чертовски интересным )

По теореме Котельникова (или как там) постулируется полное восстановление информации, то есть как минимум мы, в пределах слышимого диапазона, не должны различать по идее варианты с одной битностью, но частотами сэмплирования 44.1 и 88.2, а отличия явно слышны и не в той области, где должен бы фильтр сказываться. Хотя... если вспомнить снова ту старую статью, всё вылезает именно в области самой большой чувствительности слуха.

Поэтому мне очень интересно, чья это "заслуга" в большей степени.

Начинаю наглядно понимать необходимость передискретизации внутри ЦАП-ов )

Частенько возвращаюсь к старшему NAIM, а там:

The filter over-samples by 16 times on 44.1kHz data and provides stop-band attenuation of 180dB on all data.


- 50 дБ +
⇡ в ответ @zome_bear #

я начинал с сд-плееров с 4-х кратной передискретизацией и мне тогда цифровой звук понравился после пленки и пластинок


Недавно послушал именно такого старичка с 4х - приятно же играет. Более неряшливый и грязоватый саунд и маленькая сцена по сравнению с нынешней лабораторной стерильностью, но определенно ряд фонограмм лучше слушать через него.

- 50 дБ +
⇡ в ответ @YG #

> я начинал с сд-плееров с 4-х кратной передискретизацией и мне тогда цифровой звук понравился после пленки и пластинок

Я пользовал даже Вега-122 ))

> Недавно послушал именно такого старичка...

М-м-м...

У меня где-то на полке Pioneer какой-то лежит, а и правда, интересно.

О!!!

Нашёл там Marantz ещё - 63-й, да ещё Ken Ishivata Signature, made in England )))

- 50 дБ +
⇡ в ответ @zome_bear #

вот-вот, вега как раз ту же схему использовала на странном гибридном цапике саньо LC7881, который никто не уважает

сцена никакая по нынешним временам. но тембры у малых составов и вокал мне очень понравились



- 50 дБ +
⇡ в ответ @YG #

А я вовсю отдался сравнению двух способов вывода инфы с Мака:

1) ч/з Weiss INT 202 & 203: FW -> AES/EBU & Coaxial

2) ч/з Lynx Hilo: TB -> AES/EBU & Coaxial

Первый раз у меня есть прибор, где точно есть что-то лучше, чем в №1, но пока явно не всё.

Следующим ходом пробую линейный БП (едет ко мне уже) к Hilo ибо встроенный импульсный, но гнездо внешнего питания есть.

- 50 дБ +
⇡ в ответ @zome_bear #

Надумаете продать M63 KIS-напишите pusto58@gmail.com

- 50 дБ +
#

20 дБ на 1812 и 6 дБ на попсе — это ведь отношение среднего (!) к пику, а не самого тихого.

- 50 дБ +
⇡ в ответ @TY-214 #

да, мысль выражена неточно, я внесу разъяснение

- 53.01 дБ +
#
Компакт-диск или файл в аналогичном формате в состоянии обеспечить 16 х 6 = 96 дБ между самым тихим и громким пассажем.

Это относится к частоте в 1000 Гц, с остальным диапазоном все намного хуже. О проблемах цифрового мастеринга и убогости Red Book много писали сами специалисты Philips (одного из со основателей стандарта). Сам впервые услышал об этих проблемах в частных беседах со спецами компании, участвующими в записи мастеров на площадке Мариинского театра еще в первой половине 90-х и отчасти это дало мне объяснение посредственности звучания цифровых мастеров по сравнению с аналоговыми. В частности приводился пример классической обрезки динамического диапазона записи ниже определенного порогового значения, необходимый для корректировки ДД всего частотного спектра в оставшемся "коридоре" из-за ограничений стандарта. Тогда-же впервые услышал, что Red Book изначально разрабатывался для архивация и хранения телефонных переговоров и диктофонной записи, где нет нужды в широком частотном спектре.

- 53.01 дБ +
⇡ в ответ @DmitriyD #

откровениям неназванным мастерам противоречат немало компакт-дисков с прекрасным звуком

теларк в конце катал винилы из цифровых записей soundstream и все радовались

на некоторых записях классической музыки я видел подрубленные пики, но это редкость

- 53.01 дБ +
⇡ в ответ @YG #
катал винилы из цифровых записей

Вот и интересно было бы сравнить Hyper Magnum Sound 24 bit от Venus records - на винил цифру пишут, как и Stockfisch частенько!

- 53.01 дБ +
⇡ в ответ @DmitriyD #

Может речь была про особенности конкретного АЦП, который они использовали, или какого-то другого девайса из цифровой части тракта.

- 53.01 дБ +
⇡ в ответ @DmitriyD #

Каким образом на других частотах меняется глубина 16 бит? Независимо от частоты, 2^16=65536, если взять 20*lg от этого, то получим 96.32 дБ.

- 53.01 дБ +
#

Отличная статья!

- 50 дБ +
#

странно, что никто не хочет вступиться за мр3 (((

- 50 дБ +
⇡ в ответ @YG #

Вступление за mp3 здесь звучало бы чрезмерно еретически )))

Файлы пока не сравнивал, никак не доберусь до аппаратуры.

- 50 дБ +
⇡ в ответ @YG #

Ненадолго успокоились после недавних дебатов на другой ветке.

- 50 дБ +
#

При проведении подобных экспериментов еще неплохо бы учитывать влияние используемого ПО на качество результата. Например, вот результат конвертации исходного файла в 16 /44,1 при помощи другого известного конвертера: https://yadi.sk/d/CT-zgjLO3Pkj...

По мне звучание этого варианта заметно ближе к оригиналу, чем представленный в архиве из статьи.

- 50 дБ +
Чтобы оставить комментарий, войдите, пожалуйста.