«Цифра, она и в Африке цифра» — вот с такими досужими разговорчиками мы докатились до того, что профессионалы при записи или мастеринге полагают, что громкость можно выставить на предел, и все останется на своих местах. Так называемый 0 dBFS (full scale, полная шкала) — это максимальный уровень цифрового сигнала, который видит перед собой звукорежиссер на дисплее. Loudness war и любовь к орущим радиосинглам игнорируют тот факт, что даже без клиппинга сигнал в районе полной шкалы находится в зоне риска. Обещать — не значит жениться. Кто обещал, что при конвертации в МР3 или аналог все пики и уровни музыки останутся именно такими, какими их когда-то увидели в окне аудиоредактора?

При воспроизведении цифрового кода с уровнем около 0 dBFS интерполяция фильтром ЦАПа приводит к тому, что пики реального сигнала запросто выскочат за ноль! Именно этот момент имели в виду разработчики протокола Mastered for iTunes, когда умоляли выставлять громкость микса не выше –1 dBFS. Именно поэтому в новых версиях аудиоредакторов появились специальные счетчики, которые оценивают уровень интерсемпловых пиков (их также называют межсемпловыми) в аналоговом домене.
В статье, ссылку на которую я приводил в прошлом материале, автор оптимистично отводит роль виновников интерсемплового перегруза лишь дешевым CD-плеерам. Ну давайте посмотрим, что происходит на хорошем профессиональном оборудовании. С чего начнем — карта Lynx TWO-A или Sony PCM-D100? Пусть будет Lynx, у него технические показатели все-таки чуть выше.
Для оценки стойкости к межсемпловым артефактам я сгенерировал несколько образцов белого шума различной громкости. Так называют сигнал, в котором все частоты равномерно распределены по мощности в одну линию. Lynx будет воспроизводить белый шум в стандартной размерности 16 бит / 44 кГц. В свою очередь, рекордер Sony PCM-D100 в более высокой дискретности запишет этот аналоговый выхлоп с выходов Lynx, чтобы увидеть, насколько чисто фильтруются паразитные ультразвуковые артефакты.
Сначала тестируем систему классическим сигналом «белого шума» с уровнем –4дБ. Именно его используют для оценки свойств ЦАПа наши коллеги из журнала Stereophile.

Ну что же, мы видим, что все происходит весьма чинно и по науке. Где-то после 21 кГц кривая начинает резко падать (фильтроваться), чтобы к 24 кГц уже свалиться на уровень шумов –92 дБ. Перед нами наглядная демонстрация границ динамического диапазона формата компакт-диска (96 дБ). А теперь дадим Родине угля под ноль!

Ну и ужас! Горка между полезным сигналом и шумом заметно сплющилась. При 0 dBFS уровень помех квантования вырос до –60 дБ, и картинка сделалась настолько некрасивой, что Stereophile и другие журналы стесняются такое публиковать. В подобном режиме фильтрация ультразвуковых артефактов становится совсем неубедительной. Если вы подумали, что все дело в устаревшем формате Red Book, спешу огорчить — на этом графике уже изображен белый шум в размерности 24 бит / 44,1 кГц. Перед ним 16-битный на 0 dBFS продемонстрировал аналогичную картину, и я надеялся, что хотя бы 24-битное исчисление сможет опустить порог ультразвуковых шумов хоть чуть-чуть вниз. Бесполезно.

Выставим громкость белого шума на минус 3 дБ, как принято в киноиндустрии, и спад АЧХ опять становится более-менее вменяемым. Также следует заметить, что во избежание нового витка интерсемпловых искажений я записывал поступающий сигнал от Lynx TWO-A не в полную шкалу, так что реальные уровни помех будут выше. Если нормализовать записанный Sony сигнал до 0 дБ, то ультразвуковой срач на самом громком образце белого шума вырастет до –50 дБ.
Данный эксперимент был прокручен и в обратную сторону, когда источником белого шума был Sony, а Lynx записывал. И тоже аналогичный результат. Любые ЦАПы, хоть CS4396 (как в Lynx), хоть AK4480 (как у Sony), профессиональные, домашние — без разницы. Все они очень некрасиво кряхтят на сигнале 0 dBFS, не доводите их до этого.

И если вы полагаете, что реальный музыкальный сигнал и белый шум — это разные вещи, предлагаю полюбоваться аналитикой трека «Lust for Life», упомянутой в прошлой статье Ланы Дель Рей. Формально семпловый уровень фонограммы остается 0 dBFS, но iZotope пророчит еще целых 2 дБ сверху при преобразовании в аналог.
Поэтому лучше уменьшите входящий на ЦАП поток на программном плеере, если имеется такая возможность. Несколько децибел в минус заметно не испортят коэффициент сигнал/шум, зато избавят вашу систему от интерсемпловых искажений.
Комментарии
zome_bear
Правильно ли я понял, что при в принципе нормальном - 3dB мы видим всё равно неприглядную картину?
P.S.
У меня на Weiss-ах есть "properly dithered level control ... with a 24 bit wordlength easily rivals the best analog level controls", надо попробовать им пользоваться на "громких" CD...
YG
в общем да, при минус 4 все чище
YG
я не смотрел, что там у него, но скорее всего weiss работает в 32bit float и потом добавляет чуть шумка и обратно пересчитывает в 24 бит
к сожалению, за исключением простых процедур типа удалить кусок, любые пересчеты в математической сетке аудиосигнала ведут к ошибкам квантования и нуждаются в инъекции дитера
zome_bear
У меня по этому поводу вот эта статья настольная.
Там есть интересные вещи, связанные с попаданием в ЦАП вместе с полезным сигналом постороннего шума/наводок и, как мне кажется, это объясняет в какой-то мере, например, разницу звучания цифровых кабелей. Да, и ещё много чего...
YG
Лукин из iZotope говорит, что дизеринг надо употреблять не задумываясь, но из своего опыта редактирования оцифровки с последующим понижением дискретности не могу сказать, что результаты этой процедуры меня на 100% устраивает.
но и без нее тоже не то пальто (((
поэтому некоторые проекты так и оставляю в 32bit float.
flac такую размерность не поддерживает, но wavepack вполне
zome_bear
У меня нет проблем с наличием дискового пространства, плюс я хронически не люблю доп. участников "пищевой цепи", поэтому стараюсь придерживаться несжатых форматов.
А wav и aiff можно и 64bit float.
YG
ну 64 это уже оперативная функция, не для хранения точно ))
что касается wav vs lossless, то, например мой линукс-клиент на маломощном железе не любит как раз несжатые вавы, в отличие от лосслесов
zome_bear
Я чувствую, что придётся начинать ещё разбираться в коде и реверс-инжиниринге, чтобы понять почему ))
Wadim
Я не смог понять и есть вопросы:
1 - какая связь между динамическим диапазоном и работой нч фильтра? Ну запишите не белый шум, а синус 50 Гц и получите на 24кГц минус 96 дб - разве нет?
2 - картинка синусоиды, выходящей за "о" по идее должна стать ступенькой , это и будет гармоническим искажением. Поэтому не понятна связь синусоиды и последующими графиками, где искажения этой самой синусоиды? По идее, чтобы увидеть как исказилась синусоида, нужно на выходе осциллографом сравнить с исходником. Если есть искажения, получим визуальный результат. Так вроде, раньше и тестили на "прямоугольнике".
YG
Этот материал не про динамический диапазон. Считайте, что динамический диапазон фонограммы уже убили в прошлой статье. Данное исследование про пограничные режимы работы ЦАПа при подаче аудиопотока с максимальным уровнем. Это, как видим, чревато ухудшением подавления ультразвуковых помех квантования.
Почему не синус? Белый шум более приближен к реальному музыкальному сигналу (особенно некоторым его жанрам) чем просто синус, а значит оценка его поведения при конвертации в аналог на цапе представляет интерес. А на первой картинке это вообще не обязательно синусоида, а просто произвольный пик сигнала в большом увеличении. Иными словами, считайте межсемпловые искажения неконтроллируемой интерполяцией клиппинга. А к чему это приводит на выхлопе ЦАПа - показано на картинках.
zome_bear
Вот реальный отличный образец.
YG
что здесь изображено?
zome_bear
Увеличенный масштаб участка фонограммы с клиппингом.
Красные вертикальные полосы - это как Audacity на MacOS выделяет местоположение отсчёта, превышающего 0dBFS.
Это я писал к "приближен к реальному музыкальному сигналу".
Сейчас подумал, а зачем я изначально приложил тут картинку...
Кто её не видел...
Может прогнать её ч/з Benchmark DAC на Benchmark ADC с уменьшением уровня сигнала в цифре до Benchmark DAC / аналоге после Benchmark DAC и без оного, и посмотреть в этом же месте форму сигнала, при этом не трогая усиление в ADC?
YG
попробуйте, но кстати этот образец еще более-менее, несмотря на клиппинг, какие-то пики торчат
обычно все выбрито как у ланы в статье
zome_bear
Сегодня утром что-то эта фраза у меня вызывает странные ассоциации...
YG
гг, только к утру вызвало ?
zome_bear
Сутки доходило...
PoruchikGT
Судя по тем графикам, с обрезанной синусоидой, которые Вы постите, получается, что в студии компрессор должен стоять в режиме лимитора. То есть, параметр Attak (1-3ms), Ratio (∞:1). И даже в этом режиме не будет происходить жесткого ограничения синусоиды. Так, что компрессирование и клиппинг это разные процессы. И кстати, ДА...... я вполне слышу своими ушами работу компрессора в режиме лимитора. Звук в пиках как бы приглушенно похрустывает, а работа компрессора в режиме экспандера вообще не вызывает нареканий по восприятию звука. Но всё это разительно отличается от клиппинга. Клиппинг слышит даже глухой. Сигнал при этом, искажается кардинально.
YG
какая еще обрезанная синусоида да еще во множественном числе? Где вы ее увидели опять?
PoruchikGT
В предыдущих статьях на которые Вы здесь делаете ссылки. Вы же, заочно дискутируете с оппонентами других ресурсов на тему прошлых статей, а не по теме этого материала. По этому я и дал цитату.
YG
"в итоге кто на ком стоял?" вы предлагаете слишком сложную цепочку с цитатами заочных дискуссий, давайте я сделаю короче.
Я утверждаю и показываю в примерах с ланой дель рей, что современный мастеринг очень помойно сделан и страдает от:
1. зажатого динамического диапазона
2. клиппинга.
В этой статье показал, как от этого всего страдает сам ЦАП.
Что я сказал не так?
PoruchikGT
То что клиппинг и коррекция сигнала в результате работы компрессора (в режиме лимитера) это физически разные процессы, которые схожи по субъективному восприятию вносимых ими искажений, но сильно разнятся в физике процесса.
На счет Ланы я не спорю. Мне тоже, звук не понравился, но надо иметь в виду, что альбом записан с переизбытком реверберации. Это явно - концепция записи. В такой ситуации действительно, нужно зажимать диапазон иначе потеряется разборчивость, но при этом, начинают "похрустывать" НЧ в спектре ударных, а они записаны как довольно тяжелые акценты. Моё мнение, что не надо над этим парится..... так видит режиссер..... Воспринимайте это как черно белое кино снятое в 21-м веке..... Цвета искажены, но замысел понятен. И ещё, звук Ланы очень узнаваем и это дорогого стоит...... возможно это стало причиной сильного компрессирования. Индивидуальность - это наше ВСЁ!
YG
аккуратное отношение к компрессии это скорее исключение, так что мастеринг ланы это не индивидуальность а мейнстримовая практика
вот лишний раз вспомню бейонс, там тоже зажато, но звук намного лучше
PoruchikGT
А уж как погано ZZtop последний альбом свели..... Я, по началу, думал у меня кондеры в БП сели, ан, нет........ так записан....
Perry
А вот интересно, это вредительство звукоинженеров одинаково плохо для всех типов микросхем-ЦАП, или в разной степени ?
YG
на дельта-сигмах - точно
будет мультибит под рукой - посмотрю и его
но очевидны косвенные признаки того, что ему тоже будет тяжко
все компакт-диски 80-х никогда не записывали под 0, понимали, что дело будет худо
PoruchikGT
Звукоинженерам пофиг. Им дали задание, они его выполнили. В основном, это маркетологи резвятся. В муз индустрии конкуренция жуткая вот и посчитали, что основные деньги за контент платят подростки с затычками в ушах., при чем, платят деньгами мам и пап. Это беспроигрышный вариант, так что, будем привыкать или уходить с головой в инди.....
Perry
"В комментарии на фейсбуке даже пожаловали господа-профессионалы ..."
Недавно послушал Мадонну "Rebel Heart" (для разностороннего меломана есть в нем моменты) - и посетила меня мечта о возникновении международной тайной организации на манер масонов, которая бы тем господам-профессионалам, которые ответственны за ТАКИЕ надругательства над звуком, в нескольких местах ломала ноги и выкладывала запись данной процедуры в интернете с соответствующими предупреждениями остальным. И так во всех областях "прогресса" )))))))))). Хватит спорить с этими людьми.
zome_bear
Так, мне приехали мои CD+BD любимой японской попсы, ну, что и ожидалось - всё "выбрито" у "моих девочек"и с клиппингом.
Live-то ещё честные 48/24, а анимешные клипы, точнее их звуковая дорожка 48/24, вообще из CD сделаны с заполнением нулями от 16 до 24 bit и отсечкой по 22 kHz. Ещё и видеоряд (и BD-мастеринг в целом) рука-лицо-специалист делал...
Распотрошил я BD, сделал аттенюацию -4дБ. И, так как мой любимый Multichannel Asio Renderer (ссыль) конвертит всё в 32 float, сам сохранил в них.
Таки совсем другое дело!