Низвержение в 0 дБ: что такое интерсемпловые искажения

Низвержение в 0 дБ: что такое интерсемпловые искажения

Предыдущий материал про муки динамического диапазона вызвал нешуточный ажиотаж. В комментарии на фейсбуке даже пожаловали господа-профессионалы. «Какая-то каша в статье из клиппинга и компрессии, это разные явления», — пишут они. Нет, дорогие мои. Каша получается, когда вы загоняете громкость микса в 0 децибел, и сейчас я вам это покажу с картинками.

«Цифра, она и в Африке цифра» — вот с такими досужими разговорчиками мы докатились до того, что профессионалы при записи или мастеринге полагают, что громкость можно выставить на предел, и все останется на своих местах. Так называемый 0 dBFS (full scale, полная шкала) — это максимальный уровень цифрового сигнала, который видит перед собой звукорежиссер на дисплее. Loudness war и любовь к орущим радиосинглам игнорируют тот факт, что даже без клиппинга сигнал в районе полной шкалы находится в зоне риска. Обещать — не значит жениться. Кто обещал, что при конвертации в МР3 или аналог все пики и уровни музыки останутся именно такими, какими их когда-то увидели в окне аудиоредактора?

При воспроизведении цифрового кода с уровнем около 0 dBFS интерполяция фильтром ЦАПа приводит к тому, что пики реального сигнала запросто выскочат за ноль! Именно этот момент имели в виду разработчики протокола Mastered for iTunes, когда умоляли выставлять громкость микса не выше –1 dBFS. Именно поэтому в новых версиях аудиоредакторов появились специальные счетчики, которые оценивают уровень интерсемпловых пиков (их также называют межсемпловыми) в аналоговом домене.

В статье, ссылку на которую я приводил в прошлом материале, автор оптимистично отводит роль виновников интерсемплового перегруза лишь дешевым CD-плеерам. Ну давайте посмотрим, что происходит на хорошем профессиональном оборудовании. С чего начнем — карта Lynx TWO-A или Sony PCM-D100? Пусть будет Lynx, у него технические показатели все-таки чуть выше.

Для оценки стойкости к межсемпловым артефактам я сгенерировал несколько образцов белого шума различной громкости. Так называют сигнал, в котором все частоты равномерно распределены по мощности в одну линию. Lynx будет воспроизводить белый шум в стандартной размерности 16 бит / 44 кГц. В свою очередь, рекордер Sony PCM-D100 в более высокой дискретности запишет этот аналоговый выхлоп с выходов Lynx, чтобы увидеть, насколько чисто фильтруются паразитные ультразвуковые артефакты.

Сначала тестируем систему классическим сигналом «белого шума» с уровнем –4дБ. Именно его используют для оценки свойств ЦАПа наши коллеги из журнала Stereophile.

Ну что же, мы видим, что все происходит весьма чинно и по науке. Где-то после 21 кГц кривая начинает резко падать (фильтроваться), чтобы к 24 кГц уже свалиться на уровень шумов –92 дБ. Перед нами наглядная демонстрация границ динамического диапазона формата компакт-диска (96 дБ). А теперь дадим Родине угля под ноль!

Ну и ужас! Горка между полезным сигналом и шумом заметно сплющилась. При 0 dBFS уровень помех квантования вырос до –60 дБ, и картинка сделалась настолько некрасивой, что Stereophile и другие журналы стесняются такое публиковать. В подобном режиме фильтрация ультразвуковых артефактов становится совсем неубедительной. Если вы подумали, что все дело в устаревшем формате Red Book, спешу огорчить — на этом графике уже изображен белый шум в размерности 24 бит / 44,1 кГц. Перед ним 16-битный на 0 dBFS продемонстрировал аналогичную картину, и я надеялся, что хотя бы 24-битное исчисление сможет опустить порог ультразвуковых шумов хоть чуть-чуть вниз. Бесполезно.

Выставим громкость белого шума на минус 3 дБ, как принято в киноиндустрии, и спад АЧХ опять становится более-менее вменяемым. Также следует заметить, что во избежание нового витка интерсемпловых искажений я записывал поступающий сигнал от Lynx TWO-A не в полную шкалу, так что реальные уровни помех будут выше. Если нормализовать записанный Sony сигнал до 0 дБ, то ультразвуковой срач на самом громком образце белого шума вырастет до –50 дБ.

Данный эксперимент был прокручен и в обратную сторону, когда источником белого шума был Sony, а Lynx записывал. И тоже аналогичный результат. Любые ЦАПы, хоть CS4396 (как в Lynx), хоть AK4480 (как у Sony), профессиональные, домашние — без разницы. Все они очень некрасиво кряхтят на сигнале 0 dBFS, не доводите их до этого.

И если вы полагаете, что реальный музыкальный сигнал и белый шум — это разные вещи, предлагаю полюбоваться аналитикой трека «Lust for Life», упомянутой в прошлой статье Ланы Дель Рей. Формально семпловый уровень фонограммы остается 0 dBFS, но iZotope пророчит еще целых 2 дБ сверху при преобразовании в аналог.

Поэтому лучше уменьшите входящий на ЦАП поток на программном плеере, если имеется такая возможность. Несколько децибел в минус заметно не испортят коэффициент сигнал/шум, зато избавят вашу систему от интерсемпловых искажений.

74.15 дБ +

Комментарии

#
Сначала тестируем систему классическим сигналом «белого шума» с уровнем –4дБ.
...
А теперь дадим Родине угля под ноль!
...
Выставим громкость белого шума на минус 3 дБ

Правильно ли я понял, что при в принципе нормальном - 3dB мы видим всё равно неприглядную картину?

P.S.

У меня на Weiss-ах есть "properly dithered level control ... with a 24 bit wordlength easily rivals the best analog level controls", надо попробовать им пользоваться на "громких" CD...

- 60.79 дБ +
#

в общем да, при минус 4 все чище

- 53.01 дБ +
#

я не смотрел, что там у него, но скорее всего weiss работает в 32bit float и потом добавляет чуть шумка и обратно пересчитывает в 24 бит

к сожалению, за исключением простых процедур типа удалить кусок, любые пересчеты в математической сетке аудиосигнала ведут к ошибкам квантования и нуждаются в инъекции дитера

- 60.79 дБ +
#

У меня по этому поводу вот эта статья настольная.

Там есть интересные вещи, связанные с попаданием в ЦАП вместе с полезным сигналом постороннего шума/наводок и, как мне кажется, это объясняет в какой-то мере, например, разницу звучания цифровых кабелей. Да, и ещё много чего...

- 60 дБ +
#

Лукин из iZotope говорит, что дизеринг надо употреблять не задумываясь, но из своего опыта редактирования оцифровки с последующим понижением дискретности не могу сказать, что результаты этой процедуры меня на 100% устраивает.

но и без нее тоже не то пальто (((

поэтому некоторые проекты так и оставляю в 32bit float.

flac такую размерность не поддерживает, но wavepack вполне

- 50 дБ +
#

У меня нет проблем с наличием дискового пространства, плюс я хронически не люблю доп. участников "пищевой цепи", поэтому стараюсь придерживаться несжатых форматов.

А wav и aiff можно и 64bit float.

- 50 дБ +
#

ну 64 это уже оперативная функция, не для хранения точно ))

что касается wav vs lossless, то, например мой линукс-клиент на маломощном железе не любит как раз несжатые вавы, в отличие от лосслесов

- 50 дБ +
#

Я чувствую, что придётся начинать ещё разбираться в коде и реверс-инжиниринге, чтобы понять почему ))

- 50 дБ +
#

Я не смог понять и есть вопросы:

1 - какая связь между динамическим диапазоном и работой нч фильтра? Ну запишите не белый шум, а синус 50 Гц и получите на 24кГц минус 96 дб - разве нет?

2 - картинка синусоиды, выходящей за "о" по идее должна стать ступенькой , это и будет гармоническим искажением. Поэтому не понятна связь синусоиды и последующими графиками, где искажения этой самой синусоиды? По идее, чтобы увидеть как исказилась синусоида, нужно на выходе осциллографом сравнить с исходником. Если есть искажения, получим визуальный результат. Так вроде, раньше и тестили на "прямоугольнике".

- 50 дБ +
#

Этот материал не про динамический диапазон. Считайте, что динамический диапазон фонограммы уже убили в прошлой статье. Данное исследование про пограничные режимы работы ЦАПа при подаче аудиопотока с максимальным уровнем. Это, как видим, чревато ухудшением подавления ультразвуковых помех квантования.

Почему не синус? Белый шум более приближен к реальному музыкальному сигналу (особенно некоторым его жанрам) чем просто синус, а значит оценка его поведения при конвертации в аналог на цапе представляет интерес. А на первой картинке это вообще не обязательно синусоида, а просто произвольный пик сигнала в большом увеличении. Иными словами, считайте межсемпловые искажения неконтроллируемой интерполяцией клиппинга. А к чему это приводит на выхлопе ЦАПа - показано на картинках.


- 60 дБ +
#

Вот реальный отличный образец.


- 50 дБ +
#

что здесь изображено?

- 50 дБ +
#

Увеличенный масштаб участка фонограммы с клиппингом.

Красные вертикальные полосы - это как Audacity на MacOS выделяет местоположение отсчёта, превышающего 0dBFS.

Это я писал к "приближен к реальному музыкальному сигналу".


Сейчас подумал, а зачем я изначально приложил тут картинку...

Кто её не видел...


Может прогнать её ч/з Benchmark DAC на Benchmark ADC с уменьшением уровня сигнала в цифре до Benchmark DAC / аналоге после Benchmark DAC и без оного, и посмотреть в этом же месте форму сигнала, при этом не трогая усиление в ADC?

- 50 дБ +
#

попробуйте, но кстати этот образец еще более-менее, несмотря на клиппинг, какие-то пики торчат

обычно все выбрито как у ланы в статье


- 50 дБ +
#

Сегодня утром что-то эта фраза у меня вызывает странные ассоциации...

... все выбрито как у ланы...
- 50 дБ +
#

гг, только к утру вызвало ?

- 53.01 дБ +
#

Сутки доходило...

- 50 дБ +
#
В комментарии на фейсбуке даже пожаловали господа-профессионалы. «Какая-то каша в статье из клиппинга и компрессии, это разные явления», — пишут они.

Судя по тем графикам, с обрезанной синусоидой, которые Вы постите, получается, что в студии компрессор должен стоять в режиме лимитора. То есть, параметр Attak (1-3ms), Ratio (:1). И даже в этом режиме не будет происходить жесткого ограничения синусоиды. Так, что компрессирование и клиппинг это разные процессы. И кстати, ДА...... я вполне слышу своими ушами работу компрессора в режиме лимитора. Звук в пиках как бы приглушенно похрустывает, а работа компрессора в режиме экспандера вообще не вызывает нареканий по восприятию звука. Но всё это разительно отличается от клиппинга. Клиппинг слышит даже глухой. Сигнал при этом, искажается кардинально.

- 50 дБ +
#

какая еще обрезанная синусоида да еще во множественном числе? Где вы ее увидели опять?




- 50 дБ +
#

В предыдущих статьях на которые Вы здесь делаете ссылки. Вы же, заочно дискутируете с оппонентами других ресурсов на тему прошлых статей, а не по теме этого материала. По этому я и дал цитату.

- 50 дБ +
#
В предыдущих статьях на которые Вы здесь делаете ссылки. Вы же, заочно дискутируете с оппонентами других ресурсов на тему прошлых статей, а не по теме этого материала. По этому я и дал цитату.


"в итоге кто на ком стоял?" вы предлагаете слишком сложную цепочку с цитатами заочных дискуссий, давайте я сделаю короче.

Я утверждаю и показываю в примерах с ланой дель рей, что современный мастеринг очень помойно сделан и страдает от:
1. зажатого динамического диапазона
2. клиппинга.

В этой статье показал, как от этого всего страдает сам ЦАП.
Что я сказал не так?

- 50 дБ +
#

То что клиппинг и коррекция сигнала в результате работы компрессора (в режиме лимитера) это физически разные процессы, которые схожи по субъективному восприятию вносимых ими искажений, но сильно разнятся в физике процесса.

На счет Ланы я не спорю. Мне тоже, звук не понравился, но надо иметь в виду, что альбом записан с переизбытком реверберации. Это явно - концепция записи. В такой ситуации действительно, нужно зажимать диапазон иначе потеряется разборчивость, но при этом, начинают "похрустывать" НЧ в спектре ударных, а они записаны как довольно тяжелые акценты. Моё мнение, что не надо над этим парится..... так видит режиссер..... Воспринимайте это как черно белое кино снятое в 21-м веке..... Цвета искажены, но замысел понятен. И ещё, звук Ланы очень узнаваем и это дорогого стоит...... возможно это стало причиной сильного компрессирования. Индивидуальность - это наше ВСЁ!

- 50 дБ +
#

аккуратное отношение к компрессии это скорее исключение, так что мастеринг ланы это не индивидуальность а мейнстримовая практика

вот лишний раз вспомню бейонс, там тоже зажато, но звук намного лучше

- 50 дБ +
#

А уж как погано ZZtop последний альбом свели..... Я, по началу, думал у меня кондеры в БП сели, ан, нет........ так записан....

- 50 дБ +
#

А вот интересно, это вредительство звукоинженеров одинаково плохо для всех типов микросхем-ЦАП, или в разной степени ?

- 50 дБ +
#

на дельта-сигмах - точно

будет мультибит под рукой - посмотрю и его

но очевидны косвенные признаки того, что ему тоже будет тяжко

все компакт-диски 80-х никогда не записывали под 0, понимали, что дело будет худо

- 53.01 дБ +
#

Звукоинженерам пофиг. Им дали задание, они его выполнили. В основном, это маркетологи резвятся. В муз индустрии конкуренция жуткая вот и посчитали, что основные деньги за контент платят подростки с затычками в ушах., при чем, платят деньгами мам и пап. Это беспроигрышный вариант, так что, будем привыкать или уходить с головой в инди.....

- 50 дБ +
Чтобы оставить комментарий, войдите, пожалуйста.