Доброго времени суток, относительно недавно вступал здесь в небольшую дискуссию по поводу акустической подготовки, и поэтому решился-таки написать заметку о том, что же вообще происходит и как мы слышим. Не хочу растягивать и усложнять, поэтому вот мой старый комментарий, частично затрагивающий эту тему, ивполне возможно, что что-то из него сюда не попало.
Реверберация и её составляющие
Начнём с самого простого: каждый, думаю, знает, ну или как минимум понимает, что представляет из себя реверберация. На всякий случай вспомним:
Реверберационный процесс по времени можно приблизительно разделить на 3 этапа:
1. Исходный/прямой звук (dry signal) – 0мс, так как он фактически и приводит к возникновению реверберации
2. Первичные/ранние отражения (early reflections/ER) – 0-50/100мс, УК – это всё то, что попадает в нашу слуховую систему отразившись чаще всего один раз от какой-либо поверхности
3. Поздние отражения (late reflections) – 100+мс, это всё, что появляется при многократных переотражениях от поверхностей и приходит позднее всего с кратно меньшим уровнем
Нужно понимать, что эти цифры не являются какими-то точными значениями и даны для того, чтобы вы приблизительно понимали различия во временных составляющих, ибо то нам чуть позже понадобится.
Самое главное
Хорошо, вспомнили, а что дальше? А дальше идёт самое важное – процесс обработки мозгом акустического события, на этом, по сути, строится всё наше восприятие звука.
Этот процесс отчасти проявляется в наблюдении эффекта Хааса (precedence effect), но сейчас я попробую кратко сформулировать саму суть.
Что есть акустическое событие в данном случае? Звук, просто какой-либо звук, для лучшего понимания желательно представлять что-то периодическое, для чего человек может определить тембр.
И тогда оказывается, что:
1. Люди слышат серию акустических событий как единое если они:
a. Похожи по спектральному составу и временным характеристикам
b. Прибывают к нашим ушам в окне приблизительно 20-40мс
2. Это единое событие представляет собой «сборник» акустической информации из источников, для которых верен первый пункт. И самое главное: одним из типов такой акустической информации является тембр!
3. Кажущееся положение единого источника будет совпадать с положением в пространстве источника, излучившего первый звук в серии
Как вы уже, наверное, догадались, звуки, пришедшие в окне 100-200мс будут наоборот восприниматься как помеха и ухудшать возможности локализации, а после примерно 250-300мс наш мозг начнёт воспринимать их как отдельно стоящее эхо.
В принципе, это практически всё, что нужно понимать о нашей слуховой системе, чтобы сопоставить объективные данные с нашим восприятием.
Перемещаемся в комнату!
Ни для кого не секрет, что «правильная» реверберация – залог успеха (иначе зачем ещё люди стараются и проектируют концертные залы?). Что же происходит в помещении?
Если очень упрощённо, то помещение взаимодействует с ас на всём частотном диапазоне, однако можно выделить 3 области:
1. Область низких частот, на которой доминируют стоячие волны/комнатные моды (room modes), она заканчивается на называемой частоте Шрёдера (Schroeder frequency), которая являет собой участок перехода в зону доминирования комнатных мод
2. Сама зона перехода aka transition region
3. Выше частоты Шрёдера комната взаимодействует со слушателем путём реверберации (early+late reflections, о которых мы уже сказали), при этом первичные отражения напрямую влияют на воспринимаемую ачх (тембр), а сам реверберационный фон влияет на "ширину сцены" и "фокусировку образов", что также следует из сказанного выше
«Какой же месседж автор пытается донести?» —спросите вы. А суть на самом деле проста – комната – продолжение ас, ею нельзя исправить плохую внеосевую ачх системы и при этом она сама по себе влияет на тембр звука.
Что же нужно? Нужно чтобы спектр реверберации не имел «перекосов», которые будут разрушать тембральный баланс, т.е. как и с ачх у ас, важен общий тренд на нейтральность (не люблю слово линейность), таким образом, при сложении «в голове», финальный тембр будет сохранён.
При этом важно также понимать, что баланс между прямым звуком и реверберацией должен настраиваться индивидуально и является субъективным. К примеру, в комнате с RT на средних частотах около 600мс, я бы не стал слушать поп или рок, ибо образы будут размываться и в целом картина будет «задвинута», однако в моей мелкой комнате, где затухание порядка 150-200мс, я вряд ли смогу насладиться обволакивающей записью классики, да и джаз будет звучать слишком «сухо», из инструментов уйдёт «жизнь».
К чему это? Как всегда, аудио – это смесь объективного и субъективного. Выведены определённые «правила» построения помещений, а дальше начинаются «хотелки» самих слушателей в зависимости от жанров и предпочтений.
Касательно поглощения:
вы должны понимать, что модификация «спектра комнаты» в обычных помещениях возможна только на частотах выше 100-150Гц, всё что ниже требует специальных ловушек, а потому при отсутствии таковых должно подвергаться цифровой коррекции. Благо, типичные обставленные комнаты обычно не нуждаются в значительном подавлении реверберации, но, как уже было не раз сказано, это всё субъективно.
Не могу обойти стороной «поролоновую тему». Сколько всего написано, а всё возникают вопросы. В контексте КДП, поролон нежизнеспособен, так как вследствие малой плотности (и обычно, толщины) неспособен обеспечить равномерное (широкополосное) поглощение, а значит будет вмешиваться в естественный спектр и их применение оправдано в случаях, когда имеется проблема с верхним частотным диапазоном (что случается довольно редко, см. предыдущий абзац)
В заключение приведу собственный замер толстой (по меркам поролона) «басовой ловушки». Итак: угловая панель с толщиной 20см в самом широком месте, мелкий двухполосный мониторчик, в высоту менее половины этой самой «ловушки», расстояние до ас ~1м, сам поролон выставлен на половине расстояния.
Казалось бы, идеальные условия для поролона, источник полностью закрыт поглощающей поверхностью...
Ой… А что это получается?
Для тех, кому сложно «на лету» считать графики: вычтем одну ачх из другой, а затем применим сглаживание. Получается вот это:
Несмотря на подавление в почти 40дБ к 20кГц, ощутимый эффект от поглощения начинается только с отметки 6-7кГц, что никак не похоже даже на средние частоты.
Что произойдёт в помещении, если ему задавить высокие частоты? Да ничего хорошего. Образы, конечно, станут чётче, однако, чётче будут только их вч составляющие) В принципе получится «тёмный звук», как иногда любят выражаться.
Надеюсь, моя заметка кому-то помогла, надеюсь что у некоторых возникло желание «покопаться глубже», да и в принципе некоторые вещи стали немного понятнее.