Стереофонический эффект впервые был продемон­стрирован в 1881 году в Гранд Опера в Париже. На сцене установили два микрофона, а слушателям раз­дали наушники. Звук от первого микрофона поступал к одному наушнику, от второго — к другому. Почти семьдесят лет от­деляет первую демонстрацию стереофонического эф­фекта от широкого распространения стерео грампла­стинок (1958 год). [1] Это объясняется в первую очередь трудностью массового изготовления носителя стерео звука. Примечательно, что стереозвук пошёл в народ после выпуска стереомагнитофона (1955) и первые годы распространялся-продавался только на бобинах.

Казалось бы, тема проще пареной репы, однако незнание принципов формирования стереофонии неизбежно порождает домыслы и манипуляции. Зачастую слышишь безапелляционный вердикт якобы слухача: "Звук плоский!". На вопрос что именно автор имеет и в виду, получаешь жёсткий ответ, мол, сие как пень ясно. Всё-таки, под "плоским" подразумевается малая глубина/ширина воссоздаваемой стерео сцены, или что-то иное? Типа, слишком ровная АЧХ??? ;)))

Подтема противостояния стерео с многоканалом была уже неоднократно избита, в промежуточных итогах все остались при своих (мнениях?). Хотя очевидно, что в идеале сколько в записи источников звука, столько должно быть и каналов. Ну, или на 1 меньше, поскольку "лишний" источник звука всегда можно виртуально разместить между двумя каналами. Представьте, как бы было здорово, если бы мы располагали студийной многоканальной записью и сами (или с помощью подсказок искусственного интеллекта) микшировали в домашнем процессоре в нужное нам число каналов, исходя из имеющегося числа колонок и их расстановки в помещении прослушивания!!!

И почему двух колонок/каналов для реализации пространственного звучания многим вполне достаточно? Объяснение, что у человека 2 уха, а не 4 оставим для наивных-доверчивых. На самом деле в необходимости как минимум двух колонок (напомню, максимум равен числу источников звука) кроется глубокий сермяжный физический смысл. Система слуха человека оценивает "пространственность" в совокупности через определение расстояния-удаления (по задержке прихода сигнала между правым и левым ухом) и по отражённым эхом звукам. Т.е. если никакого эха вообще нет (в безэховой камере), то система слуха недополучает полезной информации. Например, с закрытыми глазами только по эху человек легко определяет, где находится, в ванной комнате или в лесу. Поэтому чтобы в записи придать вокалу или музыкальным инструментам "объемности" звучания, издавна добавляется реверберация, причем, как правило, искусственная в студии. Так проще-дешевле. С другой стороны помещение прослушивания привносит своё эхо, не учитывать которое, значит, блуждать в потёмках своего мракобесия.

По сути же, на всём этапе развития индустрии звука стереофония - это сплошное введение в заблуждение системы слуха человека. Точнее, просто ловкость рук "звукрежа" и ни какого мошенства!!!

Акустические стерео эффекты обычно формируются в диапазоне частот от 300-600 Гц до 3000-5000 Гц либо искусственно при так называемом сведении в студии, либо непосредственно при записи в 2 микрофона без последующего микширования. В последнем случае пространственное звучание на слух воспринимается более натуральным, очевидно, по причине целостности фазовой структуры записанных аудио сигналов. Однако акустическое помещение при такой записи должно обладать идеальными акустическими свойствами, причем оптимальность времени реверберации зависит от жанра музыки.

В живую ниже 100-150 Гц локализация источника звука на слух не возможна в принципе (расстояние между нашими ушами не как у слона), а выше 5-6 кГц азимутальная локация осуществляется только за счёт разницы интенсивности пришедших звуковых сигналов. Точность определения направления прихода звука в горизонтальной плоскости составляет 3—4°, в вертика­льной же плоскости эта особенность выражена значи­тельно слабее и не превышает, как правило, 0—15° [2].

Легко подсчитать, что в диапазоне частот стереофонии в воздухе длина волны составляет примерно от 1 м до 6 см. Не удивительно, зона выраженного стереоэффекта в реальности не редко мала, как бы не был крут сетап, а желанная sweet spot вообще вырождается в точку - смещение головы на какие то сантиметры влево-вправо и а-ля у-лю. Расширение зоны стереоэффекта возможно путём ухудшения направленности акустических систем, а значит, за счёт снижения локализации кажущегося источника звука (КИЗ). Природу не обманешь!

Изначально стереоэффекты основывались на элементарном разделении размещения по каналам голосов или инструментов. Например, в ранних стерео записях The Beatles вокал доносится из одного канала, а все музыкальные звуки из другого. Позже при сведении в стерео источники звука стали виртуально расставлять в пространстве благодаря вводимой разнице громкости между левым и правым каналами, а псевдо глубину стерео сцены варьировать ревербератором.

Полезно вникнуть в кухню стерео на примере 2го трека [Deezer]
c 1го альбома Queen, записанного с января 1972 по январь 1973 года в  Trident Studios London (6й трек в  De Lane Lea Studios), благо тут собран полный букет стерео достижений той поры. Между прочим, на CD  0777 7 89274 2 4 отмастерен Abbey Road Studios в 1994 довольно удачно, с чем поспорит более "мягкий" по звуку, аккуратно компрессированный ремастер 2018 года MQA x UHQCD UICY-40251.

«Doing All Right» (песня создана еще группой предшественницей  Smile) в ремастере 1994

Лидирующий вокал локализуется над (и временами за) ударной установкой, что на слух непривычно, т.к. хай-хэт, соло барабан и райд выдвинуты на передний план. Как будто фальцетом солирует сам ударник (Тейлор?), причем эффект более выражен при прослушивании в наушниках. Партия акустической гитары «Hairfred» в исполнении Брайана Мэя сведена с реверберацией, он же в некоторых местах играет на фортепиано (на вступлении с ревером в правый канал), хотя «Doing Alright» была первой песней Queen, в живых исполнениях которой на фоно резвился Меркьюри. По ходу песни фортепиано из одного канала перекликается с электрогитарой в другом канале. А в кульминационные моменты электруха занимает законное место по центру, играясь эхом с другими инструментами. Судя по всем признакам, стерео эффекты здесь (22 Мб) получены либо панорамированием, либо реверберацией без каких либо синтезированных штучек-дрючек. Поэтому в плане объема прекрасно звучит на любой стерео аппаратуре. А вот использовались ли фэйзер, хорус и флэнжер вынесем-ка в обсуждение;))) Вообще, дебютный альбом искрится идеями и слушается на удивление свежо, более того многократно в кайф переслушивается. 

По мере совершенствования техники звукозаписи и познаний в области психоакустики стали использоваться фазовые задержки между звуками разных каналов. Так, если одинаковый по амплитуде речевой сигнал воспроизвести с левого канала с задержкой <3-4 мс относительно правого, то на слух такой стерео звук начнет преобладать в правом канале. И наоборот, при задержке в правом канале, по мнению системы слуха человека, источник звука переместится в левый канал. При задержке от 4 до 10-15 мс локализация затрудняется, с ростом задержки начинает изменяться протяжённость КИЗ. В диапазоне задержки от 15 до 120 мс формирование стерео КИЗ возможно только при дополнительной разнице интенсивностей. Если же чистая задержка превысит 50-60 мс [3], вместо виртуального стереоэффекта мы услышим разнобой звуков, доносящихся с левого и правого каналов в разное время.

Эффект Хааса.  Бинауральный психоакустический эффект: если за звуком следует другой звук, разделенный достаточно короткой временной задержкой (ниже порога эха слушателя), то слушатель воспринимают их как одно звуковое событие, при этом пространственное расположение источника определяется в основном по первому звуку. То есть, отстающий звук влияет на воспринимаемое местоположение, однако его эффект подавляется первым поступающим звуком. Слияние происходит, когда задержка между двумя звуками находится в диапазоне от 1 до 5 мс для щелчков и до 40 мс для более сложных звуков, таких как речь или фортепианная музыка. Если задержка длиннее, то второй звук слышится как эхо. [4]

Как бы там ни было с исследованиями психоакустики (далеко не всегда открытыми), на практике получается чтобы точнёхонько воссоздавать фазовые задержки порядка 0.02-5 мс, да еще и на стыке СЧ и ВЧ в многополосных АС, необходимы особо высококачественные компоненты ВСЕГО тракта стерео аппаратуры!!! Не удивительно, что не имеющие корёживающего фазу стыка широкополосные АС (да еще и с идентично подобранными в пары динамиками) озвучивают стерео эффекты с гораздой лучшей локализацией в пространстве и более реалистично. При доминировании вокала многополосным АС полегче: наиболее значительное влияние на локализацию кажущегося источника звука оказывает полоса частот 300-1000 Гц, где сосредоточена наибольшая часть энергии речевого сигнала [3].

Таким образом, возможны 3 способа реализации стереофонии: амплитудный, фазовый, смешанный. Очевидно при выраженных чистых тонах оптимальная задержка фазы между каналами зависит от частоты. Иначе для того же 440 Гц задержка в 1 мс (с копейками) просто даст противофазу. А таковая - блуждающий, зависящий от отражений в помещении кажущийся источник звука (Линда_Танцы тибетских лам_4 - Ляп-ляп-ляп_фрагмент ). Для винила амплитудный способ ограничен существенным проникновением между каналами, зато фазовому раздолье.

В отличие от современного стерео, построенного преимущественно на смешивании фазовых задержек, многоканальный звук (в частности, 5.1) в основном "миксят" за счёт простейшего панорамирования [5], т.е. чисто амплитудного эффекта. Поэтому технические требования к звуковоспроизводящим трактам (в том числе многоканального AV ресивера) существенно снижаются - не кувыркать фазу по всем частотам удовольствие дорогое.

Площадь зоны приемлемого пространственного восприятия многоканала несколько больше, но тут многое зависит от технических средств, применённых звукорежиссером при сведении в 5 и более каналов. Самый простой способ в домашних условиях раздвинуть пространство стерео записи: сознательно ограничившись 4-мя колонками, зеркально распараллелить каналы, и если не нравится сидеть в центре музыкального коллектива, отодвинуть сцену балансом, не связываясь с DSP обработкой, выполняемой на лету в ресиверах по прежнему кое-как.

Ориентировочное определение зоны прослушивания для 5 каналов

Но если всё так расчудесно, то почему многоканал не получил массового признания? Во-первых, разместить в помещении прослушивания 4-5 колонок плюс сабвуфер по всем правилам мало кто себе может позволить, компромиссное встискивание же в жилое порождает косяки. Во-вторых, стремление сэкономить и реклама домтеатров привели к повальному приобретению посредственных колонок тыловых и центрального каналов. В-третьих, музыка в многоканале преобладает в виде концертников, а на SACD малочисленна, при этом DVD-audio не выдержал конкуренции - video с DD/DTS дорожками на расхожей аудио аппаратуре звучали даже лучше. Ну и наконец, многоканальные ресиверы конструктивно рассчитаны на активный сабвуфер, поэтому банально проседают на НЧ, особенно с низкоомной нагрузкой, тогда как добротные стерео усилители ещё и плодят заметно меньше искажений. Увы, многообещающий многоканал сейчас обосновался в кино (да и там не без наездов, типа, мешает созерцанию), отдав на откуп нишу стерео музыкальной индустрии.

Да, классическое стерео способно весьма убедительно воссоздавать "пространственный" звук, но стоимость сопоставимо "объёмно" звучащей стерео аппаратуры на вскидку как минимум в 2 раза больше, чем 4 канальной!!! Как говориться, хорошо что успели вовремя [cutting it close]... врубиться ;)))

PS

Между прочим, КВАДРО в своё время загнулось не по вине формата как такового, а из-за дороговизны аппаратуры (прежде всего бытовой) и носителей звука. К тому же, квадро винил звучал хуже, чем стерео по причине уплотнения канавок и полного обрезания выше 15 кГц.

[1] Чедд Г. Звук. (В мире науки и техники) Пер. с англ. Г. И. Кузнецова. Ред. и предисл. С. Б. Гуревича. М., «Мир», 1975. 206 с., ил.

[2] Ковалгин Ю.А. и др. Акустические основы стереофонии. - М.: Связь, 1978. — 336 с., ил.

[3] Л. М. Кононович, Ю. А. Ковалгин. Стереофоническое воспроизведение звука. — М.: Радио и связь, 1981 . - 184 с., ил.

[4] Haas, H. (1951). "Uber den Einfluss eines Einfachechos auf die Horsamkeit von Sprache, " Acustica, 1, 49—58.

[5] Звукорежиссура: Создание стереообраза. Краткий гайд.