За редкими исключениями, все аудиофилы отстаивают необходимость записи и исполнения музыки в форматах Hi-Res — на радость себе и будущим поколениям слушателей. И все же некоторые представители сообщества, а с ними и большинство обыкновенных любителей музыки, предпочитают довольствоваться CD. Они утверждают, что отличить CD-качество от хайрезов — попросту невозможно. И до недавнего времени научных свидетельств обратного практически не существовало.

Не то что бы попыток разобраться в вопросе не предпринималось. В соответствующих изданиях выходило немало исследований, пытавшихся расслышать повышение частоты дискретизации и изменение битовой глубины. Результаты выходили неоднозначными.

В 2016 году Джошуа Райс (Joshua Reiss) из Лондонского университета королевы Марии опубликовал сводные результаты 18 подобных исследований, в общей сумме включившие в себя более 400 участников и 12 500 испытаний. Райс пришел к выводу, что эксперименты «показали небольшую, но статистически значимую способность испытуемых различать Hi-Res-контент, притом значительно возраставшую после прохождения надлежащей подготовки». Тем не менее, некоторые сочли исследование предвзятым в плане отбора данных, а доказательства — соответственно, слабыми. (Подробнее об этом — по ссылке)

На прошедшем в октябре 2019 года в Нью-Йорке заседании Аудиотехнического Общества (Audio Engineering Society) Юки Фукуда и Шунсуке Ишимицу из общественного университета Хиросимы представили собственные результаты. Они ясно показывают, что человек может различать звуки, закодированные и воспроизведенные с разными частотами дискретизации. Эксперименты японских ученых отличались от всех предыдущих одним принципиальным образом: вместо того, чтобы предлагать подопытным слушать музыку в разном качестве, здесь использовались тестовые сигналы.

В частности, были задействованы две разновидности спектрально «плоских» сигналов: белый шум и гауссовские импульсные сигналы. Оба вида имеют широкополосный контент: отличие в том, что в случае с импульсами все частотные компоненты коррелируют во времени, тогда как для белого шума фаза различных компонентов оказывается случайной.

Японская Ассоциация Индустрии Электроники и Информационных Технологий (JEITA) определяет «CD-формат» как имеющий частоту дискретизации до 48 кГц и битовую глубину, равную 16. Все, что выше этих значений — называется High Resolution. Во всех своих тестах японские исследователи использовали битовую глубину 16 — так что данные с низшей частотой дискретизацией классифицировались как CD-качество, а остальные попадали в группу хайрезов.

Фукуда и Ишимицу использовали тестовые сигналы с белым шумом и гауссовскими импульсами на частотах 48 кГц, 96 кГц и 192 кГц. В эксперименте участвовало семь молодых людей: их средний возраст составил 22 года. ABX-сравнение было проведено между 48 и 96 кГц, 48 и 192 кГц, 96 и 192 кГц. Затем на другой семерке испытуемых была применена иная методология тестирования — MUSHRA (MUltiple Stimuli with Hidden Reference and Anchor). В первом тесте участвовало две женщины, во втором — одна. В обоих случаях были задействованы как наушники, так и колонки.

В сетапе использовали довольно скромные однодрайверные (а следовательно, синхронизированные по времени) компьютерные колонки Eclipse TD-M от японского производителя Fujitsu Ten. Эта модель больше не выпускается, ранее же продавалась по цене в 1 300 долларов за пару. Она способна принимать цифровой сигнал по USB или Wi-Fi, но для экспериментов использовали аналоговый 3,5-мм стереовход. Также задействовали ЦАП Fostex HP-A4BL ценой в 600 долларов (может стоить и менее 500 на вторичке).

Для минимизации искажений использовали линейно-фазовый фильтр быстрого спада. В качестве наушников выбрали Sennheiser HD 650. Испытания проводились в безэховой камере.

При применении биномиального теста (общее значение p<0,05 — то есть вероятность случайного результата составила менее 5%) все кроме одного ABX-теста дали уверенно положительный результат при значениях p значительно ниже 0,05. Наиболее успешными оказались испытания с гауссовыми импульсами и колонками: во всех подобных тестах значение p не превышало 0,0001. Результаты MUSHRA-теста, обработанные при помощи двустороннего анализа ANOVA, с меньшей уверенностью, однако же подтвердили «возможность различения аудиоданных разрешения Hi-Res».

В кратком электронном письме Фукуда сообщил, что впоследствии они собираются исследовать возможности различения битовой глубины 16, 24 и 32 бита при частоте дискретизации 48 кГц.

Кроме того, было бы неплохо увидеть результаты теста с испытуемыми старшего возраста (и, вероятно, менее острым слухом в области высоких частот) и с различными колонками, чтобы определить, какие особенности акустических систем важны для опознания хайрезов — такое исследование может в значительной мере повлиять на решения конструкторов громкоговорителей.

К тому же, можно было бы провести подобное исследование в обыкновенном помещении — и выяснить, слышны ли различия в домашней обстановке или только в безэховой камере. Также мне бы хотелось увидеть личные отзывы испытуемых, их субъективные впечатления от прослушивания. Что именно они распознали в хайрезах, то есть — что может служить субъективными характеристиками для аудио высокого разрешения?

Наконец, после испытаний на тестовых сигналах можно предложить слушателям специфично отобранные музыкальные семплы (например, различную перкуссию, напоминающую гауссовские импульсы), а затем постепенно перейти на полноценные музыкальные композиции. Только после этого мы сможем с уверенностью определить субъективные характеристики для аудио высокого разрешения, полностью удовлетворив всех скептиков.

Оригинал: Hi-Rez Audio Distinguished in Blind Testing