Отделяем главное от второстепенного в измерениях и узнаем, во сколько раз МР3 хуже оригинала.
Один нехороший человек как-то сказал в 1940-м году: «У каждой ошибки есть имя и фамилия». Да, автору цитаты лучше бы вообще не рождаться, но в данном случае утверждение абсолютно точное и нужное. Если вам что-то не нравится в аудиосистеме или фонограмме, значит где-то схалтурило слабое звено. Поплыла фаза, выросли искажения, да что угодно.
На протяжении своих вопросов к аудио я всегда инстинктивно доверял отчетам, в которых присутствовали хоть какие-то измерения. Оно и понятно. В какой-то момент понимаешь, что любое авторское красноречие не подразумевает никакой ответственности. Я так слышу! Ок, может быть, и слышишь, но перефразируя другого человека, — «хватит слышать мир ушами Сенкевича».
Нам нужна определенная метрологическая сетка, которая в связке с субъективным опытом эксперта позволяет воссоздать более-менее реалистичную картину аудио опыта, выявить определенные закономерности. А если измерили и ничего не нашли, значит, не там искали.
Впрочем, благая идея технических тестов также может оказаться объектом манипуляций. Производитель ЦАПа приводит красивые цифры без учета влияния остальной обвязки — т.е. не меряет, а просто копирует даташит самого чипа. Другой производитель наушников за три копейки рисует сумасшедшие горизонты инфрабаса и ультразвука, недоступные даже напольникам за миллион. Разумеется, без указания неравномерности АЧХ. Кстати, с нее вот и начнем — с неравномерности АЧХ и трюков с графиками.
В этом исследовании нам помогут несколько маленьких друзей различной стоимости. Самым дорогим компонентом является блок АЦП, который отвечает за приведение в цифровой вид внешнего тестового сигнала от компонента. PCI-аудиокарта LynxTwo появилась еще в 2000-м году, но до сих пор мало кто превзошел ее в точности. И если полевые записи я выполняю портативным рекордером Sony PCM-D100, то всю домашнюю работу, в частности, архивацию винила, я доверяю именно LynxTwo. Пишет практически один в один. В принципе, можно использовать и карту попроще, но следует понимать, чтобы характеристики тестируемого не превысили возможности АЦП, после этого объективность теста теряет смысл.
Сгенерировать нужный тестовый сигнал и проанализировать его девиации на звучании компонента мне помогает программа RightMark Audio Analyzer (RMAA). Вообще-то чаще всего ее пользуют бесплатно, но мне не жалко было перечислить за труды разработчикам 1600 рублей и получить так называемую PRO-версию с незначительным расширением настроек.
Источником звука в этот раз будет банальный iPad mini первого поколения. Обычная походная вещица, которая тем не менее преподала несколько любопытных поводов для размышления.
До начала тестов программа RMAA сгенерировала тестовый WAV-файл в размерности 16 бит/44 кГц — т.е. аудиопоток в той же разрядности, что и 99,99% коммерческих фонограмм. Да, это не музыкальный трек, но сам он содержит различные мультитоны и прочие специальные импульсы, позволяющие определить пределы возможностей аудиоисточника. Загружаем и воспроизводим WAV на iPad, подключенном к линейным входам карты LynxTwo в режиме записи. Далее RMAA математически рассчитывает величины отклонений этой записи относительно эталонной модели и строит графики. Итак, смотрим АЧХ.
![](http://img.stereo.ru/YG/d41935c9a5b0e1c71d83bba3f4987b57.png)
Эти два таких непохожих графика на самом деле описывают один и тот же результат измерения аудиовыхода iPad mini. Обратите внимание на вертикальную шкалу дБ. Согласно полученным данным, лишь в конце полосы 20 Гц – 20 кГц наш айпад демонстрирует снижение отклика всего на минус 0,23 дБ. Если растянуть вертикальную шкалу на сотню дБ (на первом графике) то АЧХ сделается просто ровной линией. А если масштабировать вертикальную шкалу до десятых долей децибел (на втором графике), да еще горизонтальный отсчет вести от нуля, то получится вот такой унылый горбик. Угадайте, какой масштаб предпочтут в маркетинговом отделе?
К слову сказать, Apple при всех своих сектантских заморочках никогда не тыкала в нос красивыми цифрами. А они у iPad действительно выглядят неплохо, как мы убедимся ниже. И все же, в каком масштабе следует оценивать график АЧХ?
Поскольку речь идет не об измерении колонок в реальной комнате, где перепады полос могут достигать 10 дБ, то для слаботочных источников вполне достаточно будет плюс-минус 3 дБ. А для сильно любопытных можно уменьшить вертикальную шкалу до 1 дБ. И что же мы видим?
Мы видим отличный результат, абсолютно адекватная характеристика АЧХ. Мягкий спад отклика начиная с 10 кГц свидетельствует о применении фильтра с минимальной фазой. С форматом Red Book всегда так. Приходится выбирать что-то одно в приоритете — либо фазу, либо абсолютную линейность АЧХ. Можно было обеспечить «линейку» вплоть до 22 кГц, но тогда перед импульсом появился бы паразитный «звон» на фронте. А все из-за того, что как-то надо фильтровать зеркальные помехи квантования, которые могут влиять на полезный сигнал в районе высоких частот. Apple выбрал заботу о фазе, и это решение вполне в русле современных взглядов на цифровое звукоизвлечение. Посмотрим на остальные данные замеров RMAA.
Уровень шума у iPad mini составил минус 96,9 дБ. Фактически динамический диапазон 16-битного сигнала отработан полностью. Взаимопроникновение каналов и искажения также держатся на минимальном уровне.
![](http://img.stereo.ru/YG/734e0fd45b9908582c33cb66f2110bf2.png)
Закодируем WAV в лосслесс и повторим замер. По цифрам ничего не изменилось, да и на слух тоже. Привет всем, кто утверждает, что несжатый PCM звучит «свободнее» лосслесса. По крайней мере, не на этом планшете.
Теперь, памятуя, что среди хайрезов большую долю составляют релизы 24 бит/44 кГц, проверим iPad mini соответствующим аудиопотоком. Характер и неравномерность АЧХ остались прежними, а показатели динамического диапазона и искажений сделались еще лучше.
![](http://img.stereo.ru/YG/8523c617b859ea4544d2fe1033d50197.png)
Выходит, что внутренний эпловский ЦАП (Cirrus-Logic 338S1213) в состоянии обрабатывать 24-битовый код без транкейта до 16 бит. Между прочим, многие портативные устройства с аудиофильской претензией, включая мой Audioquest Dragonfly Black, демонстрируют куда больше искажений. И если честно, то айфона и Tidal Hi-Fi будет достаточно, чтобы обеспечить звук достаточного качества, где бы вы не оказались. Цепляйте мини-джек на аудиосистему — и все будет в порядке.
Конечно, реальное разрешение аудиовыхода iPad, согласно измеренному динамическому диапазону (т.е. разницей между уровнем шума и максимальной амплитудой сигнала), составит 104/6 = 17 бит. Всего один бит прибавки, вроде бы совсем немного, да?
Но поверьте, 24 бит х 6 = 144 дБ. Таких цифр не обеспечит ни одно реальное устройство! У LynxTwo этот показатель составляет около 115 дБ (т.е. 19 бит), а самые современные и навороченные конвертеры еле-еле обеспечивают 20-битное разрешение, т.е. 120 дБ на аудиовыходе.
Теперь попытаемся оценить, насколько деградирует сигнал, когда его сжимают lossy-кодеками для интернет-трансляции и других задач, где экономия стоит на первом месте. Можно сказать, что измерения в данном случае абсурдны, т.к. психоакустическая модель MP3-кодера с музыкальным сигналом работает иначе чем с генерированными синусами. Разумеется, не существует и фонограмм с динамическим диапазон 90 или более децибел. Но, как было сказано, технические сигналы позволяют нам понять рамки формата, пределы его возможностей, выше которых уже не прыгнуть.
Исходник RMAA был закодирован в несколько типичных битрейтов — 320, 192, 160 и 128 кбс. Ну, «типичных» — это еще преувеличение. Я использовал LAME 3.99 с установкой 0 — т.е. максимального качества кодирования в ущерб времени, отводимого на задачу. Учитывая, насколько не парятся по этому поводу остальные граждане, реальные величины искажений будут еще больше.
Итак, MP3 320 кбс, самая мажорная установка insane — и уже какая-то трясучка по всей АЧХ.
![](http://img.stereo.ru/YG/2624d2150f54c666295068d5070e2afe.png)
![](http://img.stereo.ru/YG/7f8a084237be8c04be2136792e39f624.png)
Динамический диапазон и разделение каналов не изменились, а вот интермодуляционные искажения + шум выросли более чем в два раза. Да, пока формально они остаются достаточно низкими. Но не забывайте, что впереди у такого сигнала — каскады усиления и колонки со своей кривизной, где все эти девиации будут только мультиплицироваться новыми кругами ада.
Следующий образец на 192 кбс (этот битрейт считается «хорошим качеством» для интернет-радио и видеострима) более откровенен в своем бесстыдстве.
![](http://img.stereo.ru/YG/591dfe4aa76b970523c5be7ec674d0ad.png)
![](http://img.stereo.ru/YG/7d642481039aa1925d0eed32fff70b87.png)
Здесь спектр отсекается на 18 кГц, но полагаю, что на реальном музыкальном сигнале психоакустическая модель будет периодически выгрызать куда большие куски. Теперь вместо интермодуляционных искажений начали стремительно расти гармонические + шум. Немного стал меньше динамический диапазон — это уже меньше теоретических 16 бит.
Образец 160 кбс уже просто вопиет. Гармонические и интермодуляционные искажения с шумом выглядят крайне неприглядно. Динамический диапазон опустился до 15 бит. Только радует низкий уровень взаимопроникновения каналов, который практически стоит на месте. Здесь хоть joint stereo отключен или включен?
![](http://img.stereo.ru/YG/01b87ce8ec50b229095faff1fe2803f1.png)
![](http://img.stereo.ru/YG/a9b1bd6487d1e0c10e460e5dfe15e8ae.png)
Файл 128 кбс демонстрирует еще большие безобразия, хотя и не такие страшные, как ожидалось при снижении битрейта с 160 кбс. На один децибел стал ниже динамический диапазон — теперь это меньше 15 бит. Секрет мягкого звука как у легендарных «филипсов» на TDA1540 (ха-ха, ладно, извините за шутку). Все-таки уровни искажений для нас важнее любых битов. Теперь одни только интермодуляционные искажения + шум выше в 25 раз чем в оригинале. При этом размер самого МР3 на 128 кбс оказался в 11 раз меньше WAV-оригинала и в два раза меньше чем лосслесс во FLAC или ALAC. Вот такая экономика для экономных.
![](http://img.stereo.ru/YG/c0d08fa4d6f24408cb25175a55cead42.png)
![](http://img.stereo.ru/YG/575d2fefd36c84cc057fc64955a8bcf3.png)