Кто-то под новостями хай-энда понимает новодельную виниловую пластинку толщиной с пирог. Боб Стюарт, основатель Meridian Audio, с самого начала 80-х интересовался не фетишами, а вполне конкретными цифровыми технологиями, пускай и невидимыми в работе. DVD-Audio, DSP-колонки Meridian и вот — анонс формата MQA. «Мало вам DSD, опять новые декодеры заставят покупать» — уже слышен бубнеж скептиков. Однако попробуем разобраться, чего нам не хватало в классическом способе PCM и зачем сегодня понадобился еще один lossless.
Сохранить обертоны
В октябре 2014 года в Нью-йорке в рамках профессиональной выставки AES Convention был представлен доклад под названием «A Hierarchical Approach to Archiving and Distribution». В подстрочном переводе заголовок звучит немного дико — «Иерархический метод архивации и дистрибуции», но феодализм здесь ни при чем.
Если вы сравните записи 16 бит/48 кГц и 24 бит/96 кГц, вторая окажется более благозвучной. Это все знают. Но всякий, кто складировал аудио на хард-диске, в курсе, что увеличение разрядности, увы, кратно раздувает объем файла. 24-битовый трек займет в полтора раза больше места, чем на 16 бит. Если вы записываете звук с дискретизацией 96 кГц, то файл будет в два раза больше, чем на 48 кГц. Ну а для 192 кГц сами посчитаете. Один альбом, получается, потянет под 1,5, а то и 2 гигабайта, даже если его заархивировать во FLAC (т.е. уменьшить объем процентов на 40). При воспроизведении FLAC распаковывается в несжатый PCM-поток, который на 24/192 может достигать плотности передачи данных до 9,2 Мбит/с. Много это или мало?
У компакт-диска эта величина колеблется от 0,4 до 1,4 Мбит/с. Коллега DSD имеет 5,6 Мбит/с. Для DVD-изображения битрейт колеблется от 4 до 9,8 Мбит/с, но для цифрового телевидения стандартной четкости этот показатель гораздо ниже. Для Youtube и прочего стримвидео используют более эффективные кодеки типа H.264, позволяющие на 2,5 Мбит/с получить приемлемую HD-картинку разрешением 720p.
В любом случае битрейт стараются делать поменьше, потому что не каждый пользователь сидит на оптоволоконной линии. Словом, потому и интернет-радиостанции обходят идеи высокодискретного аудио десятой дорогой.
При этом спектр подобных HD-фонограмм, при всем к ним уважении, оказывается практически пуст более чем наполовину. Таковы издержки линейного метода кодирования PCM. Жалко места, но и обертона сохранить очень хочется!
Наши ученые-докладчики на AES Convention, а речь идет о Роберте Стюарте и его коллеге Питере Крейвене, обратили внимание, что формально динамический диапазон тех самых ультразвуковых обертонов крайне невелик. А значит, оцифровать аудиопоток можно нелинейным способом, на основе определенной математической модели.
Для демонстрации была приведена диаграмма музыкального фрагмента, записанного в максимальной разрядности 24 бит/192 кГц. Вертикальная ось графика Y отвечает за пиковый уровень музыкального сигнала и окружающего фонового шума, а горизонтальная X указывает на частоту полосы. В нашем случае, с частотой дискретизации 192 кГц, крайняя точка оси X имеет значение 96 кГц. С такими характеристиками мы зафиксируем полную картину происходящего при записи.
При этом на графике видно, что начиная с 55 кГц полезный сигнал практически сливается с шумом. Для иллюстрации примером послужил звук струнного оркестра, но Стюарт подчеркивает, что в целом все музыкальные исполнения укладываются в этот своеобразный «треугольник». Максимальная амплитуда сигнала наблюдается в басах и постепенно снижается до минимальных значений на ультразвуке. А теперь, внимание, — инкапсуляция!
Аудиооригами
В терминологии информатики и программирования инкапсуляция означает упаковку некой функции или данных в общем массиве. В нашем случае это выглядит следующим образом. C наивысшей частотой дискретизации 192 кГц оцифровывается лишь спектр свыше 48 кГц. Поскольку динамический диапазон сигнала здесь крошечный и едва отличается от шума, то и места оцифровка займет немного. Теперь этот участок просто переносится и включается (т.е. инкапсулируется) кодеком MQA в область ультразвуковых шумов между 24 и 48 кГц где-то ниже шумового порога, на уровне –130 дБ. Место абсолютно никому не нужное и не слышное, но, как видите, с помощью математики в нем можно прятать разные полезные вещи.
Что-то подобное проделывалось и на HDCD-дисках. Только тогда в шуме 16-битного сигнала кодировали данные четырех младших разрядов 20-битного аналогово-цифрового преобразователя. Здесь же мы имеем запись 24/96 с инкапсулированными полезными элементами из 24/192. Но и это еще не конец. Почему бы не сыграть в прятки еще раз?
В этот раз берем и кодируем участок от 24 до 48 кГц и прячем содеянное уже в базовую полосу ниже шумов квантования на –144 дБ. В итоге мы имеем аудиопоток с характеристиками 24 бит/48 кГц, из которого декодер MQA при воспроизведении восстановит весь хайрез с дискретизацией 192 кГц. Напоминает матрешку, но Боб Стюарт предпочитает японское прочтение этого феномена — «аудиооригами». Теперь только осталось дополнительно утрамбовать результат традиционным lossless-способом, как это делает FLAC и ему подобные компрессоры.
Аудиофильская функциональность
Таким образом, финальный продукт будет иметь битрейт чуть выше, чем у несжатого РСМ на компакт-диске. А с этим уже можно жить и распространять в реальном времени. При этом разработчик предусмотрел обратную совместимость. Файлы MQA воспроизведутся и без фирменных декодеров, просто будет отыгран лишь базовый поток 16 бит/48 кГц, а все потаенное отправится в дренаж. Собственно, аналогичный механизм действовал и с упомянутыми дисками HDCD. Их можно было слушать на обычных CD-плеерах, за вычетом магии фильтра Pacific Microsonics.
Остается надеяться, что проект Meridian не постигнет такая же судьба. Во всяком случае, главным козырем MQA являются даже не аудиофильские качества (о них поговорим ниже), а функциональность. Рекорд-компания теперь может не дублировать издание в нескольких форматах. В рамках одного-единственного файла MQA-пользователь получает возможность выбирать уровень качества. Одним из первых интерес к новинке Meridian проявил крупный британский медиасервис 7digital.
И еще один аспект, теперь уже звуковой. Сейчас пока рано судить, ведь кулик всегда свое болото похвалит. Роберт Стюарт настаивает, что в случае прямой конвертации в MQA процесс оцифровки и декодирования по переходным характеристикам максимально приближен к человеческому восприятию аналогового звука. Очевидцы презентаций Meridian говорят только хорошее о демозаписях в MQA. Надеемся, в ближайшее время и у нас появится возможность сравнить один и тот же фрагмент в MQA и в теперь уже «старом добром» РСМ 24/192.