Это — обзор технологии аудиокодека aptX и моего личного пути, раз уж спустя 28 лет я решил, что мне пора двигаться дальше. Но прежде чем углубляться в детали, я должен объяснить тесную связь aptX с моей профессиональной карьерой.
После окончания Университета Ольстера в Джорданстауне, Белфаст, в 1986 году я работал в Dolby Laboratories в Лондоне над форматом шумоподавления Dolby SR (Spectral Recording) и продуктами для кино. Я дважды сотрудничал с Dolby между 1987 и 1992 годами, это перемежалось периодами жизни в Австралии и работой с Ericsson над аналоговыми базовыми станциями сотовой связи.
В 1993 году, до заключения мирного соглашения в Северной Ирландии, я хотел вернуться в Ирландию. Это замечательная страна, а мир дал диаспоре надежду на возвращение домой. Audio Processing Technology Ltd. (APT) со штаб-квартирой в Белфасте предложила мне работу в службе поддержки клиентов — так и началась моя работа с aptX. Я занялся продажами в 1994 году и переехал в офис в Лос-Анджелесе, штат Калифорния, затем получил пост коммерческого директора в 2000 году, а позже, в 2005, вместе с Ноэлем Маккеной (Noel McKenna) стал совладельцем через выкуп акций (MBO).
Технология aptX была представлена на рынке в 1990 году в качестве APTX100ED — микросхемы DSP с программируемым ПЗУ. Она использовалась компаниями по автоматизации радио, а затем и DTS для воспроизведения объемного звука 5.1 в широкоэкранных кинотеатрах.
Сжатие данных
История сжатия цифровых аудиоданных началась в середине 80-х. В то время цифровые технологии вытесняли более традиционные варианты аналоговой записи, воспроизведения и передачи. Как только цифровая музыка стала доступной, возникла явная потребность в сокращении объема памяти и скорости передачи данных — это было связано с затратами на объемы памяти.
В то время лишь немногие технические пионеры могли разрабатывать алгоритмы сжатия звука: это были Джеймс Д. Джонстон (James D. Johnston) из Bell Labs, AT&T и Microsoft, и Стивен Смит (Stephen Smyth), а также такие структуры, как Институт Фраунгофера в Германии и японская корпорация Sony. Свое значительное влияние оказали Питер Крейвен (Peter Craven) и Малкольм Лоу (Malcolm Law) из Algol Applications, Ltd. По сути, все оригинальные и новаторские идеи в методах сжатия/декомпрессии звука (кодеках) восходят к этим именам.
Архитектура кодека развивалась в трех направлениях: адаптивной дифференциальной импульсно-кодовой модуляции (ADPCM), перцепционном и фрактально/вейвлетном. Кодек можно оценить по пяти ключевым показателям: коэффициенту сжатия, скорости передачи данных или объему памяти, качеству звука, задержке, мощности (MIP/память) и надежности (этот параметр можно улучшить с помощью дополнительных методов прямой коррекции ошибок — FEC).
Большинство коммерчески успешных кодеков, как правило, отвечают минимум трем из этих требований. В исходном кодеке aptX, в котором использовался ADPCM, учитывались задержки, качество звука и надежность. Несмотря на то, что он в небольшой степени требователен к MIP, он не требователен к объемам оперативной памяти.
Чрезмерная зависимость от скорости передачи данных была компромиссом между задержкой и использованием в реальном времени. И наоборот, MP2 (MPEG-1 Audio Layer II с использованием методов перцепционного кодирования), который в то время был новым кодеком Fraunhofer (еще до MP3 или MPEG-1 Audio Layer III), предлагал исключительную скорость передачи данных и эффективность MIP, но за счет сниженных задержки и качества звука.
Правда, возможность втиснуть больше музыки в меньшее пространство привлекала независимо от последствий. В свою очередь, Sony и Meridian Lossless продвигались вперед с ATRAC и Algol, которые в конечном счете превратились в Dolby Lossless/TrueHD.
Как я уже сказал, мое сотрудничество с APT началось в Белфасте в мае 1993 года — почти через неделю после того, как Стивен Смит ушел в DTS, где он впоследствии разработал алгоритм Coherent Acoustics. Стивен вместе со своим братом Майком и коллегой Полом Смитом (Paul Smith) создали APT, Ltd. в 1988 году, используя стартовый капитал от QUBIS (подразделение коммерциализации Королевского университета в Белфасте) и Solid State Logic (SSL).
Стивен защитил докторскую по сжатию цифровых аудиоданных, где G.722 (широкополосный голосовой кодек — прим перев.) частично рассматривался как 14-битный голосовой алгоритм с двумя поддиапазонами и был преобразован в 16-битный музыкальный кодек с четырьмя поддиапазонами (aptX100). Эти инвестиции в APT позволили команде сооснователей создать чип, известный как APTX100ED, использовавший масочное ПЗУ от AT&T.
Стивен перевез свою команду в Калифорнию и оказался в эпицентре продвижения DTS на рынок бытовой электроники. Результатом стало то, что DTS продолжала использовать чип APTX100ED в своих продуктах для кинотеатров, в первую очередь из-за низкой задержки доступа к сохраненному контенту, обеспечивавшей синхронизацию между звуком и фильмом. Мощный толчок развитию DTS и aptX100ED дал Стивен Спилберг, использовав этот формат для своих фильмов — в том числе для франшизы «Парк Юрского периода» и «Спасти рядового Райана».
Тем временем в APT в Белфасте разрабатывался ряд продуктов для радио и голосовой связи, ADR (озвучивания фильмов — прим перев.) и стереомиксов. Продажи чипов APTX100ED OEM-производителям индустрии радиовещания продвигались очень хорошо. Чип также встраивался в звуковые карты ПК, которые продавались поставщикам систем воспроизведения для автоматизации радио. В то время в компании работало около 30 сотрудников, годовой оборот составлял около 3 млн фунтов стерлингов, и она только что получила Королевскую награду за достижения в экспорте. Наследие Стивена Смита и его соратников держало APT на плаву еще пять лет, прежде чем начало сказываться отсутствие инноваций.
К концу 1990-х годов давление усилилось еще больше, когда AT&T/Lucent объявила об «окончании срока эксплуатации» чипа APTX100ED наряду с уменьшением стоимости дискового пространства, поскольку закон Мура делал свое дело. Отсутствие жизнеспособной альтернативы чипу в сочетании с насыщенным рынком VO (Voiceover, наложение голоса — прим перев.)/ADR и переходом систем радиоавтоматики на Linear PCM рисовало не самые приятные перспективы.
Корпоративная деятельность с SSL и отсутствие возможности постоянно производить стабильные и рентабельные продукты для радиоиндустрии также стали факторами сокращения компании. Все это достигло апогея в 2004 году, когда SSL перешла под внешнее управление. Контрольный пакет акций APT был выкуплен с использование венчурного капитала Crescent Capital в Белфасте и Trinity Venture Capital в Дублине. Мы начали переговоры с SSL о выкупе в январе 2005 года. В марте 2005 года была зарегистрирована компания APT Licensing, Ltd.
От вещания к Bluetooth
APT всегда была прибыльной, и при новом руководстве тремя ключевыми задачами стали создание аппаратных устройств, отвечающих потребностям рынка вещания, развитие лицензирования и создание новых аудиокодеков. Учитывая то, что эти технологии использовались в радиоиндустрии для критически важных приложений (например, связи между студией и передатчиком, между сетью станций и удаленными устройствами, а также для внешнего вещания), особенно важно было построить сверхнадежный ассортимент продуктов с взаимозаменяемыми устройствами и гарантировать, что «мертвого эфира» не будет никогда.
Правильное выполнение этого условия при одновременном переходе от синхронных к IP-сетям позволило APT стать на путь восстановления. Победа в тендере Европейского вещательного союза (EBU) на объединение в сеть всех государственных вещательных компаний ЕС для стереоконтента и контента 5.1 открыла новые возможности — и компания вернулась в игру, к конкурентной борьбе.
Лицензионный бизнес также развивался, но был полностью сосредоточен на профессиональном использовании. Компания Sennheiser (которая работала с aptX в области цифровых беспроводных микрофонов) предложила интересную задачу от своего подразделения бытовой электроники: попросила APT изучить развивающийся рынок Bluetooth, поскольку существующий кодек поддиапазона низкой сложности (например, SBC) не удовлетворял их требованиям. В 2008 году Sennheiser представила свое первое Bluetooth-устройство на выставке CES, и APT получила награду «Лучшее из устройств Bluetooth» от комитета CES.
Для APT, имевшей к 2009 году примерно 60 сотрудников, оборот 6 миллионов фунтов стерлингов и многочисленные награды за инновации и рост, необходимость расширения и развития была очевидна. APT была разделена на две компании — APT Hardware Limited и APT Licensing, Ltd. В 2009 году APT Hardware была продана французской Audemat (сегодня часть WorldCast Group), а вырученные средства были возвращены первоначальным инвесторам.
Компания APT Licensing, Ltd. продолжала заключать сделки с Apple, Motorola, Nokia и Microsoft, а в 2010 году ее приобрела Cambridge Silicon Radio (CSR PLC). CSR была пионером интегрированных платформ Bluetooth и процессинга. Ее подход ускорил развитие Bluetooth сначала для голосовой связи, а затем и для передачи музыки.
В течение следующих нескольких лет команда CSR aptX добилась успеха в области Bluetooth, завоевав рынок мобильных телефонов Android и OEM-производителей гарнитур — те с готовностью воспользовались кодеком, в первую очередь из-за его точного воспроизведения качества звука и низкой задержки. Оригинальный классический aptX был дополнен кодеком aptX HD, в котором качество звука было выросло с 16 бит/44,1 кГц до 24 бит/48 кГц. Кроме того, была введена программа функциональной совместимости, согласно которой каждый OEM-производитель, следуя рекомендациям, гарантирует потребителям стабильную работу устройств.
В 2015 году CSR была приобретена компанией Qualcomm, выдвинувшей стратегию объединения гарнитур и наушников для оптимального качества воспроизведения музыки, видео и игр с помощью интеграции, известной как Q2Q (от Qualcomm к Qualcomm). Это способствовало развитию aptX с запуском в 2018 году aptX Adaptive, поддерживающего 24-бит/96 кГц, а также aptX Voice для сверхширокополосной передачи голоса в дополнение к VoLTE для сетей 4G и 5G.
Кодек aptX Adaptive предусматривал динамическую подстройку битрейта, сочетая в себе функции aptX с малой задержкой, классического aptX или aptX HD, в зависимости от контента и подключения.
Кульминацией этого технического путешествия стала возможность передачи звука в CD-качестве без потерь с кодеком aptX Lossless благодаря улучшенной пропускной способности передачи данных, результата сочетания Qualcomm High Speed (QHS) и масштабируемости aptX Adaptive. Представленная в 2021 году технология aptX CD Lossless обеспечивает побитовую точность в сравнении с исходным Linear PCM, расширяя возможности, доступные для беспроводного аудио Bluetooth, сочетая кодек, беспроводную связь и оптимизацию радиочастот. Bluetooth теперь подходит для музыки.
«Никто за столом не остался голодным»
Кульминацией моего профессионального пути стало включение aptX в состав Snapdragon Sound, который решает вопросы качества звука, задержки и стабильности связи за счет объединения кодека aptX с модуляцией QHS Link. Между aptX и Snapdragon Sound было подписано более 1 000 лицензионных соглашений, и aptX используется более чем в 12 миллиардах устройств — мобильных телефонах, ПК (как Microsoft, так и Mac), гарнитурах, наушниках, колонках, саундбарах, телевизорах, автомобилях и даже в проигрывателях винила.
Есть даже детекторы утечки металла и воды, использующие aptX через Bluetooth. Если учитывать профессиональное использование в сфере радио и озвучивания, цифровые беспроводные микрофоны и успешный выход в сектор безопасности, распространение aptX выглядит очень масштабным.
После всего вышесказанного баланса ради стоит отметить, что не все так сладко. Bluetooth SIG работает медленно, но существует большая вероятность того, что решение Bluetooth Low Energy (BLE) с LC3 подойдет для решения задач, связанных с малой задержкой, и с точки зрения воспроизведения звука он должен стать намного лучшей заменой классическому Bluetooth SBC.
Fraunhofer дополнит передачу звука с помощью LC3+, чтобы снова повысить ее качество. Если учесть LDAC и LHDC, то этот период можно считать золотой эрой кодирования звука с точки зрения разнообразия. И чем нужно заняться (и чем Qualcomm занялся), так это тестированием совместимости этого разнообразия по трем основным компонентам: качество звука, задержка и стабильность соединения. На это потребуются время и инвестиции, но усилия будут того стоить с точки зрения обеспечения ценности бренда.
Я надеюсь, что мой личный путь в будущем будет столь же интересным, разнообразным и успешным, как и в прошедшие 28 лет. Работая над аудиосетями для радио прежде чем заняться Bluetooth, я понимаю, что последней частью головоломки станет создание и получение контента. Учитывая проблему, связанную с радиосвязью — диапазон 2,4 ГГц заполнен просто огромным количеством устройств, — возможно, стоит задуматься над улучшением конструкции антенны, особенно с учетом уменьшения габаритов наушников, что в итоге приведет к проблемам с блокированием волн и радиусом действия. Объединение знаний о кодеках и радиочастотах может помочь в создании некоего цифрового беспроводного микрофона для новостей, музыки и голоса.
Об авторе
Джонни МакКлинток (Jonny McClintock) проработал в аудиоиндустрии более 30 лет, большую часть этого времени он занимался маркетингом и продажей aptX. Недавно он покинул Qualcomm и в настоящее время является коммерческим директором AntennaWare (nехнология переносных антенн) Made To Wear и работает консультантом в Sonical.ai. Его страсть — запуск стартапов.
Оригинал: The Story of aptX: An Epic Journey