По оценкам математиков из Disney Research и Калифорнийского университета, компрессия видео на основе искусственного интеллекта может стать более перспективным вариантом, чем существующие технологи, применяемые в видеокодеках. Если точнее, то искусственный интеллект, обрабатывая видео, позволит получить лучшее качество при том же объеме информации на один пиксель. Для этого сравнивались результаты самообучающейся системы с ИИ и современного алгоритма кодирования-декодирования H.265.
Эффективность видеокодека оценивали по тому, насколько хорошо он предскажет содержимое следующего кадра, минимизируя объем обработки промежуточных данных. Современные алгоритмы сжатия основаны на определении линейных смещений небольших фрагментов изображения в следующем кадре по отношению к предыдущему. Нейронные сети ИИ, наоборот, используют основную динамику видео, опираясь на большие наборы данных. И достижения в области глубокого обучения ИИ показали перспективность технологии.
Руководитель исследований, Стефан Мандт (Stephan Mandt), рассказал, что их алгоритм сжатия использует технику, основанную на искусственном интеллекте и называемую «глубокой генеративной моделью». Она призвана «угадать» следующую сжатую версию изображения с учетом того, что было раньше. Такое сжатие применяется к массиву данных, описывающих изображение, предполагая повышенную точность его восстановления. Нейронная сеть максимально точно предусматривает возможные изменения в следующем кадре, благодаря применению самообучения.
«Поскольку для восстановления сжатого таким образом видео, приемнику также требуется обученная нейронная сеть, вам нужно будет подумать о том, как передать ее вместе с данными, — объяснил Мандт. — Тут есть еще много открытых вопросов».
Пока исследования находятся на очень ранней стадии. Но участие в них Disney говорит о том, что они максимально ориентированы на практический результат.