Альянс открытых медиа (AOMedia) недавно официально выпустил первую окончательную версию спецификации 1.0.0 стандарта кодирования видео AV2, отметив, что это новое поколение бесплатного формата кодирования видео с открытым исходным кодом, считающееся преемником AV1, вступило в стабильную стадию, что позволяет отрасли разрабатывать совместимые со стандартом кодеры и декодеры и выполнять долгосрочную оптимизацию вокруг фиксированных спецификаций, не беспокоясь о проблемах совместимости, вызванных будущими версиями. Ожидается, что AV2 позволит еще больше сжать скорость передачи данных и снизить затраты на полосу пропускания при потоковом мультимедиа и видео сверхвысокой четкости. Однако инсайдеры отрасли также предупреждают, что сложность его декодирования намного выше, чем у существующего AV1, и он столкнется со значительными проблемами в поддержке терминальных устройств и аппаратном ускорении.

Компания AOMedia была основана в 2015 году. Стандарт кодирования AV1, выпущенный в 2018 году, был разработан как бесплатный видеоформат, способный конкурировать с H.265 (HEVC). После нескольких лет развития, хотя его популярность и не была быстрой, он постепенно закрепился в онлайн-видео и облачных видеосервисах. YouTube экспериментирует с кодированием AV1 с 2018 года, после чего Netflix представил потоковую передачу AV1 в своем мобильном приложении для Android в 2020 году, а Amazon запустила поддержку кодирования AV1 в реальном времени через медиасервисы AWS Elemental в 2024 году. В то же время такие производители, как AMD, Intel и NVIDIA, последовательно добавили ускоренную поддержку декодирования и кодирования AV1 в свое оборудование и драйверы, благодаря чему возможности воспроизведения этого формата на терминале постепенно становятся более совершенными.

По сравнению с AV1, основным преимуществом AV2 является значительное снижение скорости передачи данных при тех же субъективных условиях качества изображения. Согласно официальным оценочным данным, опубликованным AOMedia, при различных объективных показателях (таких как PSNR и т. д.) AV2 может достичь среднего снижения скорости передачи данных примерно на 30–34 % по сравнению с AV1, сохраняя при этом то же качество изображения. Для платформ потокового мультимедиа это означает, что, обеспечивая удобство просмотра для пользователя, AV2 может осуществлять передачу видео того же качества с меньшей пропускной способностью, тем самым еще больше сокращая затраты на распространение контента. Экономия полосы пропускания и объема хранилища будет еще более значительной, особенно в сценариях видео с высоким разрешением и расширенным динамическим диапазоном, таких как 4K, 8K и HDR.

Сравнение, предоставленное AOMedia, показывает разницу в точности сжатия между AV1 и AV2 с точки зрения пикового отношения сигнал/шум (PSNR). PSNR — это широко используемый математический индикатор, который измеряет разницу между сжатым видеоизображением и исходным сигналом. Более высокие значения обычно означают, что сохраняется больше деталей. В этих тестах AV2 смог выводить со значительно более низкой скоростью передачи данных при тех же условиях PSNR, что отражает комплексное обновление инструментов и алгоритмов кодирования.

Для достижения вышеупомянутых преимуществ сжатия AV2 представляет ряд улучшений в технологии кодирования, включая более совершенные методы внутрикадрового и межкадрового прогнозирования, более сложное моделирование движения, более сложные инструменты преобразования и фильтрации, более гибкую структуру разделения блоков и модернизированный механизм энтропийного кодирования. Эти изменения увеличивают размер принятия решений и свободу алгоритмов на стороне кодирования, позволяя кодировщику более точно соответствовать характеристикам видеоконтента, тем самым сжимая больше избыточной информации при том же качестве изображения.

Однако за более высокую эффективность сжатия приходится платить. По оценке руководителя проекта VideoLAN Жана-Батиста Кемпфа, вычислительная сложность AV2 на стороне декодирования значительно возросла по сравнению с AV1. В настоящее время подсчитано, что сложность декодирования AV2 примерно в пять раз превышает сложность декодирования AV1, что затруднит плавное декодирование видео AV2 с помощью чистого программного обеспечения для большого количества существующих процессоров. В отсутствие широкой поддержки аппаратного ускорения декодирования обычные терминальные устройства могут оказаться не в состоянии выдержать дополнительную нагрузку, создаваемую AV2 с точки зрения энергопотребления, тепловыделения и плавности, что замедляет его реализацию в браузерах, ТВ-боксах и мобильных устройствах.

По этой причине Кемпф считает, что до того, как основные чипы и платформы обеспечат полное аппаратное ускорение AV2, все еще существует много неопределенностей в перспективах широкомасштабного внедрения этого стандарта. Другими словами, сможет ли AV2 повторить путь разработки AV1 и быть фактически развернут на крупных платформах потокового мультимедиа, таких как YouTube, Netflix и Amazon, во многом будет зависеть от того, захотят ли и когда производители процессоров, графических процессоров и SoC выделить на него достаточные ресурсы аппаратной поддержки.

В настоящее время, с официальной реализацией спецификации AV2 1.0.0, AOMedia и ее члены уже могут способствовать внедрению и оптимизации кодеров, декодеров и связанных с ними цепочек инструментов разработки в соответствии с единым стандартом. В отрасли обычно ожидают, что в ближайшие несколько лет экспериментальная поддержка AV2 впервые появится в плеерах с открытым исходным кодом, экспериментальных версиях браузеров и некоторых службах облачного транскодирования. Реальным коммерческим приложениям для массовых пользователей все еще приходится ждать, пока аппаратная экосистема созреет и станет массовым контент-платформой, чтобы обеспечить более четкие пути внедрения.