La Alliance for Open Media (AOMedia) lanzó recientemente oficialmente la primera versión de especificación final 1.0.0 del estándar de codificación de video AV2, lo que marca que esta nueva generación de formato de codificación de video de código abierto y libre de regalías, considerado como el sucesor de AV1, ha entrado en una etapa estable, lo que permite a la industria desarrollar codificadores y decodificadores compatibles con el estándar y realizar optimización a largo plazo en torno a especificaciones fijas, sin tener que preocuparse por los problemas de compatibilidad causados ​​por versiones futuras. Se espera que AV2 comprima aún más la tasa de bits y reduzca los costos de ancho de banda en escenarios de transmisión de medios y video de ultra alta definición. Sin embargo, los expertos de la industria también advierten que su complejidad de decodificación es mucho mayor que la del AV1 existente, y enfrentará desafíos considerables en el soporte de dispositivos terminales y la aceleración de hardware.

AOMedia se fundó en 2015. El estándar de codificación AV1 lanzado en 2018 fue diseñado como un formato de vídeo libre de regalías que puede competir con H.265 (HEVC). Después de varios años de desarrollo, aunque su popularidad no es rápida, poco a poco se ha ido afianzando en los vídeos online y los servicios de vídeo en la nube. YouTube ha estado experimentando con la codificación AV1 desde 2018, seguido de Netflix introduciendo la transmisión AV1 en su aplicación móvil Android en 2020, y Amazon lanzando soporte de codificación AV1 en tiempo real a través de los servicios de medios AWS Elemental en 2024. Al mismo tiempo, fabricantes como AMD, Intel y NVIDIA han agregado sucesivamente soporte acelerado para la decodificación y codificación AV1 en su hardware y controladores, haciendo que la experiencia de reproducción terminal de este formato madure gradualmente.

En comparación con AV1, el principal punto de venta de AV2 es reducir significativamente la velocidad de bits en las mismas condiciones subjetivas de calidad de imagen. Según los datos de evaluación oficiales publicados por AOMedia, bajo diferentes indicadores objetivos (como PSNR, etc.), AV2 puede lograr una reducción de la tasa de bits promedio de aproximadamente 30%-34% en comparación con AV1, manteniendo la misma calidad visual. Para las plataformas de streaming de medios, esto significa que, al tiempo que garantiza la experiencia de visualización del usuario, AV2 puede completar la transmisión de vídeo de la misma calidad con menor ancho de banda, comprimiendo así aún más los costos de distribución de contenido. Especialmente en escenarios de vídeo de alta resolución y alto rango dinámico, como 4K, 8K y HDR, el ahorro de ancho de banda y almacenamiento será aún más considerable.

La comparación proporcionada por AOMedia muestra la diferencia en la fidelidad de la compresión entre AV1 y AV2 en términos de relación señal-ruido máxima (PSNR). PSNR es un indicador matemático de uso común que mide la diferencia entre la imagen de video comprimida y la señal original. Los valores más altos generalmente significan que se conservan más detalles. En estas pruebas, AV2 pudo generar una velocidad de bits significativamente menor en las mismas condiciones PSNR, lo que refleja su actualización integral en herramientas y algoritmos de codificación.

Para lograr las ganancias de compresión mencionadas anteriormente, AV2 introduce una serie de mejoras en la tecnología de codificación, incluidos métodos de predicción intracuadro y entre cuadros más avanzados, modelado de movimiento más sofisticado, herramientas de filtrado y transformación más complejas, una estructura de partición de bloques más flexible y un mecanismo de codificación de entropía mejorado. Estos cambios aumentan la dimensión de la toma de decisiones y la libertad del algoritmo en el lado de la codificación, lo que permite que el codificador coincida con mayor precisión las características del contenido de video, comprimiendo así más información redundante con la misma calidad de imagen.

Sin embargo, una mayor eficiencia de compresión tiene un precio. Según la evaluación del líder del proyecto VideoLAN, Jean-Baptiste Kempf, la complejidad computacional de AV2 en el lado de la decodificación ha aumentado significativamente en comparación con AV1. Actualmente se estima que la complejidad de decodificación de AV2 es aproximadamente cinco veces mayor que la de AV1, lo que hará que sea muy difícil para una gran cantidad de CPU existentes decodificar sin problemas videos AV2 a través de software puro. En ausencia de un amplio soporte de aceleración de decodificación de hardware, es posible que los dispositivos terminales comunes no puedan soportar la carga adicional que trae AV2 en términos de consumo de energía, generación de calor y fluidez, lo que ralentiza su implementación en navegadores, decodificadores de TV y dispositivos móviles.

Debido a esto, Kempf cree que antes de que los chips y plataformas convencionales proporcionen una aceleración de hardware AV2 completa, todavía existen muchas incertidumbres en las perspectivas de la adopción a gran escala de este estándar. En otras palabras, si AV2 puede repetir el camino de desarrollo de AV1 y realmente implementarse en grandes plataformas de medios de transmisión como YouTube, Netflix y Amazon dependerá en gran medida de si los fabricantes de CPU, GPU y SoC están dispuestos a dedicarle suficientes recursos de soporte de hardware y cuándo.

Actualmente, con la implementación oficial de la especificación AV2 1.0.0, AOMedia y sus miembros ya pueden promover la implementación y optimización de codificadores, decodificadores y cadenas de herramientas de desarrollo relacionadas bajo un estándar unificado. En general, la industria espera que en los próximos años el soporte experimental en torno a AV2 aparezca por primera vez en reproductores de código abierto, versiones experimentales de navegadores y algunos servicios de transcodificación en la nube. Las aplicaciones comerciales reales para usuarios masivos aún deben esperar a que el ecosistema de hardware madure y las plataformas de contenido se generalicen para ofrecer rutas de adopción más claras.