Google muestra sus avances en la generación por IA de audio para vídeos

DeepMind, la compañía de Google más implicada en innovar en las inteligencias artificiales, ha mostrado sus avances en la creación de audio para vídeos que también sean creados por inteligencia artificial. Esta tecnología de vídeo a audio (V2A) explora las imágenes de los vídeos y la solicitud que se realice para crear audio para ellos.

La compañía ha publicado una buena cantidad de ejemplos poniendo la solicitud aunque indica que todavía está en desarrollo porque son conscientes de escenarios en los que puede fallar. La solicitud es opcional, por lo que puede basarse simplemente en los fotogramas del vídeo. Debido a ello, es capaz de generar audio que acompase a los cambios de cámara o al entorno, como montaña o pasillos oscuros, para generar uno u otro tipo de audio o música de fondo.

Los problemas actuales tienen que ver con la sincronización de voces con los labios de los vídeos, o que posibles distorsiones en el vídeo original pueden probar distorsiones en el audio.

Vía: EnGadget.

Google muestra sus avances en la generación por IA de audio para vídeos

Artículos relacionados

Apple se ríe de los «PC con IA» que promocionan Microsoft y sus socios

Apple anuncia sus primeras IA generativas integradas en los nuevos iOS y macOS

Microsoft hace cambios importantes a la característica Recall de Copilot+ tras el aluvión de críticas

Sin sorpresas, las características de IA de Copilot+ no son exclusivas de una NPU