Generadores de video con IA, un frente de batalla sangriento

El auge de la inteligencia artificial generativa exhibe su punto más álgido en el despliegue de los generadores de video con IA. Ese ámbito cuenta con la participación estelar de los dos gigantes del sector, OpenAI y Google. No estarán solos: ya hemos visto desarrollos prestos a competir con ellos. Lo cierto es que las promesas de esos modelos son tan encantadoras como aterradoras. Y se prevé que la batalla sea sangrienta, tal como vaticina el titular de este repaso.

Para desprevenidos, se trata de sistemas capaces de generar videos a partir de indicaciones por escrito. Por ejemplo, el usuario pide —con texto— un clip que muestre cientos de aviones de papel, de diversos colores, surcando un paisaje boscoso. En un abrir y cerrar de ojos, los nuevos modelos crearán un video que muestre esa escena. Sí, es una tecnología impresionante, que parece salida de un cuento de ciencia ficción. Pero no todo es color de rosas, ya que esas capacidades involucran riesgos que deben ser atendidos. El más relevante y que aglutina al resto: la sofisticación del engaño.

En lo que va del año, OpenAI y Google presentaron sus propios generadores de video con IA, Sora y Veo, respectivamente. Eso sí, no los lanzaron aún y esgrimieron que la espera es necesaria, no solo para pulir el funcionamiento de los sistemas. Además, reconocieron los peligros asociados a su uso y la importancia de tomar todos los recaudos, antes poner estos avances en manos del público general.

Sora de OpenAI, pionero entre los generadores de video con IA

El clip sobre este párrafo fue creado con Sora. OpenAI —organización que consiguió fama mundial cuando lanzó el bot conversacional ChatGPT— asegura que para el video no se usaron grabaciones previas y que tampoco se realizaron ediciones posteriores. Tal como indicamos anteriormente, la magia de la generación se basa, exclusivamente, en las indicaciones por escrito, “prompts” en la jerga de la inteligencia artificial.

Sora, pionero entre los generadores de video con IA, es capaz de crear piezas con alto grado de realismo, animaciones y escenas surrealistas. Las posibilidades son amplísimas, según prometió OpenAI en el comunicado del anuncio. Este sistema es “capaz de generar clips complejos, con múltiples personajes, movimientos específicos y detalles precisos”, señalaron. Además, notaron que “el modelo no solo comprende aquello que el usuario pide, sino también cómo existen las cosas en el mundo físico”.   

El clip a continuación es una muestra más de esas bondades. Para el mismo, se usó un prompt relativamente extenso y detallado. “Un diorama meticulosamente elaborado que representa una escena serena del Japón del período Edo. Arquitectura tradicional de madera. Un samurái solitario, vestido con una intrincada armadura, camina lentamente por la ciudad”.

No erramos el tiro al decir que esta tecnología es la evolución de los generadores de imágenes, entre ellos DALL-E, también de OpenAI. Sin dudas, añadir movimiento a las escenas que se describen en un desafío adicional. Para conseguirlo, el modelo ha sido entrenado con grandes volúmenes de información, en este caso una extensa biblioteca de videos debidamente etiquetados. Algunos detalles: Sora crea piezas de hasta 60 segundos de duración, permitiría el agregado de audio, y puede trabajar tanto con clips verticales como horizontales.

Tal como señalamos —y abordaremos con detalle más adelante, en este repaso— el generador de video con IA de OpenAI aún no fue lanzado para el público general. “Tendremos varias medidas de seguridad antes de que esté disponible”, dijeron desde el grupo liderado por Sam Altman. Mientras tanto, en las plataformas oficiales encontramos bellas creaciones con Sora, que en su primerísimo despliegue está en manos de un grupo selecto de usuarios. Son cineastas, expertos en IA y profesionales del sector audiovisual, a los que esta organización apela para recibir retroalimentación y pulir los detalles que sean necesarios antes del lanzamiento.

¿Cuándo se abrirá al público? Aún no se informó una fecha en forma oficial, la líder de tecnología de la firma, Mira Murati, anticipó a The Wall Street Journal que no se demorará más allá del año en curso.

Google también juega en esta liga: estas son las características de Veo

OpenAI se luce con ChatGPT y Google contraatacó con Bard, su propio chatbot que ahora se llama Gemini. Los de Altman anunciaron a Sora, y los dirigidos por Sundar Pichai apuraron sus maquinarias para mostrar al mundo a Veo, el generador de videos con IA que sale a competir en un ámbito en el que, sin dudas, veremos muchísima acción. El modelo fue anunciado en mayo, en el marco de las conferencias para desarrolladores, Google I/O 2024.

Ver fuente

Related Post