OpenAI vuelve a sorprender al mundo con su nuevo modelo Sora: ¿Cómo es y hacia dónde irá?

OpenAI ha sorprendido al mundo con Sora, su innovación de IA más reciente que genera videos realistas a partir de descripciones de texto simples.

Para aquellos que no están familiarizados con las maravillas del contenido generado por IA, es importante aclarar que Sora no se limita a unir varias imágenes. Crea secuencias de vídeo dinámicas con varias ventajas clave sobre los modelos existentes.

A diferencia de otros modelos limitados a segundos, Sora genera vídeos de hasta un minuto de duración. Va más allá de los planos estáticos con planos panorámicos, primeros planos y planos generales. Es más, los objetos y fondos mantienen la coherencia a lo largo del vídeo, evitando inconsistencias discordantes como manos con un número fluctuante de dedos. Esto supera las capacidades de muchos proyectos impulsados ​​por la comunidad.

A pesar de estas impresionantes hazañas, Sora no es perfecto. Si bien los entornos generados parecen reales, los elementos de texto, como los carteles de las tiendas, a menudo carecen de significado. Muestran caracteres sin sentido en lugar de un lenguaje preciso. El primer vídeo de demostración en el sitio web de Sora, con una mujer caminando por la calle, es un claro ejemplo de ello.

Aunque es experto en los detalles, Sora aún puede cometer errores. Los pies de la multitud en el vídeo de la calle parecían deformes.

Sin embargo, estos contratiempos no deberían eclipsar el potencial de Sora. Modelos como este sientan las bases para la generación de vídeo en tiempo real. Imagine que las computadoras crean videos basados ​​en entradas en vivo, revolucionando campos como los videojuegos y el entretenimiento.

Para lograr este sueño, se requiere una potencia informática significativa. Generar un segundo de vídeo requiere al menos una docena de fotogramas, pero los modelos actuales de conversión de texto a imagen tardan unos segundos en procesar sólo un fotograma con el mejor hardware de PC de consumo. Esto podría traducirse en un aumento de diez veces en las necesidades informáticas, creando un nuevo y vasto mercado para los proveedores de hardware.

En conclusión, los modelos de texto a vídeo como Sora han cruzado un umbral crítico y se han vuelto realmente utilizables y tienen un potencial apasionante. A pesar de enfrentar obstáculos técnicos y morales, están preparados para impulsar el ya floreciente mercado de la IA a nuevas alturas.

Fuente: CGTN

El agradecimiento a OpenAI por las imágenes difundidas en este noticiero.

sora

(Visited 1.521 times, 1 visits today)

About The Author

Videos Relacionados

Hola 👋

Abrir chat
Chatea con nosotros
Hola Somos CSTIC TV.
¿En qué podemos ayudarte?