OpenAI presenta Sora, el nuevo modelo de inteligencia artificial que crea videos realistas sólo con un texto

Por CNN Chile

15.02.2024 / 22:17

Sora es una herramienta para generar videos a partir de texto, pero también suscita preocupación por la seguridad de sus resultados, levantando inquietud respecto a la posibilidad de que se creen videos con desinformación, contenido que incite al odio y prejuicios.


OpenAI presentó este jueves un nuevo modelo de generación de videos basado en texto llamado Sora, el cual atrae la atención de todos los espectadores.

Sora, el modelo de video desarrollado por la empresa de inteligencia artificial, “puede crear escenas realistas e imaginativas a partir de instrucciones de texto“.

Este modelo de texto a video permite a los usuarios generar videos fotorrealistas de hasta un minuto de duración, todo basado en indicaciones escritas por el usuario.

Según explicó OpenAI, Sora es capaz de producir “escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos tanto del tema como del fondo“.

La compañía también destaca que el modelo puede comprender cómo “existen los objetos en el mundo físico“, así como “interpretar con precisión los accesorios y generar personajes convincentes que expresan emociones vibrantes”.

Aunque OpenAI admite que el modelo “puede enfrentar dificultades para simular con precisión la física de una escena compleja“, los resultados muestran algo totalmente diferente y en general son bastante impresionantes.

Los problemas de seguridad de Sora

Otro aspecto importante al que apelan en OpenAI es la seguridad de los videos que crean, debido a que podría generar la confusión y problemas a la hora de que los usuarios comiencen a acceder a la plataforma.

Tomaremos varias medidas de seguridad relevantes antes de que Sora esté disponible en los productos de OpenAI. Estamos trabajando con los miembros del equipo rojo (expertos en áreas como desinformación, contenido que incita al odio y prejuicios) que probarán el modelo de manera adversa“, explican.

Asimismo, anunciaron que están creando herramientas para ayudar a detectar contenido engañoso, como un clasificador de detección que puede indicar cuándo Sora generó un video.

Así se ve un video generado con Sora

En el blog compartido por la empresa, dan cuenta de los diferentes detalles de la nueva IA y enseñan algunos de los ejemplos que han logrado recrear.

Uno de los textos de los videos que lo acompaña dice: “Una mujer elegante camina por una calle de Tokio llena de luces de neón brillantes y carteles animados de la ciudad. Lleva una chaqueta de cuero negra, un vestido largo rojo, botas negras y un bolso negro. Lleva gafas de sol y lápiz labial rojo. Camina con confianza y despreocupación. La calle está húmeda y refleja, creando un efecto espejo de las luces de colores. Muchos peatones caminan por allí”.

Este es el resultado: