16/02/2024 12:16:54

OpenAI presenta Sora, su nueva herramienta para generar vídeos a partir de texto

OpenAI ha presentado su primer modelo de generación de vídeos. Se trata de Sora, una herramienta que, en su actual versión experimental, permite generar vídeos de hasta 60 segundos a partir de instrucciones de texto. La compañía liderada por Sam Altman asegura que el modelo es capaz de generar escenas realistas siguiendo las indicaciones de los usuarios. Todo esto, manteniendo la calidad de los fotogramas.

"Sora es capaz de generar un minuto de vídeo de alta fidelidad. Estamos enseñando a la inteligencia artificial a entender y simular el mundo físico en movimiento, con el objetivo de entrenar modelos que ayuden a las personas a resolver problemas que requieren interacción en el mundo real", ha indicado OpenAI en el informe en el que presenta su nueva herramienta.

Sora funciona básicamente con la misma mecánica que los generadores de texto e imagen. Puede generar vídeos de hasta un minuto de duración manteniendo calidad visual y cumpliendo con las indicaciones del prompt del usuario.

Según ha informado OpenAI, Sora está comenzando a estar disponible para los equipos de evaluación de riesgos para que evalúen áreas críticas en busca de daños o riesgos. También se está probando con "un número de artistas visuales, diseñadores y cineastas para obtener retroalimentación sobre cómo mejorar el modelo para que sea más útil para los profesionales creativos".

"Compartimos nuestro progreso de investigación temprano para comenzar a colaborar y obtener comentarios de personas fuera de OpenAI y para dar al público una idea de cuáles son las capacidades de la IA que están en el horizonte", ha dicho la compañía.

Sora es capaz de generar escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos del sujeto y el fondo. El modelo comprende no solo lo que el usuario ha solicitado en el texto de entrada, sino también cómo esas cosas existen en el mundo físico.

El modelo tiene un profundo entendimiento del lenguaje, ha señalado OpenAI, lo que le permite "interpretar de manera precisa las indicaciones y generar personajes cautivadores que expresan emociones vibrantes". Sora también puede crear múltiples tomas dentro de un solo vídeo generado que reflejen de manera precisa los personajes y el estilo visual.

AÚN TIENE DEBILIDADES

OpenAI ha explicado que el modelo actual tiene debilidades. Puede tener dificultades para simular con precisión la física de una escena compleja y puede que no comprenda instancias específicas de causa y efecto. Por ejemplo, ha indicado, una persona podría morder una galleta, pero después, la galleta podría no tener una marca de la mordida.

El modelo también puede confundir detalles espaciales de una indicación, por ejemplo, mezclar izquierda y derecha, y puede tener dificultades con descripciones precisas de eventos que ocurren a lo largo del tiempo, como seguir una trayectoria de cámara específica.

SEGURIDAD

OpenAI ha remarcado que tomarán varias medidas importantes de seguridad antes de hacer que Sora esté disponible entre los productos de OpenAI. "Estamos trabajando con equipos de evaluación de riesgos, expertos en áreas como desinformación, contenido odioso y sesgo, que probarán el modelo".

También están desarrollando herramientas para ayudar a detectar contenido engañoso, como un clasificador de detección que puede identificar cuándo un vídeo fue generado por Sora.

Además de desarrollar nuevas técnicas para la preparación del despliegue, OpenAI está aprovechando los métodos de seguridad existentes que construyó para sus productos que utilizan DALL·E 3, que también son aplicables a Sora.

"Nos comprometeremos con legisladores, educadores y artistas de todo el mundo para comprender sus preocupaciones e identificar casos de uso positivos para esta nueva tecnología. A pesar de una extensa investigación y pruebas, no podemos predecir todas las formas beneficiosas en que las personas usarán nuestra tecnología, ni todas las formas en que abusarán de ella. Por eso creemos que aprender del uso en el mundo real es un componente crítico para crear y lanzar sistemas de IA cada vez más seguros con el tiempo".

LOS MEJORES DEL IBEX 35
Nombre	Precio	Variación
IAG (IBERIA)	3.0710	1.55%
LABORAT.ROVI	63.5500	1.36%
MERLIN PROP.	10.2600	0.69%
FERROVIAL INTL RG	38.9200	0.57%
CAIXABANK	5.0740	0.52%

LOS PEORES DEL IBEX 35
Nombre	Precio	Variación
GRIFOLS	9.7780	-8.23%
MAPFRE	2.4740	-3.13%
UNICAJA BANCO	1.1840	-2.47%
BBVA	8.7600	-2.08%
INDITEX	51.9200	-1.41%

Noticias

OpenAI presenta Sora, su nueva herramienta para generar vídeos a partir de texto

AÚN TIENE DEBILIDADES

SEGURIDAD

BOLSA y MERCADOS

Moodys confirma los ratings de Santander Consumer Finance, con perspectiva positiva

El foro Spain Investors Day reunirá en enero a grandes inversores interesados en España

Just Eat dejará de cotizar en la Bolsa de Londres a finales de diciembre

Barclays inicia Puig en sobreponderar, con una valoración de 24,40 euros

El bitcoin se toma un respiro y pierde fuelle frente al ethereum y las altcoins

Scope: "La ampliación del impuesto bancario puede erosionar la rentabilidad en 2025"

Sabadell despliega oficinas móviles y cajeros en la Comunidad Valenciana por la DANA

JP Morgan saca la tijera y recorta un 19% la valoración de Puig, hasta 26 euros

Sánchez anuncia un tercer paquete de ayudas por la DANA por más de 2.200 millones

Precios vitales cuyo abandono supondría un cambio de tendencia en este valor del Ibex

Mejores y peores del IBEX 35

Las + Leidas

El Ibex 35 y Europa se tiñen de rojo lastrados por los aranceles de Trump

Grifols se hunde: Brookfield cancela su propuesta de OPA

Precios vitales cuyo abandono supondría un cambio de tendencia en este valor del Ibex

Este banco del Ibex pasa de ser el peor por técnico a apuntar a los máximos anuales

Atentos al gran salto en esta compañía del Ibex

Noticias

AÚN TIENE DEBILIDADES

SEGURIDAD

BOLSA y MERCADOS

Mejores y peores del IBEX 35

Las + Leidas

Social Links