Logo Bolsamania

Noticias

16/04/2025 19:22:04

OpenAI lanza sus nuevos modelos de IA que pueden "pensar con imágenes"

OpenAI ha lanzado sus nuevos modelos de inteligencia artificial (IA), llamados o3 y o4-mini, capaces de "pensar con imágenes" y los "más inteligentes" que la compañía ha lanzado hasta la fecha, "lo que representa un cambio radical en las capacidades de ChatGPT".

OpenAI lanza sus nuevos modelos de IA que pueden pensar con imágenes

Y es que, por primera vez, los modelos de razonamiento de OpenAI pueden usar y combinar de forma agente todas las herramientas de ChatGPT, incluyendo la búsqueda web, el análisis de archivos subidos y otros datos con Python, el razonamiento profundo sobre entradas visuales e incluso la generación de imágenes.

"Fundamentalmente, estos modelos están entrenados para razonar sobre cuándo y cómo usar las herramientas para producir respuestas detalladas y bien pensadas en los formatos de salida adecuados, generalmente en menos de un minuto, para resolver problemas más complejos".

En este sentido, OpenAI o3 es el modelo de razonamiento más potente, que "revoluciona la programación, las matemáticas, la ciencia, la percepción visual y más".

Es idóneo para consultas complejas que requieren un análisis multifacético y cuyas respuestas pueden no ser obvias de inmediato; y se desempeña "especialmente bien" en tareas visuales como el análisis de imágenes, diagramas y gráficos.

OpenAI o4-mini, por su parte, y como su nombre indica, es un modelo más pequeño, optimizado para un razonamiento rápido y rentable, aunque logra un "rendimiento excepcional" considerando su tamaño y costo, especialmente en matemáticas, programación y tareas visuales.

"Gracias a su eficiencia, o4-mini admite límites de uso significativamente mayores que o3, lo que lo convierte en una opción sólida para preguntas de alto volumen y alto rendimiento que se benefician del razonamiento", ha detallado la compañía.

Pero lo más revolucionario es que estos modelos pueden integrar imágenes directamente en su cadena de pensamiento. "No solo ven una imagen, sino que piensan con ella. Esto abre un nuevo tipo de resolución de problemas que combina el razonamiento visual y textual, lo que se refleja en su rendimiento de vanguardia en pruebas multimodales".

"Se puede subir una foto de una pizarra, un diagrama de un libro de texto o un boceto hecho a mano, y el modelo puede interpretarlo, incluso si la imagen está borrosa, invertida o es de baja calidad. Con el uso de herramientas, los modelos pueden manipular imágenes sobre la marcha: rotarlas, ampliarlas o transformarlas como parte de su razonamiento".

OpenAI o3 y o4-mini tienen acceso completo a las herramientas de ChatGPT, así como a sus propias herramientas personalizadas mediante llamadas a funciones en la API.


BOLSA y MERCADOS

Empresas
Empresas

Mayo trae oportunidades: tres acciones del Nasdaq a tener en el radar

  • Empresas - 02/05/2025 16:24

“Cuando la marea baja, se ve quién nada desnudo”. La célebre frase de Warren Buffett nunca ha sonado tan actual como en este inicio de 2025. Así, mientras Wall Street proclama su optimismo por el futuro de la gran tecnología, el Nasdaq 100 se deja cerca de un un 5% en lo que va del año. Sin embargo, para quienes saben mirar más allá del ruido, en este mar revuelto emergen tres gigantes con vocación de eternidad.