Inicio Tecnología OpenAI presenta nuevas capacidades de ChatGPT para interpretar y editar imágenes

OpenAI presenta nuevas capacidades de ChatGPT para interpretar y editar imágenes

2 minutos de lectura

ChatGPT ahora puede analizar y modificar imágenes

La empresa de tecnología OpenAI anunció que su chatbot de inteligencia artificial, ChatGPT, ha incorporado la habilidad de entender y manipular imágenes, incluso si estas son de baja calidad o están borrosas.

Con el lanzamiento de sus nuevos modelos, denominados o3 y o4-mini, ChatGPT puede interpretar fotografías, diagramas extraídos de libros, esquemas o dibujos realizados a mano. Además, tiene la capacidad de editar las imágenes en tiempo real, girándolas, ampliándolas o modificándolas según sea necesario.

De esta manera, el chatbot no solo observa una imagen sino que también realiza un proceso de ‘pensamiento’ con ella, explicó OpenAI en un comunicado oficial.

Estos avances corresponden a una actualización en la serie o, centrada en mejorar el razonamiento del modelo y su capacidad para pensar durante períodos más largos antes de responder.

Los modelos o3 y o4-mini pueden usar diversas herramientas del sistema: navegar por internet, programar en Python, comprender contenido visual y generar nuevas imágenes. Todo esto les permite abordar tareas complejas que requieren múltiples pasos.

Según la compañía, estos modelos están entrenados para decidir cuándo y cómo emplear dichas herramientas para ofrecer respuestas detalladas y reflexivas en menos de un minuto.

Dirigidos por Sam Altman, los modelos o3 y o4-mini representan los avances más potentes en capacidades de razonamiento hasta la fecha. Son especialmente útiles para analizar gráficos, tablas e imágenes.

En pruebas realizadas por expertos, el modelo o3 cometió un 20% menos errores que su predecesor o1, mejorando su rendimiento en programación y consultoría empresarial. Además, supera al modelo o3-mini, especialmente en áreas como ciencia de datos.

Por otro lado, o4-mini, más compacto y rápido, está diseñado para tareas rápidas relacionadas con matemáticas, programación y análisis visual. También permite mayores límites de uso comparado con o3.

Tanto o3 como o4-mini ofrecen respuestas más naturales y personalizadas, asemejándose a una conversación casual.

A diferencia del pasado, estos modelos pueden usar todas las funciones disponibles en ChatGPT —como búsqueda web y análisis avanzado— combinándolas dinámicamente según la necesidad del problema.

Sistema entrenado para razonar sobre cuándo emplear cada herramienta con rapidez (generalmente menos de un minuto), logrando resolver problemas complejos con mayor eficiencia.

A partir de ahora, estos modelos están disponibles para usuarios con planes Plus, Pro y Team (incluyendo o3 y o4-mini), además del acceso vía API (Chat Completions + Responses API).

The company también lanzó Codex CLI —un agente ligero para codificación que funciona localmente— además se rumorea que OpenAI está negociando adquirir Windsurf por aproximadamente 3 mil millones de dólares. Windsurf es una plataforma especializada en codificación IA que compite con otras grandes tecnológicas del sector.

Artículo de:

Escribe un comentario

* Al utilizar este formulario usted acepta el almacenamiento y tratamiento de sus datos por parte de este sitio web.

Mejor de Huelva es tu diario local y guía imprescindible para descubrir lo mejor de nuestra tierra. Noticias, actualidad y los mejores sitios, profesionales y planes de Huelva reunidos en un solo lugar.

SELECCIÓN DEL EDITOR

Últimos Artículos

Este sitio web utiliza cookies para mejorar su experiencia. Suponemos que está de acuerdo, pero puede darse de baja si lo desea. Aceptar Leer más

Política de Privacidad y Cookies