El Frente
Chats

GPT-5.5 reduce a la mitad las alucinaciones

Por la redacción de El Frente
GPT-5.5 reduce a la mitad las alucinaciones

OpenAI estrenó GPT-5.5 y afirma reducir a la mitad los datos inventados respecto a la generación anterior.

OpenAI lanzó GPT-5.5 el 23 de abril de 2026 y lo convirtió en el motor por defecto de ChatGPT. El foco del lanzamiento no es saber más, sino equivocarse menos. Es un giro de mensaje notable en una industria acostumbrada a medirse por capacidad bruta.

Las cifras que aporta la compañía van en esa dirección. OpenAI sostiene que GPT-5.5 produce un 52,5% menos de afirmaciones alucinadas que GPT-5.3 Instant. Reducir a la mitad las invenciones, de confirmarse, sería una mejora sustancial para cualquier uso serio.

El segundo dato apunta a los terrenos delicados. Según la compañía, el modelo comete un 37,3% menos de imprecisiones en conversaciones marcadas como sensibles. Son precisamente las situaciones donde un error afirmado con seguridad puede tener consecuencias reales para el usuario.

La elección del problema no es casual. La fiabilidad es la queja número uno de los usuarios, y el malestar rara vez viene de que el modelo no sepa algo. Viene de que afirme con aplomo cosas falsas, mezclando aciertos y errores con el mismo tono de certeza.

Hay que leer estas cifras con la cautela debida. Son mediciones de la propia OpenAI, sobre sus propios criterios, y todavía faltan evaluaciones independientes que las contrasten. Un porcentaje impresionante depende por completo de cómo se define una alucinación y de qué conjunto de pruebas se usa.

Convertir GPT-5.5 en el motor por defecto de ChatGPT es, además, una decisión con peso. Significa que la mayoría de usuarios obtendrá estas respuestas sin elegirlo activamente, lo que amplifica tanto la mejora prometida como cualquier regresión que pudiera aparecer en el uso real.

Lo interesante de fondo es el cambio de relato del sector. Tras años de carrera por el tamaño y por las puntuaciones, los fabricantes empiezan a vender fiabilidad como argumento principal. Es una señal de madurez: el mercado pide modelos en los que se pueda confiar, no solo modelos más grandes.

De cara a los próximos meses, la prueba real serán las mediciones externas y el uso cotidiano, no la nota de prensa. Si terceros confirman la reducción de errores, GPT-5.5 marcará una pauta; si no, quedará como una promesa más. Los datos de este artículo proceden de Fello AI.

Basado en información de: Fello AI.
Ver la fuente original ↗
← Volver a la portada

Más señales

Grok 4.3 llega con los filtros más laxos
Chats

Grok 4.3 llega con los filtros más laxos

xAI publicó Grok 4.3 con integración nativa en X y los filtros más permisivos entre los modelos punteros.

El FrenteLeer
Gemini 3.5 Flash apuesta por el precio-rendimiento
Chats

Gemini 3.5 Flash apuesta por el precio-rendimiento

Google lanzó Gemini 3.5 Flash, optimizado para coste por token, mientras ultima la versión Pro.

El FrenteLeer
Claude Opus 4.8 encabeza el ranking de IA
Chats

Claude Opus 4.8 encabeza el ranking de IA

Anthropic lanzó Opus 4.8 y se ha colocado en lo más alto de los rankings, con especial ventaja en programación.

El FrenteLeer