Modelos

Una startup rompe el cuello de botella matemático de la atención

Por la redacción de El Frente 20 jun 2026

Subquadratic asegura haber construido el primer modelo de lenguaje sin atención cuadrática, el obstáculo que ralentiza a todos los LLM actuales. Tras salir del sigilo en mayo, benchmarks independientes validan parte sustancial de sus promesas.

El 5 de mayo de 2026, la startup de Miami Subquadratic emergió del modo stealth con una afirmación que generó inmediatamente comparaciones incómodas con casos de fraude científico: haber eliminado la atención cuadrática de un modelo de lenguaje de gran escala. Seis semanas después, con datos de evaluación independientes sobre la mesa, la conversación ha mutado. Ya no se trata de si mienten, sino de qué significa realmente lo que han logrado y cuáles son los verdaderos límites del sistema.

La atención cuadrática es el cuello de botella matemático que define a toda la arquitectura Transformer desde 2017. Cuando el modelo procesa una secuencia de texto, debe calcular la similitud entre cada token y todos los demás, lo que genera un coste computacional que crece exponencialmente con la longitud de la entrada. Esto limita la ventana de contexto, encarece la inferencia y ralentiza el entrenamiento. Subquadratic afirma haber reemplazado ese mecanismo por un esquema de atención dispersa que mantiene la capacidad de modelado sin el coste cuadrático.

Los benchmarks independientes publicados recientemente respaldan la mayor parte de lo que la empresa anunciaba. El modelo mantiene rendimiento competitivo en pruebas estándar de lenguaje y lógica, y el coste computacional se comporta como sublineal en secuencias largas. No son números que demuestren un avance revolucionario, pero sí suficientes para cerrar la brecha entre la promesa inicial y la realidad medible.

El contexto es crítico aquí. OpenAI, Anthropic y Meta han invirtido años en mejorar la eficiencia de la atención sin abandonar la arquitectura de Transformers estándar. Algunos han experimentado con recurrencia, otros con Moe. Subquadratic pretende una ruptura más radical: una reconstrucción del mecanismo de atención desde primeros principios. Si funciona a escala, cambiaría el equilibrio de poder en quién puede entrenar modelos de frontera.

Las dudas persisten y son legítimas. Los benchmarks miden rendimiento en tareas sintéticas y textuales, pero no dicen nada sobre si el modelo aprende representaciones internas equivalentes a las de la atención estándar. Tampoco hay datos públicos sobre cómo escala a 100B+ parámetros, o si la ventaja computacional se mantiene en entrenamiento multimodal. El silicio todavía no está convencido.

Anthropic y OpenAI seguramente ya están probando Subquadratic internamente. Si los datos sostienen lo que prometen, las implicaciones van más allá del rendimiento: afectan a la accesibilidad del entrenamiento de modelos frontales y a la viabilidad económica de startups frente a los gigantes. En 2026, eso sigue siendo un cambio de reglas.

Lo que viene es más escrutinio. Los equipos de investigación replicarán resultados, buscarán grietas en los benchmarks y presionarán al modelo en casos extremos. Subquadratic tendrá que publicar arquitectura, código y transparencia, o volverse irrelevante. La ciencia funciona así: la afirmación audaz solo sobrevive si aguanta el fuego.

Basado en información de: Wwwhat's new.
Ver la fuente original ↗

← Volver a la portada

Más señales

Una startup dice haber roto un cuello de botella de los LLM

EEUU desactivó Claude Mythos por presión geopolítica, no por seguridad

Agentes de IA salvaron quesería histórica al borde de la quiebra