El Frente
Modelos

Una startup dice haber roto un cuello de botella de los LLM

Por la redacción de El Frente
Una startup dice haber roto un cuello de botella de los LLM

Una startup de Miami afirma haber roto un cuello de botella matemático que frenaba a los grandes modelos de lenguaje desde hace casi una década.

Una startup llamada Subquadratic, con sede en Miami, salió del modo stealth hacia el 5 de mayo con una afirmación llamativa: dice haber resuelto un cuello de botella matemático que, según su relato, llevaba casi una década limitando a los grandes modelos de lenguaje. La promesa es de las que mueven mercados, y la reacción no se ha hecho esperar, con comparaciones incómodas con Theranos rondando por la conversación.

Para entender qué dice resolver, conviene recordar cómo funciona el mecanismo central de los transformers, la arquitectura detrás de los modelos actuales. La llamada atención permite que cada parte del texto se relacione con todas las demás, lo que da a estos modelos su capacidad para mantener el hilo. El problema es que ese cálculo crece de forma cuadrática con la longitud del texto.

Esa relación cuadrática significa que duplicar la longitud de una conversación no duplica el coste, sino que lo multiplica por cuatro. Por eso, cuando las conversaciones se alargan o se pide al modelo que procese documentos extensos, el gasto en cómputo y memoria se dispara. Es uno de los motivos por los que el contexto de los modelos tiene límites y por los que ampliarlo sale tan caro.

Si alguien rompiera de verdad esa barrera, las consecuencias serían notables. Modelos con mucha más memoria efectiva, capaces de mantener contextos largos sin que el coste se descontrole, y servicios bastante más baratos de operar. Es el tipo de avance que reordenaría la economía del sector, de ahí que un anuncio así genere tanto entusiasmo como recelo.

Y aquí está el problema: por ahora es una afirmación, no un resultado verificado. La comunidad técnica pide lo de siempre y con razón: artículos que expliquen el método, código que permita reproducirlo y resultados que otros equipos puedan confirmar de forma independiente. Sin eso, una declaración de salida del modo stealth es marketing, no ciencia.

La comparación con Theranos no es gratuita ni necesariamente justa, pero es ilustrativa. Recuerda lo que ocurre cuando una promesa tecnológica circula con más confianza que evidencia. No implica mala fe, solo que el listón probatorio debe ser alto precisamente cuando lo prometido es tan grande. Romper un límite que ha resistido años de investigación requiere pruebas extraordinarias.

Hay que añadir un matiz técnico que invita a la prudencia. La idea de reducir el coste cuadrático de la atención no es nueva: existen desde hace tiempo líneas de trabajo en atención eficiente, aproximaciones y arquitecturas alternativas, con resultados parciales y compromisos. Que un actor afirme haberlo resuelto del todo, y de golpe, es justo lo que obliga a pedir reproducibilidad.

Qué esperar: el siguiente paso lógico es que Subquadratic publique detalles y permita validación externa. Si lo hace y los números se sostienen bajo escrutinio, sería un avance importante. Si no llegan ni el artículo ni el código reproducible, lo razonable es archivar el anuncio en la carpeta de promesas sin verificar. El escepticismo, en este caso, es la postura más sensata.

Basado en información de: MIT Technology Review.
Ver la fuente original ↗
← Volver a la portada

Más señales

Una startup rompe el cuello de botella matemático de la atención
Modelosnuevo

Una startup rompe el cuello de botella matemático de la atención

Subquadratic asegura haber construido el primer modelo de lenguaje sin atención cuadrática, el obstáculo que ralentiza a todos los LLM actuales. Tras salir del sigilo en mayo, benchmarks independientes validan parte sustancial de sus promesas.

El FrenteLeer
EEUU desactivó Claude Mythos por presión geopolítica, no por seguridad
Realidadnuevo

EEUU desactivó Claude Mythos por presión geopolítica, no por seguridad

El gobierno estadounidense ordenó desconectar el modelo Claude Mythos de Anthropic no por una vulnerabilidad de ciberseguridad, sino por temor a que SK Telecom, operador surcoreano con acceso irrestricto, facilitara la transferencia del modelo a China.

El FrenteLeer
Agentes de IA salvaron quesería histórica al borde de la quiebra
Chatsnuevo

Agentes de IA salvaron quesería histórica al borde de la quiebra

Petaluma Creamery, una fábrica de queso de más de cien años en California, recuperó rentabilidad y expandió sus operaciones tras desplegar agentes de IA que automatizaron tareas administrativas y de logística que consumían recursos sin retorno.

El FrenteLeer