Tiene 23 años, se llama Liam Price y no tiene formación matemática avanzada. Aun así hace unos días abrió la web de problemas de Erdös, cogió uno al azar y lo pegó en ChatGPT. No sabía la historia del problema ni quién lo había intentado antes. Lo que recibió de vuelta parecía una solución correcta, y tras consultarlo con un amigo que estaba estudiando matemáticas, ambos se dieron cuenta de que podían tener entre manos algo especial. Pocas horas después Terence Tao, uno de los matemáticos más reconocidos del mundo, confirmaba que el problema #1196 de Erdös, una conjetura sobre conjuntos primitivos de números enteros que llevaba sin resolvese desde 1966, tenía solución. La había encontrado GPT-5.4 Pro en apenas 80 minutos.
Así no. Este problema analizaba una cuestión sobre el comportamiento de una suma matemática en particular sobre conjuntos primitivos, esto es, conjuntos de números enteros donde ninguno divide a otro, cuando esos números se hacen muy grandes. Jared Lichtman, matemático de Stanford, había dedicado años al problema y había hecho progresos parciales, pero tanto él como los que lo habían intentado anteriormente partían de un mismo punto de partida que parecía el camino adecuado.
Una idea novedosa. GPT-5.4 utilizó otro punto de partida. Se quedó en el terreno airmético y usó una función especial llamada función de von Mangoldt, una herramienta clásica de la teoría de números conocida por sus conexiones con los números primos y la función zeta de Riemann. Nadie había pensado en esa aproximación al problema, y como explicaba Lichtman al hablar de la solución del modelo de OpenAI, "El LLM tomó una ruta completamente diferente".
El logro es real, pero con matices. Litchman elogió la solución propuesta por GPT-5.4, pero hay un detalle que se ha omitido en muchos comentarios sobre este suceso: la salida en bruto de ChatGPT era, en palabras de este matemático, "bastante pobre". Esa salida hizo necesaria que varios expertos la interpretaran, la detallaran y extrajeran de ella la idea que subyacía y permitía solucionar la conjetura. Price no sabía que tenía la solución hasta que su amigo la leyó, y él no estuvo seguro hasta que Tao lo confirmó. El repositorio oficial de contribuciones de IA a los problemas de Erdös, mantenido por el propio Tao en GitHub, clasifica el resultado como una solución generada en colaboración humano-IA, no como una solución desarrollada únicamente por la IA. La distinción es importante.
Un escándalo previo. Hace unas semanas Sebastien Bubeck, investigador de OpenAI, publicó en X que GPT-5 había "resuelto" varios problemas de Erdös. Esa publicación superó las 100.000 visualizaciones, pero la comunidad matemática y también la que rodea a la industria de la IA criticó esa afirmación. Demis Hassabis, CEO de DeepMind, calificó esa afirmación de "vergonzosa". Lo que había pasado en realidad es que el modelo había encontrado en la web soluciones a problemas ya resueltos. Bubeck acabó borrando el tuit original y trató de dar marcha atrás, pero todo eso hizo dudar de la validez de la aplicación de la IA a resolver problemas matemáticos.
La IA y la tasa de éxito matemática. Terence Tao y Nat Sothanaphan mantienen en GitHub el citado registro de todas las contribuciones de la IA en problemas de Erdös. Cada una de las entradas de esa lista o tabla está clasificada con un semáforo: verde para la solución completa, amarillo para progreso parcial y rojo para fracaso. En la categoría de soluciones completamente generadas por IA sin literatura previa conocida hay tres semáforos verdes, catorce amarillos y ocho rojos. Sin embargo el propio repositorio añade un comentario singular: quienes intentan usar la IA para resolver estos problemas y fracasan no suelen informar de ello, así que es probable que la IA haya sido aplicada "en silencio" a un gran número de estos problemas sin éxito, y esos intentos no aparecen en ninguna tabla. Hay aquí un sesgo claro porque solo los éxitos generan titulares.
Intentando medir lo que importa. En febrero de 2026, once matemáticos crearon la iniciativa "First Proof". En ella incluyeron diez problemas matemáticos que surgieron de forma natural en sus proyectos de investigación. Para cada uno incluyeron respuestas cifradas subidas a un sitio de verificación, y le dieron a los sistemas de IA una semana para intentar resolver esos problemas que jamás habían aparecido en ningún conjunto de datos de entrenamiento. Los resultados preliminares indican que hoy por hoy los modelos de IA no pueden superar esa barrera de forma autónoma, y lo que ocurre es que sigue habiendo límites a lo que la IA realmente puede aportar en matemáticas.
Pero entonces, ¿hay revolución o no? Terence Tao ofreció una explicación clara sobre por qué GPT-5.4 había tenido éxito donde otros habían fracasado durante 60 años. Lo que había ocurrido fue lo que el calificó como un bloqueo colectivo de la comunidad matemática, porque todos partieron del mismo origen porque era "el natural", el que la tradición marcaba. La IA no sabía que esa era la forma "correcta" de empezar, y esa ignorancia resultó ser una ventaja. No es que la IA fuera más inteligente, es que no tuvo prejuicios sobre cómo abordar el problema. Ahora queda por ver si esa forma novedosa de intentar solucionar problemas de formas poco ortodoxas funciona. Eso confirmará si lo ocurrido con el problema número 1196 de Erdös fue un caso aislado o si un chico de 23 años ha logrado darle una vuelta a nuestra visión de cómo afrontar problemas matemáticos.
Imagen | Universal Pictures
Ver 0 comentarios