Los programadores ya alucinaban con CoPilot y ChatGPT, pero ahora DeepMind va más allá con AplhaCode

Los programadores ya alucinaban con CoPilot y ChatGPT, pero ahora DeepMind va más allá con AplhaCode
21 comentarios

CoPilot surgió como una revolución para programadores y a pesar de la polémica parece imparable. No está solo. ChatGPT, el fenómeno viral de los últimos días, también apunta maneras y programa en lo que le eches. Si esos motores de inteligencia artificial ya nos parecían alucinantes esperad, que ahora llega un nuevo motor que va aún más allá.

AlphaCode. Este nuevo sistema de ingeligencia artificial llega de la mano de la célebre DeepMind, subsidiaria de Google. La empresa lleva años logrando hitos singulares: logró superar a los humanos al Go o al StarCraft II, jugó mejor que otras máquinas al ajedrez, pero también ayudó a arqueólogos, farmacéuticos, matemáticos y biólogos. Ahora sus responsables han querido ver cómo se portaba en el mundo de la programación, y el resultado, llamado AlphaCode, es alucinante.

Mejor que los humanos. Aunque CoPilot y ChatGPT son los más populares, el verdadero referente en sistemas de IA que programan era Codex, lanzado en 2021 por OpenAI y entrenado con más de 100 GB de código de GitHub. En DeepMind también han entrenado su sistema con código de estos repositorios, pero además han añadido entrenamiento basado en problemas recolectados de competiviones de programación. Por ejemplo, determinar el número de cadenas binarias de longitud "n" que no tienen ningún cero consecutivo.

Millones de soluciones candidatas. Ante un nuevo problema, AlphaCode genera soluciones candidatas en Python o C++ y las filtra para no contemplar las que considera malas. Codex generaba cientos de soluciones, pero DeepMind ha logrado que AlphaCode genere más de un millón.

La mejor entre muchas. A partir de ahí se queda con aproximadamente el mejor 1% de todas ellas y las agrupa en "clústeres" analizando las similitudes entre las salidas y las entradas. Eso permite enviar los resultados agrupados por estrategia, táctica de programación y resultado, lo que permite plantear alternativas y así ofrecer más posibilidades de resolver el problema.

Resuelve uno de cada tres problemas. Tras el entrenamiento, los responsables de DeepMind revelaron en Science que AlphaCode resolvió cerca de un 34% de los problemas que le fueron asignados. Codex, que ya era bueno, no superaba el 10%.

AlphaCode vs humanos. Para demostrar su capacidad, DeepMind apuntó a AlphaCode a competiciones de programación online en las que participan programadores humanos. En eventos con al menos 5.000 participantes, el sistema superó al 45,7% de todos ellos, pero lo más sorprendente fue otra cosa.

Creatividad. A pesar de que su entrenamiento está basado en código de GitHub y por tanto sería de esperar que las soluciones fueran por tanto similares al código allí publicado, AlphaCode no duplicó grandes secciones de código o lógica de algoritmos. En esencia estaba creando algo nuevo. No es perfecto y comete algunos errores, pero el desarrollo es prometedor y vuelve a reabrir el debate sobre creatividad en máquinas.

Temas
Inicio