La startup de IA de Elon Musk, xAI, presentó ayer su nueva familia de modelos de inteligencia artificial, llamada Grok 3. Presumió de que esos modelos superaban a sus competidores, pero no parece que tengamos aquí un salto cualitativo especialmente llamativo. Y eso es un problema, porque Musk quiere que paguemos por usar Grok 3.

Para empezar, Grok 3. En esa familia los primeros destacados son Grok 3 beta y Grok 3 mini, las dos versiones iniciales que compiten directamente con modelos de IA generativa como GPT-4o, Claude 3.5 Sonnet, DeepSeek V3 o Gemini 2.0 Pro. Según los benchmarks usados en xAI, Grok 3 los supera a todos, y ese buen rendimiento parece estar avalado por entidades independientes como LMArena.

Hay modo "Razonamiento". Curiosamente Grok 3 no tiene una versión separada para "razonar", sino que el propio modelo es capaz de activar ese modo de razonamiento para competir con DeepSeek R1 o con o1. Una vez más xAI revela que los benchmarks en este ámbito parecen colocar a Grok 3 como el que mejor se comporta.

Pero razona en silencio. El modo de razonamiento de Grok 3, eso sí, no muestra lo que está pensando, algo que sí hacen otros modelos de razonamiento. Según xAI, esa decisión de diseño permite evitar que modelos de la competencia utilicen esos datos para destilarlos y reaprovecharlos en sus propios desarrollos. Es una zancadilla a la competencia, sin más.

DeepSearch, el otro gran protagonista. Una de las funciones más llamativas de Grok 3 es DeepSearch, que no es más que la respuesta a herramientas de investigación como Deep Research, de OpenAI. Expertos como Andrej Karpathy lo han probado y parece comportarse bien, pero en realidad está a caballo entre los modelos de razonamiento y DeepResearch, que es más avanzado.

xAI se pone al día, y eso tiene mérito. Si hace unas semanas avisábamos de que Grok 3 no llegaba y xAI se estaba quedando atrás, las cosas acaban de cambiar. Si hacemos caso de esas primeras demos y pruebas internas, Grok 3 es un modelo de IA tan bueno o mejor que sus competidores actuales. Eso es todo un logro para xAI, que se creó en abril de 2023 y ha logrado ir recuperando todo el terreno que sus competidores habían recorrido ya.

Tendrá voz. De momento Grok 3 no ofrece la capacidad de conversar mediante la voz como hacen competidores como los modelos de OpenAI o Google, pero Musk indicó que están trabajando en ello. "El modo de voz es todavía un poco irregular", comentó en X, "por lo que probablemente se lance dentro de una semana, pero es impresionante".

Grok 3 no es gratuito. Otra sorpresa. Tras la llegada de DeepSeek, la competencia no para de ofrecer opciones avanzadas e incluso modelos de razonamiento de forma gratuita. Para usar Grok 3 de los primeros tendrás que pagar la suscripción Premium+, que cuesta 50 dólares al mes. En xAI han creado un nuevo plan llamado SuperGrok que según los rumores costará 30 dólares al mes y que permitirá usar también este modelo más adelante. Grok 3 no estará inicialmente disponible en Europa.

Y tampoco Open Source. Aunque Musk ya publicó la versión inicial de Grok como Open Source, no parece estar dispuesto a hacer lo mismo inmediatamente con Grok 3. Tampoco lo hizo con Grok 2, aunque justo durante el lanzamiento de Grok 3 anunció que próximamente licenciaría esa segunda versión como Open Source. Como sucede con la decisión de ocultar "cómo piensa" Grok 3 en su modo de razonamiento, Musk parece tener claro que prefiere no compartir demasiado sobre sus modelos de IA para evitar que la competencia pueda aprovecharse de sus avances.

Un modelo de negocio complicado. Precisamente el hecho de ofrecerlo solo como parte de una suscripción de pago complica las cosas para lograr que Grok 3 se popularice. A priori no parece que sea un modelo de IA que represente un salto cualitativo lo suficientemente importante para justificar que alguien pague por él cuando hay alternativas gratuitas, así que, ¿por qué deberíamos hacerlo?

Culto a Musk. La estrategia de xAI y de Elon Musk llama la atención porque parece obligarnos a elegir Grok 3 más por nuestra ideología —somos fans de Musk o no— que por una cuestión práctica y racional —que su modelo sea realmente mejor y más útil—. Los benchmarks parecen apuntar a que este modelo se comporta algo mejor que la competencia, pero el salto, repetimos, no parece notable y algunas pruebas independientes demuestran que Grok 3 está lejos de ser perfecto, por ejemplo a la hora de programar.

Ya pasa con Tesla. Es algo similar a lo que ocurre con Tesla y sus acciones: durante los últimos años el valor de la compañía se ha disparado en bolsa. Su valoración de mercado (1,14 billones de dólares) es excepcionalmente alta. Tanto como para ser equivalente a la de las siguientes 16 empresas que fabrican automóviles. Entre ellas están Toyota, BYD, Ferrari, GM, Porsche, Mercedes-Benz, Volkswagen, Ford, BMW, Honda, Hyundai o Stellantis. No hay aquí una razón económica racional o lógica: solo la creencia popular de que Tesla "tiene que valer más". Es el culto a Musk hecho inversión (o apuesta).

Grok 3 va a tener mucho que demostrar. Puede que Grok 3 acabe estando disponible para las cuentas estándar de X. Es lo que acabó ocurriendo con Grok 2, un modelo que demostró por ejemplo ser especialmente llamativo por no tener censura. Sin embargo con Grok 3 los argumentos para pagar no parecen estar nada claros, y las demos que se mostraron en la presentación eran básicamente "un más de lo mismo". Y con eso va a ser difícil que xAI y Musk nos convenzan de que usar su IA es la mejor opción.

Imagen | Dvids | xAI

En Xataka | Elon Musk enciende el "clúster de IA más potente del mundo". Uno con 100.000 GPUs NVIDIA H100