Comparar la IA de Apple con ChatGPT o Claude es un error. Apple no está jugando ese juego

  • En los últimos tres años, Apple ha publicado un artículo que describía sus avances en modelos de IA

  • Esa evolución permite desgranar una evolución que no va de ser más potentes que GPT o Claude, sino de integración y privacidad

Ia Apple Gemini
3 comentarios Facebook Twitter Flipboard E-mail
javier-pastor

Javier Pastor

Editor Senior - Tech
javier-pastor

Javier Pastor

Editor Senior - Tech

A quienes descartan a Apple en la carrera de la IA, ojito. Puede que la empresa haya llegado tarde y desde luego puede que a día de hoy tenga poco que mostrar, pero su evolución en los últimos tres años revela tres cosas interesantes. La primera, que Apple sí tiene sus propios modelos de IA. La segunda, que están muy lejos en rendimiento de los mejores de OpenAI y Claude. La tercera, que puede que eso no importe en absoluto.

Tres años de evolución. La trayectoria de los documentos técnicos compartidos por Apple en los últimos años revela una serie de cambios más que relevantes. En 2024 su propuesta inicial se limitaba a modelos pequeños de unos 3.000 millones de parámetros (3B) especializados en resolver tareas básicas como generar Genmojis o resúmenes de texto. En 2025 la compañía lanzó su framework MLX a la comunidad de desarrolladores para facilitar la integración y uso de modelos locales. Ahora, en 2026, plantean una una infraestructura híbrida basada en un principio básico: 

  • Peticiones sencillas: se ejecutan en pequeños modelos locales en el dispositivo, no necesitas ni una conexión a internet
  • Peticiones complejas: el sistema delega la tarea para que se procese en la nube de forma privada a través de la Private Cloud Compute

Una idea (quizás) genial: la NAND puede ayudar. El hito más relevante del nuevo enfoque de Apple reside en el diseño de su modelo AFM 3 Core Advanced. En los móviles actuales tenemos un gran cuello de botella con la ejecución de modelos de IA capaces (grandes) porque estos dispositivos tienen una cantidad de memoria muy limitada (12 GB en algunos iPhone). Para lograr meter un modelo de 20.000 millones de parámetros (20B), a Apple se le ha ocurrido almacenar ese modelo en la unidad SSD interna, no en memoria. 

Captura De Pantalla 2026 06 09 A Las 11 54 55 En el modelo AFM 3 Core Advanced los "expertos" están en el SSD del móvil. Se preseleccionan y se cargan en RAM para usarlos de forma dinámica, optimizando la ejecución del modelo.

Expertos por prompt, no por token. Luego activa una serie de técnicas de poda (Instruction-Following Pruning, o IFP) para activar únicamente entre 1.000 y 4.000 millones de parámetros de forma dispersa (sparse), de forma algo parecida a como se hace en modelos con arquitectura Mixture-of-Experts. Pero Apple selecciona a esos expertos al inicio de cada prompt, no token a token, lo que permite esquivar la lentitud del ancho de banda del almacenamiento NAND del móvil frente a su memoria RAM.

Privacidad por bandera. Si por algo destacó el enfoque de Apple desde el principio  fue por su privacidad, que está implícita al usar modelos locales. Pero si la petición es compleja, el sistema la redirige a los modelos de IA en la nube de Apple, la Private Cloud Compute (PCC). A diferencia de otras plataformas e infraestructuras como las de OpenAI o Anthropic, las conversaciones con la IA de Apple están cifradas y son totalmetne privadas según la empresa: esos datos no se comparten con terceros (porque ni Apple puede verlos) y tampoco se usan para entrenar sus modelos.

⌛️ SORTEO ACTIVO EN XATAKA XTRA
Esta Nintendo Switch 2 podría ser tuya
Gana una Nintendo Switch 2 con Xataka Xtra
Suscríbete por solo 2€/mes hasta el 19 de junio y entra en el sorteo
Suscríbete a Xtra

Cinco modelos con ayuda de Gemini. Aunque Apple está obsesionada con el control total de sus productos, en esta ocasión tuvo que ceder y aliarse con Google para que sus modelos Gemini pudieran "enseñarle" a Apple el camino. El resultado es una tercera generación de modelos que están desarrollados en colaboración con la firma de Mountain View. Tenemos cinco modelos en total: 

  • AFM 3 Core: modelo denso de 3B parámetros
  • AFM 3 Core Advanced: modelo disperso de 20B parámetros con activación de 1B a 4B parámetros según la tarea
  • AFM 3 Cloud: un modelo potente pero también eficiente y veloz que corre en la nube de Apple.
  • ADM 3 Cloud (Image): para la generación y edición de imágenes, el corazón tanto de estas opciones como del nuevo Image Playground
  • AFM 3 Cloud Pro: el modelo en la nube más potente de Apple está destinado agentes autónomos. Se ha entrenado con TPUs de Google y se ejecuta en GPUs de Nvidia dentro de la infraestructura de Google Cloud

El rendimiento, una incógnita. A diferencia de lo que suelen hacer otras empresas cuando presentan sus modelos, Apple no ha publicado métricas sobre benchmarks conocidos. En lugar de eso muestra métricas de "preferencia humana" en las que compara la satisfacción de los usuarios al usar sus modelos frente a otros de la competencia. Las comparaciones son además con versiones previas de estos modelos, lo que no aclara demasiado lo que se puede esperar de ellos. 

Pero no están en la carrera por el mejor modelo. En 2025 sí hubo comparación con modelos de pesos abiertos de aquella época (Qwen-3-4B en local, GPT-4o o Llama 4 Scout en la nube) y entonces parecían estar a buen nivel en referencia a esas opciones. Es de esperar que estén por detrás de los modelos más recientes de OpenAI, Anthropic o la propia Google, y no está claro cómo se comparan con los nuevos modelos chinos de pesos abiertos. Una cosa parece clara: Apple no tiene demasiado interés en contar con su propio Mythos, al menos de momento. Su objetivo es otro.

Captura De Pantalla 2026 06 09 A Las 12 23 30 Los modelos de Apple de 2026 "se prefieren" más que los de 2025. Lógico, pero también inútil a la hora de comprender cómo de buenos son esos modelos respecto a la competencia.

Pero la integración es importante. El gran as en la manga de Apple para compensar esa diferencia de capacidad está en que sus modelos tienen acceso completo al SO, apps y hardware del usuario. Los modelos AFM están integrados con los sensores de cámaras del iPhone, el historial de notificaciones o los permisos locales de apps. Eso permite ejecutar tareas útiles que un LLM que esté "desconectado" del hardware difícilmente podrá replicar. Aquí la integración de los modelos con el hardware y software del dispositivo es (o quiere ser) fundamental.

Cuidado con la mediocridad. Ese enfoque centrado en la integración y la privacidad es especialmente llamativo y diferencial con respecto a sus competidores, pero hay riesgos. Entre otros, que el producto esté limitado por sus capacidades funcionales frente a la competencia. Si los modelos locales no resuelven y los modelos en la nube también no se comportan de forma fiable, Apple corre el riesgo de tener una IA segura y privada pero técnicamente mediocre en sus respuestas. Siri ya fue criticada por ser especialmente tonta: Siri AI debe precisamente erradicar esa percepción.

En Xataka | Apple ha diseñado Siri AI para que usemos el iPhone sin tocarlo. Llevo haciendo lo mismo en mi móvil Android desde hace meses

Inicio