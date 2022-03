«El M1 Ultra marca un antes y un después en la historia de los chips de Apple que va a conmocionar el sector del PC de nuevo. Conectar dos chips M1 Max con la arquitectura de empaquetado UltraFusion nos permite llevar los chips de Apple a nuevas cotas». Esta declaración de Johny Srouji, que es uno de los máximos responsables del departamento de tecnologías de hardware de Apple, no deja lugar a dudas acerca de la confianza que tiene esta marca en este chip.

Como explica Srouji, el procesador M1 Ultra es el resultado de la interconexión de dos chips M1 Max, lo que refleja que probablemente Apple lo introdujo en su hoja de ruta cuando esta familia de microprocesadores dio sus primeros pasos. En cualquier caso, los cimientos de las cuatro CPU en las que vamos a indagar son los mismos. Comparten una misma filosofía de diseño, la misma microarquitectura, y también la misma tecnología de fabricación.

Los procesadores M1 Ultra, M1 Max, M1 Pro y M1 están siendo producidos por el fabricantes taiwanés de semiconductores TSMC utilizando fotolitografía de 5 nm. El más ambicioso de estos chips, el modelo Ultra presentado ayer por Apple, aglutina nada menos que 114 000 millones de transistores, una cifra impactante ante la que los 16 000 millones del procesador M1 original palidecen.

Al igual que los demás miembros de la familia M1, el nuevo chip Ultra recurre a dos tipos de núcleos diferentes con el propósito de balancear el rendimiento, el nivel de disipación de energía térmica y el consumo de la CPU en tiempo de ejecución tomando como referencia los requisitos impuestos por los hilos (threads) que están siendo procesados en un instante dado.

Un procesador M1 Max incorpora diez núcleos de propósito general destinados a la CPU, de modo que ocho de ellos son de alto rendimiento, y los dos restantes de alta eficiencia. A partir de aquí y teniendo presente que un chip M1 Ultra es el resultado de unir dos M1 Max podemos concluir con facilidad cuáles son sus cifras: veinte núcleos de CPU, de los cuales dieciséis son de alto rendimiento, y los cuatro restantes de alta eficiencia.

Basta echar un vistazo con un poco de atención a las especificaciones del procesador M1 Ultra para darnos cuenta de que está destinado sobre todo a estaciones de trabajo. Al fin y al cabo el nuevo Mac Studio, que es el primer ordenador que lo integra, más allá de que su diseño sea tan estilizado y compacto, es un equipo con una clara vocación profesional, especialmente la versión que está equipada con un procesador M1 Ultra (también puede apoyarse en un M1 Max).

Apple M1 Ultra, M1 Max, M1 Pro y M1: especificaciones técnicas



M1 ultra m1 max m1 pro m1 FOTOLITOGRAFÍA 5 nm 5 nm 5 nm 5 nm número de transistores 114 000 millones 57 000 millones 33 700 millones 16 000 millones FABRICANTE TSMC TSMC TSMC TSMC número de núcleos cpu 20 10 10 / 8 8 núcleos de alto rendimiento (AR) 16 8 8 / 6 4 núcleos de alta eficiencia (Ae) 4 2 2 4 caché instrucciones (AR) 192 KB 192 KB 192 KB 192 KB caché datos (AR) 128 KB 128 KB 128 KB 128 KB caché nivel 2 compartida (AR) 48 MB 24 MB 24 MB 12 MB caché instrucciones (Ae) 128 KB 128 KB 128 KB 128 KB caché datos (AE) 64 KB 64 KB 64 KB 64 KB caché nivel 2 compartida (ae) 8 MB 4 MB 4 MB 4 MB número de núcleos gráficos 64 32 / 24 16 / 14 8 unidades de ejecución 8192 4096 2048 1024 fp32 20,8 TFLOPS 10,4 TLOPS 5,2 TFLOPS 2,6 TFLOPS memoria principal máxima 128 GB 64 GB 32 GB 16 GB tecnología de memoria LPDDR5-6400 LPDDR5-6400 LPDDR5-6400 LPDDR4X-4266 ancho de banda de memoria 800 GB/s 400 GB/s 200 GB/s 68 GB/s núcleos neural engine (NE) 32 16 16 16 operaciones por segundo (NE) 22 billones 11 billones 11 billones 11 billones

Escalabilidad: esta es la mejor baza de los procesadores M1

La tabla que publicamos encima de estas líneas refleja con una claridad enorme la indiscutible escalabilidad que pone encima de la mesa la arquitectura implementada en esta familia de microprocesadores.

Los núcleos de alto rendimiento y alta eficiencia son esencialmente idénticos en estos chips, de manera que los ingenieros de Apple pueden actuar sobre su número, sobre el espacio compartido de las memorias caché de niveles 2 y 3, sobre el número de núcleos gráficos y sobre la interfaz de memoria para balancear con relativa facilidad el rendimiento y el consumo de estas CPU.

La lógica gráfica integrada en los procesadores M1 Pro, y, sobre todo, M1 Max, es muy capaz, pero la del M1 Ultra juega en otra liga. Es el resultado, una vez más, de escalar el hardware de los demás chips de la familia, pero lo que nos propone, si nos ceñimos a la información que tenemos actualmente, que es la que nos ha proporcionado Apple, impresiona.

La fuerza bruta de la lógica gráfica del chip M1 Ultra es equiparable a la de las GPU más ambiciosas que tienen en su catálogo actualmente NVIDIA y AMD

Y es que en teoría su fuerza bruta es perfectamente equiparable a la de los procesadores gráficos más ambiciosos que tienen en su catálogo actualmente NVIDIA y AMD. De hecho, en algunos apartados la lógica gráfica del M1 Ultra es incluso más capaz. Sus 20,8 TFLOPS (FP32) convencen, pero son su tasa de relleno de texturas de 660 Gtexeles/s y los 330 Gpíxeles/s de su tasa de píxeles los que más impactan.

Como referencia podemos fijarnos en las cifras de una GPU GeForce RTX 3080 Ti de NVIDIA. Su tasa de texturas es 532,8 Gtexeles/s, y su tasa de píxeles asciende a 186,5 Gpíxeles/s. Estas cifras solo reflejan una visión parcial del rendimiento de un procesador gráfico porque hay muchos otros subsistemas de la GPU que es necesario considerar, pero nos sirven para poner en contexto los números de la lógica gráfica del chip M1 Ultra.

En la fotografía que publicamos debajo de estas líneas podemos ver la interfaz física utilizada por Apple para resolver la comunicación de los dos chips M1 Max que conforman un procesador M1 Ultra. El corazón de la arquitectura de empaquetado UltraFusion, que es como se llama la innovación que permite a las dos CPU M1 Max trabajar en perfecta sincronía, es un enlace que aglutina más de 10 000 conductores.

El corazón de la tecnología de empaquetado UltraFusion es un enlace de alto rendimiento que aglutina más de 10 000 conductores

Esta vía de comunicación es capaz de alcanzar un ancho de banda máximo teórico de 2,5 TB/s, que es una auténtica barbaridad. No obstante, es imprescindible que los núcleos y las demás unidades funcionales de la lógica de cada M1 Max se puedan comunicar con una latencia mínima. De lo contrario la productividad global del procesador M1 Ultra se resentiría al ejecutar aplicaciones multihilo capaces de alojar threads en los núcleos situados a ambos lados del enlace de alto rendimiento.

Es evidente que lo que han perseguido los ingenieros de Apple durante la fase de diseño de la arquitectura de empaquetado UltraFusion es conseguir que en la práctica no se perciba que un procesador M1 Ultra está constituido por dos chips M1 Max. En este ámbito minimizar la latencia es crucial, pero también es muy importante brindar al sistema operativo la ilusión de que por debajo de él hay una única CPU equipada con 20 núcleos. De esta forma los desarrolladores no tienen que preocuparse de las peculiaridades del chip M1 sobre el que va a ser ejecutado su software.

Antes de que echemos un vistazo a las cifras que ha publicado Apple para describir el rendimiento por vatio del procesador M1 Ultra merece la pena que indaguemos brevemente en la memoria principal con la que puede trabajar esta CPU. Al igual que los chips M1 Pro y M1 Max, el M1 Ultra trabaja en tándem con memorias LPDDR5-6400, aunque este último permite la instalación de un mapa de memoria principal unificada con una capacidad máxima de 128 GB. El ancho de banda máximo teórico de este subsistema asciende, según Apple, a 800 GB/s.

Por otro lado, la lógica que se responsabiliza de ejecutar los algoritmos de inteligencia artificial es, de nuevo, el resultado de enlazar dos chips M1 Max. Y es que el motor Neural Engine del procesador M1 Ultra incorpora 32 núcleos (frente a los 16 de cada chip M1 Max), lo que le permite llevar a cabo la monstruosa cifra de 22 billones de operaciones por segundo. Y se trata de billones de los nuestros, no de los anglosajones.

La relación rendimiento por vatio que nos promete Apple es fabulosa

Llegamos a la parte más controvertida de la presentación que Apple hizo ayer. La eficiencia de los procesadores de la familia M1 está fuera de toda duda si nos ceñimos al resultado que hemos obtenido en nuestras pruebas de rendimiento hasta ahora, pero las cifras que nos propone esta marca para describir el rendimiento por vatio del chip M1 Ultra son impactantes.

Según Apple un procesador M1 Ultra casi consigue duplicar el rendimiento de un PC equipado con una CPU Intel Core i9-12900K y memoria DDR5

En la siguiente diapositiva podemos ver que, según Apple, un procesador M1 Ultra casi consigue duplicar el rendimiento de un PC equipado con una CPU Intel Core i9-12900K y memoria DDR5 cuando ambos arrojan un consumo de 60 vatios. Cuando tengamos la oportunidad de analizar el primer ordenador de Apple equipado con un procesador M1 Ultra comprobaremos si, efectivamente, su rendimiento por vatio es tan atractivo como defiende Apple.

En la siguiente diapositiva intervienen los mismos púgiles de la gráfica anterior: el procesador M1 en un lado del cuadrilátero, y en el otro un PC equipado con una CPU Intel Core i9-12900K y memoria DDR5. Lo que refleja esta segunda gráfica es que, siempre según Apple, el procesador M1 Ultra consigue igualar el rendimiento relativo del PC cuando el primero arroja un consumo de unos 40 vatios, y el segundo roza los 160 vatios.

Las cifras que ha publicado Apple contribuyen a generar unas expectativas muy altas alrededor del chip M1 Ultra

Es evidente que Apple es parte interesada, y no conocemos con detalle en qué condiciones y con qué software ha elaborado estas gráficas, pero no cabe duda de que estas cifras contribuyen a generar unas expectativas muy altas alrededor del chip M1 Ultra. Posiblemente no tardaremos mucho en poder confirmar si estos números reflejan fielmente la realidad, pero, de nuevo, son muy prometedores.

La última gráfica elaborada por Apple persigue hacer aún más profunda la herida que pretende infligir a sus competidores. Y es que los de Cupertino defienden que un equipo con un chip M1 Ultra consigue igualar el rendimiento relativo de un PC equipado con un procesador Intel Core i9-12900K, memoria DDR5 y nada menos que una tarjeta gráfica dotada de una GPU GeForce RTX 3090 de NVIDIA cuando el primero arroja un consumo de poco más de 100 vatios, y el segundo supera con claridad los 300 vatios.

En la última diapositiva Apple pretende poner en valor la capacidad de la lógica gráfica integrada en su procesador M1 Ultra

Resulta cuando menos llamativo que Apple haya decidido introducir en esta diapositiva una tarjeta gráfica tan ambiciosa como la GeForce RTX 3090, que por sí sola según NVIDIA arroja un consumo de 350 vatios bajo carga. No obstante, es probable que su intención sea poner en valor la capacidad que tiene la lógica gráfica integrada en su nuevo procesador M1 Ultra. Será muy interesante comprobar por nosotros mismos si está realmente a la altura de las expectativas cuando el primer ordenador equipado con este chip caiga en nuestras manos.

Más información | Apple