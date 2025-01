Es la noticia del día. Y, quizá, de la semana. El modelo de inteligencia artificial (IA) chino de código abierto DeepSeek R1 está provocando un terremoto en las tecnológicas estadounidenses. Y lo está haciendo debido a su naturaleza abierta. No obstante, su modelo de negocio no es lo único que representa una amenaza para las empresas de IA y semiconductores de EEUU. Lo más sorprendente es que la infraestructura que sostiene DeepSeek es relativamente modesta.

Para entender con cierta precisión de qué estamos hablando nos interesa recordar que la GPU para IA que se está utilizando actualmente con más frecuencia en los centros de datos es el chip H100 de NVIDIA. La compañía liderada por Jensen Huang ya está entregando las primeras unidades de su sucesora, la plataforma B200, que, como cabe esperar, sobre el papel es todavía más potente. Sin embargo, las sanciones aprobadas por el Gobierno de EEUU impiden a NVIDIA vender a sus clientes chinos estas GPU. Aquí reside en gran medida la capacidad rupturista de DeepSeek

La eficiencia de DeepSeek y su naturaleza abierta están convulsionando Silicon Valley

A las empresas chinas que se dedican a desarrollar y entrenar modelos de IA no les ha quedado otra opción que agudizar el ingenio. Sabemos que muchas de ellas siguen comprando las GPU más avanzadas de NVIDIA a través de intermediarios y en mercados paralelos, pero posiblemente no lo están haciendo en las cantidades que necesitan. Si nos ceñimos a DeepSeek según Financial Times la infraestructura utilizada para entrenar este modelo aglutina 2.048 chips H800 de NVIDIA. Y el entrenamiento con 671.000 millones de parámetros ha costado 5,6 millones de dólares.

Estas cifras son muy comedidas. De hecho, si realmente son fidedignas, y parecen serlo, pondrían sobre la mesa un hecho inapelable: los ingenieros de DeepSeek habrían logrado poner a punto un modelo de IA extremadamente competitivo con unos costes muy inferiores a los que han necesitado OpenAI y Google para desarrollar un modelo de IA equiparable. La GPU H800 es en gran medida la responsable de esta circunstancia. Y lo es debido a que fue la respuesta de NVIDIA a las prohibiciones de la Administración liderada por Joe Biden.

Los ingenieros de NVIDIA optaron por recortar las prestaciones de la GPU H100 con el propósito de que el Departamento de Comercio les permitiese venderla en China

Cuando el Gobierno de EEUU prohibió a la compañía de Jensen Huang entregar a sus clientes chinos su GPU más potente en aquel momento, el chip H100, los ingenieros de NVIDIA optaron por recortar sus prestaciones con el propósito de que el Departamento de Comercio les permitiese venderlo en China. El resultado fue, precisamente, la GPU H800, que no es otra cosa que una revisión simplificada, y, por tanto, menos potente del chip H100.

Todo se complicó de nuevo el 16 de noviembre de 2023. Y es que ese día el Gobierno de EEUU aprobó nuevas sanciones a China que, entre otras prohibiciones, impedían a NVIDIA entregar a sus clientes del país de Xi Jinping la GPU H800. Presumiblemente en ese momento los ingenieros de DeepSeek ya tenían en sus manos los chips H800 que necesitaban, aunque algunos analistas defienden que, en realidad, su infraestructura aglutina 50.000 GPU H100 compradas a través de intermediarios.

De ser así es evidente que la tensión que sostienen EEUU y China impediría a DeepSeek reconocer que tiene en su poder miles de chips ilegales. Sea como sea lo cierto es que la cotización de NVIDIA, Microsoft, ASML y otras grandes compañías de tecnología está cayendo de una forma muy acusada. De hecho, la empresa liderada por Jensen Huang ha perdido 400.000 millones en valor de mercado ante la posibilidad de que DeepSeek demuestre que para poner a punto un modelo de IA de vanguardia no hace falta recurrir a las GPU más potentes de NVIDIA u otras empresas. Si realmente esta IA ha sido entrenada solo con 2.048 chips H800 los cimientos de OpenAI, Google y otras empresas se agrietarán. Y esta industria dará a la optimización y la eficiencia la importancia que tienen. Veremos qué sucede finalmente.

Imagen | NVIDIA

Más información | Financial Times

En Xataka | China está vigilando de cerca el movimiento de Estados Unidos con Stargate. Y ya tiene preparada su respuesta