Es la noticia del día. Y, quizá, de la semana. El modelo de inteligencia artificial (IA) chino de código abierto DeepSeek R1 está provocando un terremoto en las tecnológicas estadounidenses. Y lo está haciendo debido a su naturaleza abierta. No obstante, su modelo de negocio no es lo único que representa una amenaza para las empresas de IA y semiconductores de EEUU. Lo más sorprendente es que la infraestructura que sostiene DeepSeek es relativamente modesta.
Para entender con cierta precisión de qué estamos hablando nos interesa recordar que la GPU para IA que se está utilizando actualmente con más frecuencia en los centros de datos es el chip H100 de NVIDIA. La compañía liderada por Jensen Huang ya está entregando las primeras unidades de su sucesora, la plataforma B200, que, como cabe esperar, sobre el papel es todavía más potente. Sin embargo, las sanciones aprobadas por el Gobierno de EEUU impiden a NVIDIA vender a sus clientes chinos estas GPU. Aquí reside en gran medida la capacidad rupturista de DeepSeek
La eficiencia de DeepSeek y su naturaleza abierta están convulsionando Silicon Valley
A las empresas chinas que se dedican a desarrollar y entrenar modelos de IA no les ha quedado otra opción que agudizar el ingenio. Sabemos que muchas de ellas siguen comprando las GPU más avanzadas de NVIDIA a través de intermediarios y en mercados paralelos, pero posiblemente no lo están haciendo en las cantidades que necesitan. Si nos ceñimos a DeepSeek según Financial Times la infraestructura utilizada para entrenar este modelo aglutina 2.048 chips H800 de NVIDIA. Y el entrenamiento con 671.000 millones de parámetros ha costado 5,6 millones de dólares.
Estas cifras son muy comedidas. De hecho, si realmente son fidedignas, y parecen serlo, pondrían sobre la mesa un hecho inapelable: los ingenieros de DeepSeek habrían logrado poner a punto un modelo de IA extremadamente competitivo con unos costes muy inferiores a los que han necesitado OpenAI y Google para desarrollar un modelo de IA equiparable. La GPU H800 es en gran medida la responsable de esta circunstancia. Y lo es debido a que fue la respuesta de NVIDIA a las prohibiciones de la Administración liderada por Joe Biden.
Los ingenieros de NVIDIA optaron por recortar las prestaciones de la GPU H100 con el propósito de que el Departamento de Comercio les permitiese venderla en China
Cuando el Gobierno de EEUU prohibió a la compañía de Jensen Huang entregar a sus clientes chinos su GPU más potente en aquel momento, el chip H100, los ingenieros de NVIDIA optaron por recortar sus prestaciones con el propósito de que el Departamento de Comercio les permitiese venderlo en China. El resultado fue, precisamente, la GPU H800, que no es otra cosa que una revisión simplificada, y, por tanto, menos potente del chip H100.
Todo se complicó de nuevo el 16 de noviembre de 2023. Y es que ese día el Gobierno de EEUU aprobó nuevas sanciones a China que, entre otras prohibiciones, impedían a NVIDIA entregar a sus clientes del país de Xi Jinping la GPU H800. Presumiblemente en ese momento los ingenieros de DeepSeek ya tenían en sus manos los chips H800 que necesitaban, aunque algunos analistas defienden que, en realidad, su infraestructura aglutina 50.000 GPU H100 compradas a través de intermediarios.
De ser así es evidente que la tensión que sostienen EEUU y China impediría a DeepSeek reconocer que tiene en su poder miles de chips ilegales. Sea como sea lo cierto es que la cotización de NVIDIA, Microsoft, ASML y otras grandes compañías de tecnología está cayendo de una forma muy acusada. De hecho, la empresa liderada por Jensen Huang ha perdido 400.000 millones en valor de mercado ante la posibilidad de que DeepSeek demuestre que para poner a punto un modelo de IA de vanguardia no hace falta recurrir a las GPU más potentes de NVIDIA u otras empresas. Si realmente esta IA ha sido entrenada solo con 2.048 chips H800 los cimientos de OpenAI, Google y otras empresas se agrietarán. Y esta industria dará a la optimización y la eficiencia la importancia que tienen. Veremos qué sucede finalmente.
Imagen | NVIDIA
Más información | Financial Times
Ver 8 comentarios
8 comentarios
sanamarcar
Estaba un poquito inflada y el propio Jen-Hsun Huang ya avisaba esto podia pasar y eso que muchas empresas han tenido que luchar sin tener acceso a TSMC porque patata...
TwintiTarantino
Hay veces que es el arquero y no el arco
reiizumi
Complicado el tema, ya que se divide en muchas opciones:
- Si es mentira y realmente tienen un nivel de gráficas/potencia a la altura de sus competidores, no habrá diferencia con ellos, con lo que es bastante irrelevante.
- También es posible que su entrenamiento sea muy inferior (en tamaño) al de los rivales con más potencia y/o que este tenga una buena eficiencia. Si es capaz de funcionar igual o ligeramente por debajo de sus rivales, sería inaudito, los dejaría en mala posición.
- Si el hardware que utilizan es cierto y el rendimiento final no está muy por debajo del resto, prácticamente habría arrollado a sus rivales. Coste inicial + mantenimiento absurdamente más bajo al resto haría que todos los demás no tuvieran prácticamente sentido de existir.
Tengo esperanza de que sea la 3a opción, pero mucho me temo que estará más en la 1a.
Si se pudiera demostrar el hardware real que utiliza, el mercado de Nvidia volveria a cambiar. Si el hardware es lo que dicen los analistas, Nvidia subiría aun más al "confirmar" que si o si le necesitas en máxima potencia. Si se demuestra que el hardware "publicado" es verdad, bajaría en picado.
alejomm42
Pero si se demuestra que están trabajando con chips H800 no sería de todas maneras beneficioso para NVIDIA? demostrarían que aunque se tratase de un chip inferior al H100 la potencia del mas antiguo tiene mucho que demostrar y no tendía que desvalorizarse ante la entrada de nuevas GPU manteniendo buenos ingresos para la compañía
fomlimalma
Así si sean chips Nvidia H100 o H800 o una combinación de ambos, Al final del día xi jinpooh y sus esbirros sin la tecnología de occidente no son nada