El director ejecutivo de NVIDIA ha asegurado en alguna ocasión que cree importante que EUA restrinja la venta de aceleradoras de computación a China por motivos de seguridad nacional. Pero a su vez, no hace más que crear modelos de aceleradoras que permiten a la compañía saltarse las restricciones que impone el Gobierno de su país. Doblepensar en estado puro, donde una cosa y la contraria están bien al mismo tiempo. Me recuerda a cierto español que… Bueno, dejando distracciones a un lado, NVIDIA ha puesto en China tres nuevas aceleradoras con la potencia justa para saltarse las últimas restricciones impuestas por el ministro de Comercio de EUA.
Su lanzamiento ha tenido varios retrasos por motivos sin especificar. La primera en llegar es la H20, que tiene ya una potencia con bastantes competidores, aunque NVIDIA sigue contando con la ventaja de CUDA, la arquitectura que le ha permitido mantener el liderazo en cómputo desde que vio la luz en 2007. Las otras dos son la L20 y la L2, ambas para conexión PCIe. En la siguiente gráfica se puede ver bien en dónde se sitúan estas nuevas aceleradoras de NVIDIA y todo lo que tiene prohibido vender en China.
Estos vetos no tienen un impacto real en la evolución de la potencia de cómputo de China, aunque sí que le ha puesto una zancadilla temporal. Por ejemplo, las RTX 4090 se han seguido comprando a través del mercado gris en grandes cantidades aunque a mayor coste, lo cual ha causado problemas de abastecimiento en Occidente. El resto de aceleradoras que tiene prohibido comprarle directamente a NVIDIA las sigue comprando a través de empresas de terceros países que las revenden a China, en un entramado complejo de empresas para ocultar rastros y evitar las inspecciones del ministerio de Comercio de EUA. Algo así como lo que está haciendo para comprar la maquinaria litográfica vetada a China.
Obviamente a China le cuesta más adquirirlas. La compra directa de las nuevas aceleradoras lo que hará es que necesita el doble o triple de espacio en los centros de datos para conseguir la misma capacidad de cómputo, principalmente para entrenamiento de grandes modelos de lenguaje. Ni el espacio ni la energía son ahora mismo un problema en China, gracias al petróleo y gas barato que está comprando a Rusia, en lugar del caro y costoso de transportar que Occidente le estamos comprando a Estados Unidos de América, así que realmente las sanciones estorban pero no están evitando el rápido avance en IA de China.
La H20, frente a la H100, tiene 44 TFLOPS de potencia de cómputo FP32 en lugar de 66 TFLOPS, pero tiene 96 GB de HBM3 para un ancho de banda de 4 TB/s en lugar de 80 GB y 3.36 TB/s. Su consumo cae de 700 W a 400 W, con PCIe 5.0 ×16, y el mismo NVLink de 900 GB/s. Vamos, las compañías chinas solo tienen que comprar un 50 % más de H20 que de H100, y listo.
El problema es la disponibilidad, porque NVIDIA tiene sobredemanda de estas tarjetas, pero las H20 las vende en torno a 15 000 dólares (estimado), en lugar de los 30 000 dólares de la H100 (estimado). A NVIDIA le sirve para soltar chips que no conforman como la H100, por lo que encima las sanciones le están haciendo un favor. La competencia, Huawei, está vendiendo la Ascend 910B a unos 17 000 dólares, que es principalmente usada por Baidu y tiene más potencia que la H20.
Fuente: Reuters. Vía: Tom's Hardware.