Hace unos días unos de los inventólogos rumorólogos que más noticias dan dijo que los chips Blackwell que está preparando NVIDIA para las RTX 50 no iban a tener un aumento de las estructuras básicas, sino que la compañía se centraría en mejoras sustanciales de la arquitectura. Eso básicamente es lo que tiene que cambiar NVIDIA porque su arquitectura no ha cambiado prácticamente nada en seis años. Me refiero a la de los CUDA, no a la adición de los núcleos tensoriales y de trazado de rayos. Ahora @kopite7kimi viene a reafirmarse en ello, aunque dependerá del chip que se mira.
Aparentemente NVIDIA tendría un par de chips principales, los GB100 y GB202, pero que sí que aportarían un cambio sustancial en el número de núcleos CUDA. La estructura básica de un chip de NVIDIA es el clúster de procesamiento gráfico (GPC), que incluye a su vez seis a nueve clústeres de procesamiento de texturas (TPC), y estas a su vez tienen dos multiprocesadores de flujos de datos (SM). Cada SM está compuesto de 128 núcleos CUDA.
Según @kopite7kimi, el GB100 para computación que sustituiría al GH100 mantendría los ocho GPC, pero cada uno pasaría a tener diez TPC. El chip completo pasaría de 18 432 CUDA a 20 480 CUDA. Lo importante de estos chips para cómputo son los núcleos tensoriales, por lo que los CUDA realmente importan bastante menos, aunque obviamente todo ayuda para cobrar miles de dólares por el chip. Estará acompañada de memoria HBM3E de 1.5 TB/s por chip, por lo que a ocho previsibles chips de memoria que acompañe a cada GPU, el ancho de banda total va a rozar los 10 TB/s frente a los 3.3 TB/s del GH100. Este chip aunque será presentado a principios de 2024 probablemente no esté a la venta hasta finales de 2024 o principios de 2025.
Más interesante para los jugones sería el GB202 que sustituirá al AD102. Mantendría los doce GPC pero cada uno pasaría de seis a ocho TPC, por lo que el chip completo pasaría de 18 432 CUDA a los 24 576 CUDA, un 33 % más. El problemas de la arquitectura Ada es que está fuertemente lastrada por el ancho de banda de memoria. Sí, NVIDIA ha aumentado notablemente la caché de nivel 2, pero aun así es insuficiente para sacar todo el provecho a la potencia del chip. El bus de memoria pasaría a los 512 bits, que junto a GDDR7 a 32 Gb/s, el ancho de banda podría llegar a 2 TB/s, el doble que el que incluye la RTX 4090. Esto es la teoría. Luego la realidad ya se verá en qué se queda.
Vía: Tom's Hardware.