NVIDIA ha anunciado una nueva tarjeta gráfica orientada a centros de datos, aunque no es tampoco demasiado nueva. Se trata de una versión de la A100, pero con 80 GB de memoria, aunque en este caso también mejora sustancialmente la calidad de la misma. Se trata de HBM2 que funciona a 3.2 Gb/s en lugar de 2.4 Gb/s, lo que lleva el ancho de banda de memoria de esta tarjeta gráfica hasta los 2 TB/s frente a los 1.5 TB/s del modelo de 40 GB.
La compañía ha indicado que ya se pueden comprar equipos DGX A100 y DGX Station A100 que incluyen varias de estas A100 de 80 GB, aunque no se entregarán hasta el primer trimestre de 2021. Otros socios de la compañía como Dell, Gigabyte, HP, Lenovo o Supermicro están preparando servidores que hacen uso de esta nueva versión.
Por lo demás, se trata del mismo chip GA100 de 826 mm2 de tamaño y 54 200 millones de transistores. Incluye 6912 núcleos CUDA de tipo FP32 para una potencia de cómputo en precisión simple de 19.5 TFLOPS, en doble precisión de 9.7 TFLOPS y cuya potencia de cómputo de sus núcleos tensoriales alcanza los 624 TOPS en INT8, 312 TFLOPS en media precisión, y 156 TFLOPS en TF32 (tensor flotante). El cálculo tensorial es muy utilizado en inteligencia artificial y se basa en el uso de la entidad algebraica conocida como tensor. No hay que tener miedo a escribir tensor o tensorial en español porque es algo tan normal en cálculo matemático como decir derivada, integral o matriz, y por tanto tampoco a decir «núcleo tensorial» que es lo que incluyen los chips de NVIDIA. No es la unidad más habitual en cálculo, pero eso no quiere decir que no se use en español sin tener que recurrir a dejar las cosas en inglés o decirlo a la inglesa.
El beneficio inmediato de la duplicación de memoria y del mayor ancho de banda es una mejora del rendimiento en todas las tareas —se presupone que estos sistemas son para usarlos en carga completa; no te gastas cientos de miles de dólares para que esté parado el equipo o a medio gas— al eliminar limitaciones en el movimiento de datos con la memoria en situaciones de carga completa, y también una mayor eficiencia energética.
Vía: AnandTech.