NVIDIA ha expandido su catálogo de aceleradoras con el modelo A2, una tarjeta gráfica sencilla que está orientada a potenciar los servidores en las fronteras de las redes. Es un modelo sencillo, de una ranura PCIe de grosor siendo además de perfil bajo. Su consumo estimado se sitúa entre los 40 y 60 vatios, usando una conexión PCIe 4.0 ×8.
Aparentemente usa una versión recortada del chip GA107, configurado con 1280 núcleos CUDA a 1.77 GHz de turbo, y dispone de 16 GB de memoria GDDR6 a 12.5 GHz. El bus de memoria es de 128 bits y por tanto tiene un ancho de banda total de 200 GB/s.
La potencia de cómputo en coma flotante en precisión estándar (FP32) es de 4.5 TFLOPS, pero al contar con diez núcleos tensoriales también hay que mirar a esa potencia. Alcanza los 9 TOPS en precisión normal (TF32) o 18 TOPS aplicando matrices dispersas, duplicándose en coma flotante en media precisión (FP16), , 36/72 TOPS en enteros de 8 bits (INT8) y hasta 144 TOPS en enteros de cuatro bits (INT4). Es por ello que NVIDIA la orienta más a inferencias ya que usan sobre todo cálculo de enteros (INT4, INT8) por simplificar los problemas.
Vía: AnandTech.