Nvidia presentó a principios de mayo la primera gráfica de arquitectura Volta, la Tesla V100. La compañía se centró en el modelo para centros de datos, en formato SXM2, que es una pequeña tarjeta con conector mezzanine —se sitúan varias contiguas en una placa base grande y encima el disipador—. Ahora ha presentado formalmente el modelo de Tesla V100 para ranuras PCIe, que tiene una potencia ligeramente distinta.
La frecuencia del procesador baja hasta los 1370 MHz desde los 1455 MHz, lo que hace que baje su consumo de los 300 W a los 250 W, y su potencia de cómputo de los 15 TFLOPS a los 14 TFLOPS, y el procesamiento tensorial de 120 a 112 TFLOPS. Los núcleos tensoriales son uno de los reclamos de esta tarjeta Tesla V100 para el sector empresarial, y se trata de un chip grandecito por ese motivo —815 mm2 frente a los 610 mm2 del P100—. Por último, este modelo carece del conexionado NVLink para conectarla con otras tarjetas Tesla V100.
Nvidia pondrá a la venta este modelo en formato tarjeta PCIe más adelante este mismo año a través de los fabricantes de sistemas y distribuidores oficiales de la compañía.
Tesla V100 (SXM2) | Tesla V100 (PCIe) | |
Núcleos CUDA | 5120 | 5120 |
Núcleos tensoriales | 640 | 640 |
Frecuencia base | ? | ? |
Frecuencia turbo | 1455 MHz | ≈1370 MHz |
Reloj de memoria | 1.75 Gb/s HBM2 | 1.75 Gb/s HBM2 |
Bus de datos de memoria | 4096 bits | 4096 bits |
Ancho de banda de memoria | 900 GB/s | 900 GB/s |
VRAM | 16 GB | 16 GB |
Caché L2 | 6 MB | 6 MB |
Media precisión | 30 TFLOPS | 28 TFLOPS |
Precisión simple | 15 TFLOPS | 14 TFLOPS |
Doble precisión | 7.5 TFLOPS (tasa 1/2) | 7 TFLOPS (tasa 1/2) |
Rendimiento tensorial (aprendizaje profundo) | 120 TFLOPS | 112 TFLOPS |
GPU | GV100 (815 mm2) | GV100 (815 mm2) |
N.º de transistores | 21 000 M | 21 000 M |
TDP | 300 W | 250 W |
Factor de forma | Mezzanine (SXM2) | PCIe |
Refrigeración | Pasiva | Pasiva |
Proceso de fabricación | 12 nm FFN de TSMC | 12 nm FFN de TSMC |
Vía: AnandTech.