Nvidia presenta formalmente la Tesla V100 en formato PCIe

Nvidia presentó a principios de mayo la primera gráfica de arquitectura Volta, la Tesla V100. La compañía se centró en el modelo para centros de datos, en formato SXM2, que es una pequeña tarjeta con conector mezzanine —se sitúan varias contiguas en una placa base grande y encima el disipador—. Ahora ha presentado formalmente el modelo de Tesla V100 para ranuras PCIe, que tiene una potencia ligeramente distinta.

La frecuencia del procesador baja hasta los 1370 MHz desde los 1455 MHz, lo que hace que baje su consumo de los 300 W a los 250 W, y su potencia de cómputo de los 15 TFLOPS a los 14 TFLOPS, y el procesamiento tensorial de 120 a 112 TFLOPS. Los núcleos tensoriales son uno de los reclamos de esta tarjeta Tesla V100 para el sector empresarial, y se trata de un chip grandecito por ese motivo —815 mm² frente a los 610 mm² del P100—. Por último, este modelo carece del conexionado NVLink para conectarla con otras tarjetas Tesla V100.

Nvidia pondrá a la venta este modelo en formato tarjeta PCIe más adelante este mismo año a través de los fabricantes de sistemas y distribuidores oficiales de la compañía.

	Tesla V100 (SXM2)	Tesla V100 (PCIe)
Núcleos CUDA	5120	5120
Núcleos tensoriales	640	640
Frecuencia base	?	?
Frecuencia turbo	1455 MHz	≈1370 MHz
Reloj de memoria	1.75 Gb/s HBM2	1.75 Gb/s HBM2
Bus de datos de memoria	4096 bits	4096 bits
Ancho de banda de memoria	900 GB/s	900 GB/s
VRAM	16 GB	16 GB
Caché L2	6 MB	6 MB
Media precisión	30 TFLOPS	28 TFLOPS
Precisión simple	15 TFLOPS	14 TFLOPS
Doble precisión	7.5 TFLOPS (tasa 1/2)	7 TFLOPS (tasa 1/2)
Rendimiento tensorial (aprendizaje profundo)	120 TFLOPS	112 TFLOPS
GPU	GV100 (815 mm²)	GV100 (815 mm²)
N.º de transistores	21 000 M	21 000 M
TDP	300 W	250 W
Factor de forma	Mezzanine (SXM2)	PCIe
Refrigeración	Pasiva	Pasiva
Proceso de fabricación	12 nm FFN de TSMC	12 nm FFN de TSMC