NVIDIA duplica el rendimiento de sus aceleradoras H100 y GH200 de IA en inferencias

por David Enviado el 12 sep 2023, 00:50:00 correo @geektopic Noticias

NVIDIA es la compañía más fuerte en el sector de la inteligencia artificial gracias a todo lo invertido en sus aceleradoras, pero buena parte de su éxito se debe al plano del software disponible. Ahora la compañía ha anunciado una nueva versión de TensorRT-LLM, su modelo de lenguaje grande usado para inferencias y que por tanto ahora mmismo está orientado a inteligencias artificiales generativas como ChatGPT.

Es de código abierto por lo que este sistema se puede usar en cualquier tarjeta gráficas siempre que tenga núcleos tensoriales. Según los datos de la compañía, en sus aceleradoras como la H100 el rendimiento en inferencias —que una red neuronal descubra, por ejemplo, qué objetos hay en una foto— se duplica. Entre las técnicas usadas para la optimización se encuentra la planificación de lotes al vuelo, lo cual asegura que los recursos de la GPU se están usando siempre al máximo.

Fuente: NVIDIA. Vía: Tom's Hardware.

Geektopia

NVIDIA duplica el rendimiento de sus aceleradoras H100 y GH200 de IA en inferencias

Artículos relacionados

TSMC indica que habrá escasez de las aceleradoras de NVIDIA para IA durante año y medio

AMD actualiza el lote de Starfield para incluir a las Radeon RX 7700 XT y 7800 XT

AMD pone a la venta las RX 7700 XT y RX 7800 XT, y finalmente hay algo de movimiento en los precios

Aparecen los resultados de AMD de las RX 7700 XT y 7800 XT

Comentarios