Las unidades de procesamiento gráfico (GPU) que potencian las tarjetas gráficas han mantenido una arquitectura monolítica por cuestiones tecnológicas y de fabricación. La alternativa es usar varios chíplets unidos por una interconexión, pero esta debe tener un alto ancho de banda para no limitar la comunicación entre ellos. Aunque además hay que tener la forma de conectarlos a través del sustrato u otro método de manera barata. AMD ha tenido éxito en estos retos con las GPU de tipo Navi 3x, y ahora ha hablado un poco más de ello.
Pero una particularidad de conectar diversos chíplets en una GPU es que los sombreadores hacen un uso mucho más intensivo de la memoria de la tarjeta gráfica. Son miles de núcleos los que acceden a la información y no solo unas decenas como mucho como ocurre en las CPU. Ahí es donde entra en juego los enlaces ramificados Infinity que ha desarrollado AMD, aportando diez veces más ancho de banda del que precisan los chíplets de un procesador EPYC.
Estos enlaces Infinity cuentan con un ancho de banda de 9.2 Gb/s cada uno con un diseño ramificado de alto rendimiento que permite en el Navi 31 un ancho de banda de 5.3 TB/s de pico —el doble que la interconexión UltraFusion de Apple—, lo cual es un ancho de banda impresionante. Una ramificación (fanout) es una forma de extender las salidas de un chip más allá de la planta del propio chip por diversos métodos —por ejemplo, un material epoxi— para facilitar su encapsulado con otros chips, lo cual abarata la producción. Es algo similar, por no decir igual, a lo que Apple utiliza en el M1 Ultra que también produce TSMC, por lo que deben ser la misma tecnología, pero con algunos cambios para que funcione bien para AMD.
El diseño de AMD está pensado para operar a un bajo voltaje, pero haciendo uso de más enlaces ramificados Infinity, lo cual permite una reducción de consumo de hasta un ochenta por ciento por bit respecto a usar intermediadores entre los chips. Estos últimos son más grandes pero más baratos, aunque inapropiados para conectar los chíplets de una GPU.
La ventaja de las ramificaciones es que son de muy baja latencia al quedarse integradas en los chíplets y permitir que estos estén mucho más pegados entre ellos. En teoría esta forma de conectar chips introduce algo de latencia, lo cual es inevitable tener que mover información entre chíplets en lugar de hacer el acceso localmente en el chip. Pero con los cambios hechos y esta forma de producir los chips, asegura que el tiempo de acceso a la caché Infinity es un diez por ciento inferior al que tiene el chip monolítico Navi 21.
Por último está el tema del dinero. Es más barato producir chíplets porque aumentas la productividad de las obleas. No es lo mismo descartar un chip de 500 mm2 defectuoso que uno de 100 mm2. El chip de cómputo (GCD) tiene sobre los 300 mm2, mientras que los de E/S tienen 37 mm2. Por tanto, la producción mediante chíplets aporta una mayor tolerancia a los defectos de producción. Es por ello que los chíplets son el futuro de la producción de las CPU y GPU, siendo por lo que todas las compañías (Intel, AMD, NVIDIA, TSMC, GlobalFoundries, etc.) están intentando estandarizar la interconexión entre chíplets a nivel de diseño y producción.
Vía: TechPowerUp.