Los primeros productos con procesador Tegra K1 de 32 bits ya están en el mercado, y es lo que le da a la Shield Tablet un gran rendimiento gráfico. Una GPU con 192 núcleos CUDA no es cualquier cosa en el entorno de los dispositivos móviles. Pero la mayor limitación para su rendimiento es realmente la arquitectura de 32 bits de la CPU.

Estando muy cerca del lanzamiento del Tegra K1 de 64 bits, Nvidia ha proporcionado nuevos detalles sobre su arquitectura basada en ARMv8. Aunque cuenta con sólo dos núcleos en comparación con los cuatro núcleos del Tegra K1 de 32 bits, la arquitectura subyacente es mucho más rica y potente. Además, nunca se debería juzgar a un procesador por el número de núcleos sin mirar detenidamente debajo del capó.

Denver-Hot-Chips-TK1

En este caso, Nvidia ha proporcionado a cada núcleo 128 KB de caché de instrucciones y otros 64 KB de caché de datos, ambas de nivel 1 (L1). Es un tipo de caché en el que los procesadores almacenan datos traídos de memoria recientemente por si tienen que volver a usarse, y en la mayoría de las ocasiones es así. Es un tipo de memoria de acceso mucho más rápido que ir a la memoria principal, por lo que los beneficios en la computación son evidentes. Luego también le ha dotado de 2048KB de caché de nivel 2 (L2) que, si bien no es tan rápida como la L1, suele ser el almacen de datos usados recientemente pero no tanto como los de nivel 1. El procesador se encarga de ir gestionando la ubicación de los datos en caché entre los distintos tipos.

Nvidia también ha proporcionado al procesador de un sistema llamado Dynamic Code Optimization (optimización dinámica de código) que posee una memoria exclusiva de 128MB. Es quizás similar a las cachés de L1 y L2, pero en ella se almacena microcódigo para tareas que se realizan frecuentemente por las aplicaciones. Se trata de código que el procesador ha optimizado mediante técnicas software y hardware, y que representa una eficiente del código ARM original que se ejecutaría en otros procesadores para hacer funcionar las aplicaciones del usuario.

Denver-Hot-Chips-Core

La necesidad de procesamiento adicional por parte de la CPU para realizar esta optimización, al menos según Nvidia, es mucho menor que la ganancia en rendimiento del sistema. Este DCO también permite como no podía ser de otra forma mejorar la ejecución de instrucciones fuera de orden para realizar un mayor aprovechamiento de los ciclos del procesador, con mejoras en el ILP del procesador o ejecución paralela de instrucciones.

En definitiva, Nvidia asegura que gracias a estos dos núcleos de 64 bits y la CPU de 192 núcleos CUDA compatible con OpenGL 4.4, se pueden conseguir gráficos de calidad de PC de sobremesa en los dispositivos que incluyan un Tegra k1 'Denver' de 64 bits. Además ambos chips de 32 y 64 bits son compatibles en su disposición de pines, por lo que un fabricante sólo tendría que decidir el modelo de Tegra K1 que quiere soldar a la placa para que estuviera lista para funcionar, sin realizar ningún cambio de diseño. Quizás este sea el motivo por el que voy a pasar por ahora de comprar una Shield Tablet de 32 bits y me esperará a que Nvidia presente estas navidades la versión de 64 bits (que estoy seguro que llegará).

Fuente: Nvidia.