Intel necesita una arquitectura que pueda rivalizar con la de los núcleos Zen y en realidad esa arquitectura son dos. Los próximos procesadores Alder Lake van a unificar nuevamente todas las gamas de procesadores de consumo de la compañía en una sola arquitectura escalable. En el Día de Arquitectura 2021 que ha celebrado la compañía ha dado detalles sobre los Alder Lake, nombrando a los dos tipos de núcleos como de rendimiento (P) y eficiencia (E).
La microarquitectura de ambos tipos de núcleos es distinta porque tienen orientaciones distintas y necesitan optimizaciones diferentes. De hecho, eso hace que en lo que ocupa un núcleo P entren cuatro núcleos E según se puede ver en la planta del chip Alder Lake mostrado durante el evento. Ambos tipos de núcleos están dirigidos por un director de hilos (Thread Director), por no darle ningún otro nombre más original, ya que parece que Intel tiene que darle un nombre al habitual planificador de hilos de cualquier procesador. Por aquello de parecer superinnovador aunque empresas como ARM y por tanto Qualcomm o Apple lleven usando este tipo de sistemas de planificación de núcleos mixtos desde hace años.
Todo lo mencionado por Intel no es nuevo y de hecho es genérico a este tipo de arquitecturas. Al final se basan en proporcionar al planificador del sistema operativo la máxima información sobre los núcleos del equipo para que el controlador del procesador tome las decisiones de en qué núcleo poner qué tarea en función de cosas como el nivel de procesamiento que está haciendo, la prioridad del hilo, las temperaturas de cada núcleo, etc. En el desarrollo de ese controlador ha precisado de la implicación estrecha de Microsoft para que funcione perfectamente en Windows que es donde Intel se la juega. La compañía ha venido a decir sobre Linux que «no es prioritario», así que ya se verá qué ocurre con este sistema operativo.
Pero con la llegada de Windows 11 y los cambios internos que lleva, los Alder Lake funcionarán mejor en él que en Windows 10. Esto es así porque el planificador de Windows 11 está pensado para tener núcleos de distintos tipos, ya sean núcleos físicos o los lógicos creados con las tecnologías multihilo que tienen menor potencia. Windows 10 planifica los núcleos lógicos algunas veces malamente. Al final Windows 11 está pensado para que funcione bien con los Alder Lake pero también con la tecnología big.LITTLE de ARM o cualquier otra que llegue en el futuro. Establecerá una gestión óptima de dónde ejecutar qué en base al controlador del procesador, por lo que al final el fabricante tendrá cierto grado de mejora a posteriori.
Lo importante en realidad es el coste de mover los hilos y su información entre núcleos P y E, y ahí es donde realmente hay mucha tela que cortar. Si se hace el movimiento de un P a un E y poco después se tiene que volver a mover al P, el coste energético puede no haber compensado en absoluto. Estos sistemas siempre tienen cierta inteligencia artificial adaptativa por detrás que va mejorando con el tiempo para evitar esas situaciones. Porque deducir en qué núcleo E, P «físico» o P «lógico» —el creado con el multihilo simultáneo (SMT)— poner la tarea va a ser complicado de hacer de manera eficiente. El propio procesador va a tener un microcontrolador para vigilar y controlador. En principios los núcleos P «lógicos» solo se usarán si el resto de P y E están ya ocupados, por lo que en el día a día no deberían de ser usados ya que un P «lógico» será menos potente que un E.
Procesadores Alder Lake para todos los gustos
Quizás lo que más os importe a la mayoría de los que leáis este artículo es qué planea Intel de cara a modelos concretos y su rendimiento. En este caso lo que puedo decir es lo que dice una de las transparencias de la compañía, la que tenéis justo arriba de este párrafo. En el sector sobremesa (LGA 1700) habrá modelos de hasta ocho núcleos P y ocho núcleos E; en el de portátiles habrá modelos de hasta seis núcleos P y ocho E; y en equipos orientados a ultraeficiencia (ultraportátiles, tabletas, ciertos móviles) habrá hasta dos núcleos P y ocho E.
Intel habla de que el núcleo P tiene hasta un 19 % más de rendimiento que el de los actuales Rocket Lake, que parece una enorme mejora intergeneracional. Los núcleos E tendrán un rendimiento similar a la arquitectura Skylake, incluso según lo indicado por la compañía hasta un 8 % mayor, con una reducción de consumo. Sobre el papel suena todo muy bien, pero habrá que ver el rendimiento real en, sobre todo, Windows 10, que será el sistema operativo mayoritario hasta dentro de unos años.
Usarán memoria DDR4-3200 o DDR5-4800 antes de recurrir a perfiles de memoria extremos, y para sistemas de bajo consumo podrán usar LPDDR4X-4266 o LPDDR5-5200. Pueden usar o DDR4 o DDR5 en un momento dado, no ambos a la vez, por lo que se crearán placas base para equipos de sobremesa con DDR4 y DDR5. Por coste sería previsible que inicialmente los fabricantes se decantaran sobre todo por DDR4, pero los rumores dicen que Intel lanzará solo los modelos K para entusiastas este año por lo que es probable que en realidad casi todas las placas base sean para DDR5.
En cuanto a la conectividad externa, todos los Alder Lake usarán canales PCIe 5.0, un total de dieciséis (PCIe 5.0 ×16), además de tener cuatro PCIe 4.0 (PCIe 4.0 ×4), repartidas como el fabricante de placa base considere oportuno —×8/×4/×4 para tarjetas gráfica y almacenamiento, por ejemplo—. Los canales PCIe del chipset van por separado. No parece que vaya a haber unidades de estado sólido PCIe 5.0 hasta principios del año que viene por lo que es una tecnología a futuro. También tendrán acceso a Thunderbolt 4 y a Wi-Fi 6E (802.11ax-2021).
Núcleos E y P juntos pero no revueltos
La última parte de la que hablar de esta presentación es la de los propios cambios internos a la arquitectura de los núcleos P (Golden Cove) y E (Gracemont). Intel ha detallado más cambios profundos en ambas arquitecturas de los que se puede deducir por su presentación para el ojo poco entrenado, pero se podría deducir que son los primeros cambios para encarrilar más cambios en próximas generaciones de procesadores. Como digo, son cambios sustanciales desde el número de octetos que puede manejar hasta la cola de microoperaciones.
El cambio más importante a nivel del conjunto de instrucciones es una eliminación y es la de las instrucciones AVX-512. Golden Cove podría tener acceso a ellas pero Gracemont no, y en una arquitectura híbrida todos los componentes deben tener acceso al mismo conjunto de instrucciones. Aun así no tienen fácil encaje en el sector consumo por lo que Intel ha debido pensar que es mejor dejarla para su entorno natural que es el profesional y de centros de datos. Ya se verá qué ocurre con AVX-512 en los Xeon.
En ciertos aspectos el decodificador de instrucciones iguala al de la arquitectura Zen por lo que Intel simplemente está igualando a la mejor arquitectura que hay ahora mismo en el mercado. No le queda otra porque para ganar rendimiento hay que aumentar el tamaño de palabra que pasa a ser de 32 bytes. Aumenta el tamaño de los decodificadores a seis —número de operaciones que se pueden decodificar por ciclo—, con mejoras en la latencia para que no penalice los cambios de tamaño, o cambios en el motor de ejecución fuera de orden.
Esto último es la fuente de vulnerabilidades en los últimos años, pero que en el núcleo Golden Cove pasa de 352 instrucciones a 512, el doble que el que tiene Zen 3 pero por debajo de las 630 que tiene la arquitectura de Apple. La ejecución fuera de orden es poner al núcleo a ejecutar código que puede ser necesitado en el futuro para avanzar trabajo en caso de que el procesador tenga margen para ello. Es un proceso que se basa en la intuición, por lo que puede haber fallos de ejecución y es consumo hecho de más para nada. Pero mientras haya más aciertos que fallos, y suele haber bastantes más aciertos que fallos, hay una ganancia neta de rendimiento.
Hay muchos otros cambios, como aumento de las cachés, unidades de enteros, la precaptura (prefetcher) de memoria, etc., que harán de esta Golden Cove una arquitectura mucho más en línea con lo que tiene AMD. Porque al final es AMD quien tiene la arquitectura buena ahora mismo en el sector sobremesa, dejando a un lado a Apple en todo esto.
En cuanto al núcleo E o eficiente (Gracemont), el bloque en el que irá metido se integran cuatro núcleos con 4 MB de caché de nivel 2 compartida y tiene un tamaño como un núcleo P. Es una arquitectura más sencilla pero con un buen rendimiento comparable a la arquitectura Skylake pero más importante aún con una reducción de consumo.
De hecho habla de que da un 40 % más de rendimiento a misma frecuencia o consume un 40 % menos a mismo rendimiento pico que Skylake. Si se comparan cuatro núcleos E con dos núcleos Skylake con multihilo, la ganancia es del 80 % en ambos terrenos. En resumidas cuentas, el núcleo E consume muchísimo menos que uno Skylake, que es la generación del Core i7-6700K.
El resto de cambios tocan los mismos palos que con el núcleos P. Se aumenta la cola de ejecución fuera de orden (256 entradas), los puertos de ejecución, más unidades aritmético-lógicas de enteros, etc., junto con un aumento de la caché que podrá ser de hasta los 4 MB mencionados, dependiendo del número de núcleos E que tenga el modelo de procesador en cuestión.