La renovación de tarjetas gráficas de este 2020 ha llegado con una buena cantidad de polémicas debido a la baja disponibilidad de los modelos de AMD y NVIDIA, por lo que los que dependemos de la disponibilidad en tiendas de los productos para probarlos nos está resultando más difícil que nunca. Mi intención inicial era hacer primeramente el análisis de la RTX 3080 para después hacer el de la RTX 3090, pero finalmente va a ser al revés.
El modelo que finalmente he conseguido por los canales normales es la GeForce RTX 3090 Trinity de Zotac, que es un modelo con las frecuencias de referencia de NVIDIA para este modelo. Pero es uno de alto rendimiento y buena cuenta de ello lo da los tres ventiladores que incluye y una buena estética, por lo que es tan buen modelo como el de cualquier otra compañía para probar lo que ofrece el modelo de referencia.
En este análisis encontraréis un breve desembalado del producto, sus características generales y un repaso por encima del chip que incluye, el GA102. Tras ello procedo a las pruebas de rendimiento en juegos, la comprobación de la capacidad de subida de este modelo en concreto, consumos y temperaturas. Nada del otro mundo, aunque en las pruebas hallaréis los resultados a FHD, QHD y UHD, con y sin DLSS si lo tiene el juego, un apartado para la potencia de la tarjeta en trazado de rayos en los juegos que lo tengan, y una comparación con los procesadores Core i9-10900K, Ryzen 7 5800X, Core i7-8700K y Ryzen 5 3600, siendo el i9 el que uso por defecto.
Desembalado y características
Los modelos de terceros de las GeForce han mejorado muchísimo en los dos últimos años y cuando ahora se ve uno con tres ventiladores no tiene por qué ser necesariamente un modelo grande y pesado. Esta RTX 3090 Trinity es un ejemplo de ello, y es un modelo que me parece bastante atractivo a pesar de que sea de los modelos más baratos de 3090, y eso que no es que sea precisamente una tarjeta gráfica barata.
Este modelo de Zotac tiene un tamaño de 317.8 mm × 120.7 mm × 58 mm y dispone de una carcasa en color gris con tres ventiladores para la refrigeración. Son casi tres ranuras PCIe de grosor, por lo que el disipador es también bastante grande, y precisamente está orientado a que con el equipo en reposo o haciendo tareas livianas los ventiladores estén parados. La conexión PCIe es de tipo 4.0 ×16, aunque como se ve en muchas pruebas la actual PCIe 3.0 ×16 de las tarjetas gráficas no es un impedimento para extraer su máxima potencia.
En la parte posterior hay una placa de refuerzo, y tiene iluminación ARGB en ella así como en el lateral. Es una iluminación bastante discreta. Este modelo incluye dos conectores PCIe de ocho pines para la alimentación, tres DisplayPort 1.4a y un HDMI 2.1. Me gusta mucho la sensación de modelo compacto que tiene, y tampoco pesa mucho que si se compara con un modelo ROG Strix de ASUS.
Ampère: pocos cambios y muchos CUDA
La unidad de procesamiento gráfico (GPU) es una GA102-300, ligeramente recortada para que se quede en 82 multiprocesadores de flujos de datos (SM) de los 84 máximos que tiene el GA102. Está fabricado por Samsung usando un proceso de 8 nm hecho a medida para NVIDIA, aunque ninguna de las dos compañías ha indicado en qué consiste.
La subdivisión principal es de siete clústeres de procesamiento gráfico (GPC), cada uno tiene doce clústeres de procesamiento de texturas (TPC), y estos a su vez incluyen dos SM. Cada GPC incluye un motor de rasterizado y dos operadores de rasterizado (ROP), desligando así los ROP de los controladores de memoria, los cuales son doce en total para un bus de 384 bits.
El cambio más importante a las SM es que disponen de 128 núcleos CUDA en total en lugar de disponer de 64 CUDA y 64 unidades de cálculo INT32. Cada SM está dividido en cuatro bloques o particiones de 32 núcleos CUDA en total, y cada partición dispone de un núcleo tensorial de tercera generación, mientras que todos los bloques comparten un núcleo de trazado de rayos de segunda generación. Para apoyar el aumento de CUDA cada SM aumenta la caché de nivel uno (N1) compartida a 128 KB de datos, y cada partición tiene 64 KB de registro y una caché de nivel cero (N0). Cada controlador de memoria tiene aparejados 512 KB de caché de nivel dos (N2).
Haciendo un repaso de lo indicado, el chip GA102-400 de la RTX 3090 dispone de 10 496 núcleos CUDA, 112 operadores de rasterizado, 6144 KB de caché de N2, y 328 unidades de textura. Como optimización de Ampère, la mitad de los núcleos CUDA de una partición pueden ejecutar a menor coste las instrucciones INT32 que se necesite. No es el cálculo más habitual en la generación de gráficos, pero hay un volumen destacado de cálculos INT32 que se tienen que hacer. Por lo demás, la arquitectura Ampère no cambia mucho respecto a la Turing, y me imagino que los cambios más radicales los ha dejado NVIDIA para la siguiente arquitectura.
Para la realización de las pruebas de este artículo, y sobre todo las de en juegos, he usado los siguientes equipos (con el enlace a las configuraciones completas):
Las pruebas de rendimiento las realizo seleccionando los preajustes ultra siempre que es posible y si dan la opción. En cuanto al suavizado, no lo pongo más allá de FXAA siempre que se indique claramente el nombre del suavizado usado en los ajustes para así poder compararlo bien con la resolución QHD y 4K, en la que esta última en un monitor estándar de 27 pulgadas sirve de poco la activación de suavizado de bordes avanzados como TAA. Al poner un suavizado mejor o peor la mejora en calidad visual dependerá del tamaño del monitor y la distancia de uso, y puede haber diferencias a la hora de aplicar uno u otro en función de la arquitectura de la tarjeta gráfica. Tampoco se aplica por igual los distintos suavizados en distintas arquitecturas gráficas, por lo que prefiero quitarlo de la ecuación siempre que pueda. Hay un problema colateral y es que por ejemplo al probar el DLSS en las tarjetas gráficas de NVIDIA habrá menos diferencia al compararlo con FXAA, un suavizado liviano, que si se comparara respecto a TAA, un suavizado más intensivo.
También desactivo las características gráficas específicas de cada marca, como la oclusión ambiental HBAO+ de Nvidia o el PureHair de AMD, por el posible impacto negativo que puedan tener en las tarjetas de la marca contraria. Las pruebas se han realizado con los controladores GeForce 456.71 instalados y con los Radeon Software 20.11.1.
Los valores se recogen o bien de los archivos de tiempo de fotograma que generan los propios juegos, como es el caso de The Division 2, o bien mediante la herramienta PresentMon desarrollada por un destacado empleado de Intel. Esta herramienta se engancha directamente a la biblioteca gráfica que se esté usando —DX11, DX12 o Vulkan, entre otras—, dando medidas muy precisas de los tiempos de fotograma. Analizando los datos del archivo generado mediante un script se puede obtener la tasa de fotogramas, y también estudiar sus resultados en distintas gráficas pasándolos a una hoja de cálculo si así se quisiera.
Los valores se toman al menos dos veces por juego, y se cierran todas las aplicaciones y procesos prescindibles mientras se ejecutan para asegurar que no hay nada consumiendo tiempo de CPU en segundo plano. También se desactivan las interfaces de Steam, Connect u otros para evitar conflictos. Además de mostrar la tasa media de fotogramas, incluyo el percentil 99, que es el mínimo de FPS por encima del cual se pasa el 99 % del tiempo el juego. Generalmente, si baja de 30 FPS el percentil 99 se puede considerar como que la experiencia de juego no será totalmente fluida.
En cuanto a las mediciones de trazado de rayos, se realiza en la calidad más baja posible para que sea factible la comparación con los modelos más económicos. En cuanto pueda iré añadiendo todas los preajustes de calidad de trazado de rayos para que se pueda tener una visión completa de cómo afectan al rendimiento.
Este modelo RTX 3090 Trinity es una mejora respecto a los diseños de otros años de la compañía, y en general lo considero suficiente para mantener buenos niveles de ruido y temperaturas como indicaré a continuación. Pero no es el mejor modelo en el terreno de la subida de frecuencias (overclocking) y de hecho por defecto funcionará con la limitación de consumo impuesta por NVIDIA que lastrará el rendimiento.
Temperaturas y ruido
Esta tarjeta gráfica tiene un modo de funcionamiento semipasivo para los ventiladores, por lo que no funcionarán si las temperaturas son bajas. Teniendo en cuenta el grueso disipador que incluye y los tres ventiladores, las temperaturas son buenas y el ruido bastante, bastante bueno. La unidad de procesamiento gráfico en sí alcanza los 75 ºC en carga completa, por lo que es un buen valor teniendo en cuenta generaciones pasadas. Además mantiene un bajo nivel de ruido que no superará en carga completa los 36-37 dBA. En este apartado el modelo RTX 3090 Trinity es bueno y no hay ninguna pega.
Subida de frecuencias
Este modelo de RTX 3090 tiene un problema estructural en el apartado del overclocking como es la imposibilidad de que el consumo vaya más allá del 100 % asignado por NVIDIA. Puesto que cualquier subida de frecuencias tiene aparejada una subida de voltajes para que las señales sean estables, esto hará que en la práctica el margen de subida de la RTX 3090 Trinity sea mínimo. Aun así habrá situaciones y situaciones, y en principio se puede subir de manera estable la memoria 500 MHz y la frecuencia turbo en 110 MHz.
Base
OC adicional
Incremento
Frec. base
1395 MHz
—
—
Frec. turbo
1695 MHz
1805 (+110 MHz)
6.4 %
Vel. VRAM
19 500 MHz
20 000 MHz (+500 MHz)
2.5 %
The Division 2 es un juego poco dependiente de la potencia del procesador, y por tanto no va a ser un problema a la hora de problema la subida de frecuencias. La prueba de rendimiento integrada es bastante estable en cuanto a los resultados de una pasada a otra, por lo que me gusta utilizarlo para tomar mediciones de la subida de frecuencias realizada.
En estas pruebas suelo tener la tarjeta gráfica siempre calentita tras dejarla funcionando durante varias horas para comprobar mejor los límites de la subida, ya que el calor o uso muy prolongado de la tarjeta gráfica al hacer overclocking es la única forma de ver si la subida es estable o no. Por eso el valor normal de rendimiento es distinto del indicado en el análisis bajo el epígrafe The Division 2.
The Division (DX12, 1080p)
f/s
Mejora (%)
Turbo de referencia (1695 MHz)
195.7
—
Turbo mejorado (+110 MHz)
197.1
+0.71 %
Memoria mejorada (+500 MHz)
195.5
–0.2 %
Memoria y turbo mejorados
197.7
+1.0 %
La subida adicional que se puede conseguir en este juego en la RTX 3090 Trinity es de tan solo un 1 %.
Consumo
El consumo máximo del equipo de pruebas usado en este artículo jugando es de unos 550 W de media en The Division 2, mientras que en Furmark arroja unos mejores resultados con un consumo total del equipo de unos 466 W. El consumo de la tarjeta gráfica en sí suele variar entre los 340 y 350 W a carga completa, y los 200 vatios restantes son el consumo de los demás componentes del equipo (procesador, placa base, SSD, memorias, ventiladores de la caja y del procesador). Con la subida adicional que se puede conseguir el consumo no aumenta en The Division 2 porque básicamente la tarjeta gráfica tiene el límite de consumo al 100 % y de ahí no puede subir. En reposo el equipo consume sobre los 80 W.
Ahora bien, hay algunas consideraciones adicionales que me gustaría hacer. La primera es que una tarjeta como esta es para jugar a QHD o UHD con la sincronización vertical activa. Con ello quiero decir que en The Division 2 el consumo será inferior por la menor carga del procesador y la tarjeta gráfica dependiendo del monitor utilizado. Por tanto, a continuación recojo una tabla con distintas resoluciones, tasas de refresco y su consumo.
Resolución
Tope refresco
Consumo equipo
Consumo GPU
GPU
CPU
FHD
sin máx.
550 W
345 W
91 %
40 %
FHD
60 Hz
230 W
111 W
46 %
35 %
QHD
sin máx.
529 W
345 W
97 %
36 %
QHD
60 Hz
259 W
130 W
65 %
35 %
UHD
sin máx.
495 W
345 W
98 %
24 %
UHD
60 Hz
384 W
305 W
78 %
27 %
Con los resultados anteriores se puede ver que este modelo concreto de RTX 3090 se ve limitada en consumo a FHD, siendo infrautilizada por el equipo y por tanto es difícil que incluso una subida de frecuencias del procesador vaya a mejorar mucho su rendimiento, aunque se consigue. Poniendo el 10900K con un turbo en todos los núcleos a 4.9 GHz se pasa de 195.7 f/s a unos 197.9 f/s, apenas un 1.1 % más. Pero ese pequeño margen al final cae en el margen de error habitual del ±3 % que se puede esperar al tomar valores, por lo que no es ni siquiera una mejora significativa.
Viendo los resultados anteriores y la imposibilidad de ganar rendimiento con la subida de frecuencias, la mejor recomendación que puedo hacer es que si se quiere comprar una RTX 3090 se vaya a por un modelo que tenga la limitación de consumo desbloqueada. Otros modelos permiten aumentar el consumo hasta un 15 %, que sería lo necesario para poder aprovechar totalmente el chip gráfico de esta tarjeta.
Rendimiento soberbio, a un coste excesivamente alto
NVIDIA tiene la mejor tarjeta gráfica del mercado, pero es imposible no empezar la conclusión del análisis sin mencionar su precio. A un coste de 1499 dólares es muy difícil recomendar su uso para jugar, y lo que ocurre con esta tarjeta es que viene a suplir el hueco dejado por la falta de una Titan RTX nueva debido a sus 24 GB de memoria. Esa cantidad será bastante interesante para profesionales que se dediquen a hacer diseño, si bien la compañía los ha incluido para «jugar a 8K». Esto se puede hacer en ciertos juegos con DLSS activo manteniendo los 50-60 f/s, pero es más la excepción que la norma, y por tanto no, no se puede jugar a 8K y 60 f/s con la RTX 3090 en la mayoría de juegos.
Entrando a valorar el modelo RTX 3090 Trinity, que tiene un PVPR de 1579 euros, es de los modelos más baratos pero ello trae consigo algunas pegas. La más importante es la limitación de consumo. Si te gastas 1579 euros en una tarjeta lo mínimo es que permita cierto nivel de subida de frecuencias, y eso es imposible con este modelo. Y si no se quiere subir frecuencias, al menos sería de agradecer el aumento del límite de consumo para que la GPU no limite artificialmente sus frecuencias.
Este modelo no lo permite, aunque para un uso estándar está francamente bien. Hace muy poco ruido, es el modelo más barato, y las temperaturas son bastante buenas. Pero como he dicho, no puedo más que recomendar mirar hacia otro lado. Por apenas 100-150 euros más se puede conseguir un modelo con mayor límite de consumo, y con cierta modificación de frecuencias se puede conseguir de manera estable en ellos un 10-12 % más de rendimiento. Teniendo en cuenta que esta tarjeta gráfica es muy, muy cara respecto a la potencia que aporta —un 7-15 % más que la RTX 3080 de 699 dólares de PVPR—, toda mejora de rendimiento adicional es bienvenida y casi obligatoria.
En los apartados donde más destaca el chip GA102-400 es en el trazado de rayos y en el supermuestreo por inteligencia artificial (DLSS). Lo segundo puede ser menos de utilidad en juegos que estén limitados por el procesador o por otros motivos —sobrecarga de la API, límite de consumo de la tarjeta, infraaprovechamiento del motor gráfico, etc.— porque por la potencia que tiene es probable que al activar DLSS la mejora a FHD o QHD no sea evidente. Pero no es una tarjeta gráfica para jugar a FHD ni a QHD sino directamente a UHD, y es ahí donde su rendimiento brilla con luz propia.
Se puede ver que la arquitectura Ampère pierde menos rendimiento al aumentar la resolución respecto a Turing, e incluso respecto a RDNA 2 como se puede ver en análisis de la RX 6800 XT. El punto fuerte de la RTX 3090 es el 4K, y ahí podría entender pagar este dineral por una de estas tarjetas gráficas, aunque probablemente con una RTX 3080 sea también más que suficiente para 4K para la mayoría de jugones. Ningún juego de los probados en este análisis cae a 4K por debajo de los 60 f/s.
Puntuación
8.0
sobre 10
Lo mejor
De las RTX 3090 más económicas.
Enorme rendimiento.
Buena calidad de construcción.
Funcionamiento silencioso.
Lo peor
Las RTX 3090 son excesivamente caras.
Nula capacidad de subida adicional.
El límite a 350 W puede mermar el rendimiento en algunas situaciones.