Google lleva algunos años embarcada en una carrera por la inteligencia artificial (IA), y eso está dejando joyas como Duplex, un sistema de interactuación que emula a un humano en el que, como ejemplo, lo mostró sobre el plató de la I/O 2018 reservando mesa en un restaurante y cita en una peluquería. Bromeaba con que no quería pensar en cuántos servidores requeriría este tipo de inteligencias artificiales, pero bien es cierto que Google lleva ya unos años desarrollando su propio procesador para el aprendizaje profundo.
Llamadas unidades de procesamiento tensorial (TPU), la compañía ha mostrado la TPU 3.0, un año después de mostrar el segundo modelo en el I/O 2017. Estas TPU son un ASIC (circuito integrado de aplicación específica), que usa una disposición concreta de puertas lógicas para resolver un conjunto específico de problemas, del que no se les puede sacar. La versión reprogramable de los ASIC son las FPGA o matrices de puertas programables. Los TPU de Google están orientados a cálculo tensorial, una entidad algebraica usada en inteligencia artificial, con una precisión de solo 8 bits, más que suficiente para este tipo de cálculos.
La versión TPU 3.0 más que duplica el rendimiento de la segunda versión del año pasado, pasando de los 45 TFLOPS a más de 350 TFLOPS, siendo FLOPS el acrónimo de operaciones de coma flotante por segundo, y tera es 1012. En un conjunto de múltiples TPU, pasa de los 180 TFLOPS a más de 1500 TFLOPS, y de los 11.5 PFLOPS de un grupo de 64 de las TPU 2 a más de 100 PFLOPS de las TPU 3.0. Por ello la compañía ha tenido que incluirlos en los bastidores de sus centros de datos con refrigeración líquida, ya que es más que probable que sea una versión del modelo anterior mejorado y subido de frecuencias.
Estas TPU están disponibles a través de Google Cloud, y de momento el servicio sigue en fase beta. No es un tipo de dispositivo que vaya a salir de las instalaciones de Google, pero otras compañías como Microsoft o Facebook llevan también años trabajando con los ASIC y las FPGA para mejorar la potencia por vatio de sus centros de datos.