Durante cuatro años la administración Biden ha asegurado que las sanciones al sector de los semiconductores de China estaban orientadas a evitar que desarrollen mejores IA que las estadounidenses. Pero lo que han conseguido es agudizar el ingenio de los chinos, hasta el punto que hasta la exministra de Comercio tuvo que decir que las sanciones no funcionaban y que lo que había que hacer es innovar más que los chinos. Es lo que llevaban diciendo los expertos desde el principio. Así que no es de extrañar que ahora investigadores chinos de DeepSeek hayan presentado un modelo de IA con razonamiento comparable al modelo o1 de OpenAI.
La gracia del asunto es que a diferencia del modelo de OpenAI el de DeepSeek es gratuito bajo la licencia del MIT, por lo que cualquiera puede descargarlo y modificarlo a su gusto. La versión de mayor tamaño está pensada para 671 000 millones de parámetros. Obviamente lo que aseguran es que es comparable en razonamiento en distintas pruebas que también se han usado con el o1. Entre los modelos publicados también hay algunos que van a de 1500 M a 70 000 M de parámetros para que sean más manejables y se puedan ejecutar localmente.
Así que nuevamente ha ocurrido lo de siempre: las sanciones nunca funcionan, y menos con una superpotencia mundial como China. Lo que les pueda faltar de aceleradoras lo suplen con ingenio y con la creación de una mayor cantidad de centros de datos, lo cual en la práctica no es bueno para el medioambiente porque están siendo alimentadas con centrales de carbón. Así que por ese lado, EUA ha fomentado el cambio climático a pesar de que Biden declaró una emergencia climática.
La potencia del nuevo modelo de DeepSeek ya se ha puesto a prueba y ha despertado un aluvión de análisis positivos sobre su rendimiento y precisión. Además, cada solicitud da una respuesta con la larga cadena de razonamiento hecha, incluso aunque sean preguntas sencillas.

Vía: Ars Technica.