La carrera por la inteligencia artificial en China ha tenido un giro inesperado con la retrasada llegada del modelo DeepSeek R2, cuyo desarrollo se vio afectado por la decisión de sustituir hardware de Nvidia por chips Ascend de Huawei. Lo que inicialmente parecía una apuesta estratégica para reforzar la autosuficiencia tecnológica del país, terminó exponiendo las dificultades actuales de las alternativas domésticas frente a las soluciones consolidadas de empresas estadounidenses.

La presión para abandonar Nvidia

DeepSeek, una startup que ganó notoriedad con su modelo R1 gracias al bajo coste de entrenamiento y su sorprendente rendimiento, se enfrentó a nuevas exigencias para el desarrollo de su sucesor. Según informó el Financial Times, las autoridades chinas «animaron» a DeepSeek a abandonar los chips de Nvidia y optar por hardware nacional, como parte de un esfuerzo estatal más amplio para reducir la dependencia de tecnología extranjera en áreas clave como la inteligencia artificial.

Esta presión no es aislada. Varias empresas chinas han recibido instrucciones similares, en especial en lo que respecta al uso del chip Nvidia H20, que ha sido objeto de escrutinio tanto por sus implicaciones de seguridad nacional como por supuestos problemas medioambientales y tecnológicos, según medios estatales chinos.

Problemas técnicos con Huawei Ascend

DeepSeek aceptó la directriz y comenzó el entrenamiento de su modelo R2 utilizando la plataforma Ascend de Huawei. Sin embargo, el cambio trajo consigo una serie de obstáculos técnicos importantes:

  • Rendimiento inestable: El sistema no logró mantener una ejecución consistente durante los procesos de entrenamiento.
  • Velocidades de interconexión más bajas: Este factor es crítico en entrenamientos de gran escala, donde la eficiencia depende del intercambio rápido de datos entre miles de GPUs.
  • Limitaciones del software CANN: Esta herramienta de Huawei, que reemplaza bibliotecas como CUDA de Nvidia, presentó compatibilidades limitadas y barreras de rendimiento que entorpecieron el avance del modelo.

Huawei respondió enviando un equipo de ingenieros a los centros de datos de DeepSeek para intentar resolver los inconvenientes. A pesar de estos esfuerzos, no se logró completar ni una sola sesión de entrenamiento exitosa con los chips Ascend. El único uso posible de este hardware quedó restringido a tareas de inferencia, es decir, la fase posterior a la generación del modelo.

Vuelta a Nvidia y retrasos en el lanzamiento

La expectativa original era que DeepSeek R2 estuviera disponible en mayo. Pero los fallos derivados del intento de sustitución de hardware provocaron un retraso de varios meses. Ante los problemas persistentes, DeepSeek optó por volver a entrenar el modelo con GPUs de Nvidia, utilizando los chips H800, H100 y HGX H20 con los que ya contaban desde el desarrollo del modelo R1.

El regreso a Nvidia no estuvo exento de complicaciones. En paralelo, China enfrenta una escasez significativa de GPUs de gama alta, resultado de las restricciones impuestas por Estados Unidos a la exportación de tecnologías avanzadas. Esta tensión llevó a un acuerdo entre Nvidia, AMD y el gobierno estadounidense, por el cual las empresas entregan un 15% de sus ventas de chips de IA en China a cambio de licencias para continuar comercializando sus productos en el país asiático.

Lecciones del caso DeepSeek

Lo ocurrido con DeepSeek R2 sirve como una radiografía precisa de los retos que enfrenta China al intentar reemplazar componentes clave de su infraestructura tecnológica. Aunque el país ha invertido intensamente en el desarrollo de alternativas locales como los chips Ascend de Huawei, la transición no es sencilla cuando se trata de procesos tan complejos como el entrenamiento de modelos de lenguaje de gran tamaño.

Esto no significa que el esfuerzo sea en vano. Huawei y otras empresas chinas están en una curva de maduración tecnológica, y cada intento fallido también aporta aprendizajes. No obstante, la decisión de priorizar lo nacional por encima de lo funcional puede tener consecuencias importantes, especialmente en un campo tan competitivo y veloz como la inteligencia artificial.

El futuro de DeepSeek R2

A pesar de las turbulencias, DeepSeek mantiene sus planes de lanzar el modelo R2 en las próximas semanas. Lo hará habiendo aprendido, quizás a la fuerza, que la infraestructura detrás de un modelo de IA es tan importante como los datos y los algoritmos que lo componen.

El episodio deja claro que las ambiciones geopolíticas pueden chocar con las limitaciones técnicas actuales. Apostar por hardware nacional sin el grado de madurez necesario puede traducirse en retrasos, pérdida de competitividad y, en última instancia, una mayor dependencia de los mismos actores que se busca reemplazar.

Uso indebido de la IA en empresas de EE.UU.: una bomba de tiempo en manos de todos

El reciente informe Insider AI Threat Report de la firma de ciberseguridad CalypsoAI revela un panorama preocupante dentro de las empresas estadounidenses: el uso indebido de herramientas de inteligencia artificial (IA) está extendido a todos los niveles de la organización, desde empleados de base hasta ejecutivos de alto rango.