Hogar > Noticias > La asequibilidad de Deepseek es un mito: la IA revolucionaria en realidad costó $ 1.6 mil millones para desarrollarse

La asequibilidad de Deepseek es un mito: la IA revolucionaria en realidad costó $ 1.6 mil millones para desarrollarse

La IA de Deepseek, ai chatbot, desafía las normas de la industria. Inicialmente promocionado como costando solo $ 6 millones para entrenar, Deepseek V3, un poderoso modelo de IA, se ha convertido en un importante competidor, incluso causando importantes caídas de acciones para NVIDIA. Este costo aparentemente bajo, sin embargo, desmiente un i mucho más grande
By David
Mar 06,2025

La IA de Deepseek, ai chatbot, desafía las normas de la industria. Inicialmente promocionado como costando solo $ 6 millones para entrenar, Deepseek V3, un poderoso modelo de IA, se ha convertido en un importante competidor, incluso causando importantes caídas de acciones para NVIDIA. Sin embargo, este costo aparentemente bajo desmiente una inversión mucho mayor.

Prueba de Speeek Imagen: ensigame.com

El éxito de Deepseek V3 proviene de su innovadora arquitectura, incorporando:

  • Predicción de múltiples token (MTP): predicción de múltiples palabras simultáneamente para una mayor precisión y eficiencia.
  • Mezcla de expertos (MOE): utilizando 256 redes neuronales, activando ocho para cada token, para acelerar el entrenamiento y mejorar el rendimiento.
  • Atención latente de múltiples cabezas (MLA): extrayendo repetidamente detalles clave para minimizar la pérdida de información y capturar matices cruciales.

Deepseek v3 Imagen: ensigame.com

Al contrario de las afirmaciones iniciales, el semianálisis reveló que la infraestructura de Deepseek comprende aproximadamente 50,000 GPU NVIDIA (incluidas las unidades H800, H100 y H20) en múltiples centros de datos, lo que representa una inversión de ~ $ 1.6 mil millones y ~ $ 944 millones en gastos operativos. Esto contrasta fuertemente con el costo de pre-entrenamiento publicitado de $ 6 millones, lo que excluye la investigación, el refinamiento, el procesamiento de datos e infraestructura general.

Deepseek, una subsidiaria de High-Flyer, un fondo de cobertura chino, posee sus centros de datos, a diferencia de los competidores que dependen de la nube, otorgan un mayor control e innovación más rápida. Su naturaleza autofinanciada también aumenta la agilidad. Los altos salarios (más de $ 1.3 millones anuales para algunos investigadores) atraen a los mejores talentos chinos, excluyendo a especialistas extranjeros.

Veterano Imagen: ensigame.com

Si bien la inversión general de Deepseek supera los $ 500 millones, su estructura magra permite una innovación eficiente. La cifra de $ 6 millones es engañosa; El verdadero costo es mucho más alto. Sin embargo, incluso con los costos corregidos, la capacitación modelo de Deepseek sigue siendo significativamente más barata que los competidores como CHATGPT4O ($ 100 millones frente a los $ 5 millones estimados de Deepseek para R1).

Veterano Imagen: ensigame.com

El éxito de Deepseek destaca el potencial competitivo de las compañías de IA independientes bien financiadas. Si bien la narrativa "económica" es exagerada, sus logros son innegables, lo que demuestra que la inversión significativa, los avances tecnológicos y un equipo fuerte son clave para el éxito en el mercado de IA.

Las noticias más importantes

Copyright ruanh.com © 2024 — All rights reserved