Maison > Nouvelles > L'abordabilité de Deepseek est un mythe: l'IA révolutionnaire a coûté 1,6 milliard de dollars pour développer

L'abordabilité de Deepseek est un mythe: l'IA révolutionnaire a coûté 1,6 milliard de dollars pour développer

Deepseek est étonnamment bon marché pour les chatbot de l'IA défie les normes de l'industrie. Initialement vanté comme ne coûtant que 6 millions de dollars pour former, Deepseek V3, un puissant modèle d'IA, est devenu un concurrent majeur, même provoquant des baisses de stocks importantes pour NVIDIA. Ce coût apparemment faible, cependant, dément un i plus grand i
By David
Mar 06,2025

Deepseek est étonnamment bon marché pour le chatbot d'IA défie les normes de l'industrie. Initialement vanté comme ne coûtant que 6 millions de dollars pour former, Deepseek V3, un puissant modèle d'IA, est devenu un concurrent majeur, même provoquant des baisses de stocks importantes pour NVIDIA. Ce coût apparemment bas, cependant, dément un investissement beaucoup plus important.

Test de profondeur Image: esigame.com

Le succès de Deepseek V3 découle de son architecture innovante, en incorporant:

  • Prédiction multi-token (MTP): prédire plusieurs mots simultanément pour une précision et une efficacité améliorées.
  • Mélange d'experts (MOE): en utilisant 256 réseaux neuronaux, activant huit pour chaque jeton, pour accélérer la formation et améliorer les performances.
  • Attention latente multi-tête (MLA): Extraction à plusieurs reprises des détails clés pour minimiser la perte d'informations et capturer des nuances cruciales.

Deepseek v3 Image: esigame.com

Contrairement aux réclamations initiales, la semianalyse a révélé que l'infrastructure de Deepseek comprend environ 50 000 GPU NVIDIA (y compris les unités H800, H100 et H20) dans plusieurs centres de données, représentant un investissement de ~ 1,6 milliard de dollars et ~ 944 millions de dollars en dépenses opérationnelles. Cela contraste fortement avec le coût de pré-formation de 6 millions de dollars médiatisé, qui exclut la recherche, le raffinement, le traitement des données et l'infrastructure globale.

Deepseek, une filiale de High-Flyer, un fonds spéculatif chinois, possède ses centres de données, contrairement à des concurrents californiens, accordant un plus grand contrôle et une innovation plus rapide. Sa nature autofinancée stimule également l'agilité. Les salaires élevés (plus de 1,3 million de dollars par an pour certains chercheurs) attirent les meilleurs talents chinois, à l'exclusion des spécialistes étrangers.

En profondeur Image: esigame.com

Alors que l'investissement global de Deepseek dépasse 500 millions de dollars, sa structure Lean permet une innovation efficace. Le chiffre de 6 millions de dollars est trompeur; Le véritable coût est beaucoup plus élevé. Cependant, même avec les coûts corrigés, la formation des modèles de Deepseek reste considérablement moins chère que les concurrents comme ChatGpt4O (100 millions de dollars contre les 5 millions de dollars estimés de Deepseek pour R1).

En profondeur Image: esigame.com

Le succès de Deepseek met en évidence le potentiel compétitif des sociétés d'IA indépendantes bien financées. Bien que le récit "adapté au budget" soit exagéré, ses réalisations sont indéniables, démontrant que des investissements importants, des progrès technologiques et une équipe solide sont essentielles pour réussir sur le marché de l'IA.

Actualité à la Une

Copyright ruanh.com © 2024 — All rights reserved