Lar > Notícias > A acessibilidade do Deepseek é um mito: a IA revolucionária realmente custou US $ 1,6 bilhão para se desenvolver

A acessibilidade do Deepseek é um mito: a IA revolucionária realmente custou US $ 1,6 bilhão para se desenvolver

A AI, surpreendentemente barata de Deepseek, desafia as normas da indústria. Inicialmente, apoiado como custando apenas US $ 6 milhões para treinar, o DeepSeek V3, um poderoso modelo de IA, tornou -se um grande concorrente, causando uma queda significativa de ações para a NVIDIA. Esse custo aparentemente baixo, no entanto, esconde um eu muito maior
By David
Mar 06,2025

A AI, surpreendentemente barata de Deepseek, desafia as normas da indústria. Inicialmente, apoiado como custando apenas US $ 6 milhões para treinar, o DeepSeek V3, um poderoso modelo de IA, tornou -se um grande concorrente, causando uma queda significativa de ações para a NVIDIA. Esse custo aparentemente baixo, no entanto, esconde um investimento muito maior.

Teste Deepseek Imagem: Ensigame.com

O sucesso da Deepseek V3 decorre de sua arquitetura inovadora, incorporando:

  • Previsão com vários toques (MTP): prevendo várias palavras simultaneamente para melhorar a precisão e a eficiência.
  • Mistura de especialistas (MOE): Utilizando 256 redes neurais, ativando oito para cada token, para acelerar o treinamento e aprimorar o desempenho.
  • Atenção latente de várias cabeças (MLA): Extraindo repetidamente os principais detalhes para minimizar a perda de informações e capturar nuances cruciais.

Deepseek v3 Imagem: Ensigame.com

Ao contrário das reivindicações iniciais, a semiânica revelou que a infraestrutura da Deepseek compreende aproximadamente 50.000 GPUs NVIDIA (incluindo H800, H100 e H20 unidades) em vários data centers, representando um investimento de ~ US $ 1,6 bilhão e ~ US $ 944 milhões em despesas operacionais. Isso contrasta acentuadamente com o custo pré-treinamento de US $ 6 milhões divulgado, que exclui pesquisas, refinamento, processamento de dados e infraestrutura geral.

A Deepseek, uma subsidiária da High-Flyer, um fundo de hedge chinês, possui seus data centers, diferentemente dos concorrentes dependentes da nuvem, concedendo maior controle e inovação mais rápida. Sua natureza autofinanciada também aumenta a agilidade. Altos salários (mais de US $ 1,3 milhão anualmente para alguns pesquisadores) atraem os principais talentos chineses, excluindo especialistas estrangeiros.

Deepseek Imagem: Ensigame.com

Embora o investimento geral da Deepseek exceda US $ 500 milhões, sua estrutura enxuta permite inovação eficiente. O valor de US $ 6 milhões é enganoso; O custo verdadeiro é muito maior. No entanto, mesmo com os custos corrigidos, o treinamento modelo de Deepseek permanece significativamente mais barato do que os concorrentes como ChatGPT4O (US $ 100 milhões x US $ 5 milhões estimados por R1).

Deepseek Imagem: Ensigame.com

O sucesso da Deepseek destaca o potencial competitivo de empresas de IA independentes e bem financiadas. Embora a narrativa "amiga do orçamento" seja exagerada, suas realizações são inegáveis, demonstrando que investimentos significativos, avanços tecnológicos e uma equipe forte são essenciais para o sucesso no mercado de IA.

Manchetes

Copyright ruanh.com © 2024 — All rights reserved