Dom > Aktualności > Przystępność Deepseek to mit: rewolucyjna sztuczna inteligencja kosztowała 1,6 miliarda dolarów na rozwój

Przystępność Deepseek to mit: rewolucyjna sztuczna inteligencja kosztowała 1,6 miliarda dolarów na rozwój

Zaskakująco niedrogie AI Chatbot Deepseek wyzwala normy branżowe. Początkowo reklamowane jako kosztujące tylko 6 milionów dolarów na trening, Deepseek V3, potężny model AI, stał się głównym konkurentem, nawet powodując znaczne spadki akcji dla NVIDIA. To pozornie tani koszty zaprzecza jednak znacznie większej i
By David
Mar 06,2025

Zaskakująco niedrogie AI Chatbot Deepseek wyzwala normy branżowe. Początkowo reklamowane jako kosztujące tylko 6 milionów dolarów na trening, Deepseek V3, potężny model AI, stał się głównym konkurentem, nawet powodując znaczne spadki akcji dla NVIDIA. To pozornie niski koszt zaprzecza jednak znacznie większej inwestycji.

Test Deepseek Zdjęcie: engame.com

Sukces Deepseek V3 wynika z jego innowacyjnej architektury, obejmującej:

  • Prognozowanie wielu tokenów (MTP): Prognozowanie wielu słów jednocześnie pod kątem poprawy dokładności i wydajności.
  • Mieszanka ekspertów (MOE): Wykorzystanie 256 sieci neuronowych, aktywując osiem dla każdego tokena, w celu przyspieszenia szkolenia i poprawy wydajności.
  • Utrzymująca uwaga wielowłócona (MLA): wielokrotne wydobywanie kluczowych szczegółów w celu zminimalizowania utraty informacji i przechwytywania kluczowych niuansów.

Deepseek v3 Zdjęcie: engame.com

W przeciwieństwie do początkowych twierdzeń, semianaliza ujawniła, że ​​infrastruktura Deepseek obejmuje około 50 000 GPU NVIDIA (w tym jednostki H800, H100 i H20) w wielu centrach danych, co stanowi inwestycje ~ 1,6 miliarda USD i ~ 944 mln USD na wydatki operacyjne. Kontrastuje to gwałtownie z opublikowanymi kosztami przed treningiem w wysokości 6 milionów USD, co wyklucza badania, udoskonalenie, przetwarzanie danych i ogólną infrastrukturę.

Deepseek, spółka zależna od High-Flyer, chińskiego funduszu hedgingowego, jest właścicielem swoich centrów danych, w przeciwieństwie do konkurencji w chmurze, zapewniając większą kontrolę i szybsze innowacje. Jego samofinansowany charakter również zwiększa zwinność. Wysokie pensje (ponad 1,3 miliona dolarów rocznie dla niektórych badaczy) przyciągają najlepsze chińskie talenty, z wyłączeniem zagranicznych specjalistów.

Deepseek Zdjęcie: engame.com

Podczas gdy ogólna inwestycja Deepseek przekracza 500 milionów dolarów, jej szczupła struktura umożliwia wydajne innowacje. Liczba 6 milionów dolarów wprowadza w błąd; Prawdziwy koszt jest znacznie wyższy. Jednak nawet przy skorygowanych kosztach trening modelu Deepseeka pozostaje znacznie tańszy niż konkurenci, tacy jak Chatgpt4o (szacuje się, że 100 milionów dolarów w porównaniu z szacunkowymi 5 milionami dolarów na R1).

Deepseek Zdjęcie: engame.com

Sukces Deepseek podkreśla potencjał konkurencyjny dobrze finansowanych, niezależnych firm AI. Podczas gdy narracja „przyjazna budżetowi” jest przesadzona, jej osiągnięcia są niezaprzeczalne, co pokazuje, że znaczne inwestycje, postęp technologiczny i silny zespół są kluczem do sukcesu na rynku AI.

Najważniejsze wiadomości

Copyright ruanh.com © 2024 — All rights reserved