Bahay > Balita > Ang kakayahang magamit ng Deepseek ay isang alamat: ang rebolusyonaryong AI ay talagang nagkakahalaga ng $ 1.6 bilyon upang mabuo

Ang kakayahang magamit ng Deepseek ay isang alamat: ang rebolusyonaryong AI ay talagang nagkakahalaga ng $ 1.6 bilyon upang mabuo

Ang nakakagulat na murang mga hamon sa industriya ng AI chatbot ay mga pamantayan sa industriya. Sa una ay na -tout bilang nagkakahalaga lamang ng $ 6 milyon upang sanayin, ang Deepseek V3, isang malakas na modelo ng AI, ay naging isang pangunahing katunggali, kahit na nagdudulot ng makabuluhang pagbagsak ng stock para sa nvidia. Ang tila mababang gastos na ito, gayunpaman, ay nagpapahiya sa isang mas malaking i
By David
Mar 06,2025

Ang nakakagulat na murang mga hamon sa industriya ng AI chatbot ay mga pamantayan sa industriya. Sa una ay na -tout bilang nagkakahalaga lamang ng $ 6 milyon upang sanayin, ang Deepseek V3, isang malakas na modelo ng AI, ay naging isang pangunahing katunggali, kahit na nagdudulot ng makabuluhang pagbagsak ng stock para sa nvidia. Ang tila mababang gastos, gayunpaman, ay nagpapahiwatig ng isang mas malaking pamumuhunan.

Pagsubok sa Deepseek Larawan: ensigame.com

Ang tagumpay ng Deepseek V3 ay nagmula sa makabagong arkitektura nito, na isinasama:

  • Multi-Token Prediction (MTP): Paghuhula ng maraming mga salita nang sabay-sabay para sa pinahusay na kawastuhan at kahusayan.
  • Paghahalo ng mga eksperto (MOE): Paggamit ng 256 Neural Networks, Pag -activate ng Walo para sa bawat Token, upang mapabilis ang pagsasanay at mapahusay ang pagganap.
  • Multi-head latent pansin (MLA): paulit-ulit na kumukuha ng mga pangunahing detalye upang mabawasan ang pagkawala ng impormasyon at makuha ang mga mahahalagang nuances.

Deepseek v3 Larawan: ensigame.com

Taliwas sa mga paunang pag -angkin, ang semianalysis ay nagsiwalat ng imprastraktura ng Deepseek na binubuo ng humigit -kumulang 50,000 NVIDIA GPUs (kabilang ang H800, H100, at H20 unit) sa maraming mga sentro ng data, na kumakatawan sa isang ~ $ 1.6 bilyong pamumuhunan at ~ $ 944 milyon sa mga gastos sa pagpapatakbo. Ang kaibahan nito nang husto sa naisapubliko na $ 6 milyong gastos sa pre-pagsasanay, na hindi kasama ang pananaliksik, pagpipino, pagproseso ng data, at pangkalahatang imprastraktura.

Ang DeepSeek, isang subsidiary ng High-Flyer, isang pondo ng hedge ng Tsino, ay nagmamay-ari ng mga sentro ng data nito, hindi katulad ng mga katunggali ng cloud-reliant, na nagbibigay ng higit na kontrol at mas mabilis na pagbabago. Ang kalikasan na pinondohan ng sarili ay nagpapalakas din ng liksi. Ang mga mataas na suweldo (higit sa $ 1.3 milyon taun -taon para sa ilang mga mananaliksik) ay nakakaakit ng nangungunang talento ng Tsino, hindi kasama ang mga dayuhang espesyalista.

Deepseek Larawan: ensigame.com

Habang ang pangkalahatang pamumuhunan ng Deepseek ay lumampas sa $ 500 milyon, ang istraktura ng sandalan nito ay nagbibigay -daan sa mahusay na pagbabago. Ang $ 6 milyong figure ay nakaliligaw; Ang totoong gastos ay mas mataas. Gayunpaman, kahit na sa mga naayos na gastos, ang pagsasanay sa modelo ng Deepseek ay nananatiling mas mura kaysa sa mga kakumpitensya tulad ng Chatgpt4O ($ 100 milyon kumpara sa tinatayang $ 5 milyon ng Deepseek para sa R1).

Deepseek Larawan: ensigame.com

Ang tagumpay ng Deepseek ay nagtatampok ng mapagkumpitensyang potensyal ng mahusay na pinondohan, independiyenteng mga kumpanya ng AI. Habang ang "badyet-friendly" na salaysay ay pinalaki, ang mga nagawa nito ay hindi maikakaila, na nagpapakita na ang makabuluhang pamumuhunan, pagsulong sa teknolohiya, at isang malakas na koponan ay susi sa tagumpay sa merkado ng AI.

Nangungunang Balita

Copyright ruanh.com © 2024 — All rights reserved