首頁 > 新聞 > DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元

DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元

DeepSeek令人驚訝的是,廉價的AI聊天機器人挑戰行業規範。最初被吹捧為僅需600萬美元的培訓,DeepSeek V3(一種強大的AI模型)已成為主要的競爭對手,甚至導致NVIDIA的股票下跌。但是,這似乎很低的成本掩蓋了我更大的我
By David
Mar 06,2025

DeepSeek令人驚訝的是,廉價的AI聊天機器人挑戰行業規範。最初被吹捧為僅需600萬美元的培訓,DeepSeek V3(一種強大的AI模型)已成為主要的競爭對手,甚至導致NVIDIA的股票下跌。然而,這似乎很低的成本掩蓋了更大的投資。

DeepSeek測試圖片:ensigame.com

DeepSeek V3的成功源於其創新的建築,並結合了:

  • 多語預測(MTP):同時預測多個單詞,以提高準確性和效率。
  • 專家的混合物(MOE):利用256個神經網絡,每個令牌激活8個,以加速訓練並增強性能。
  • 多頭潛在註意力(MLA):反复提取關鍵細節,以最大程度地減少信息丟失並捕獲至關重要的細微差別。

DeepSeek V3圖片:ensigame.com

與最初的主張相反,半分析顯示,DeepSeek的基礎設施包括多個數據中心的大約50,000個NVIDIA GPU(包括H800,H100和H20單位),約為16億美元的投資和約9.44億美元的運營費用。這與公開的600萬美元預培訓成本形成鮮明對比,後者不包括研究,改進,數據處理和整體基礎設施。

中國對沖基金高級基金的子公司DeepSeek擁有其數據中心,與依靠雲的競爭對手不同,具有更大的控制權和更快的創新。它的自資助本質也提高了敏捷性。高薪(對於一些研究人員來說,每年超過130萬美元)吸引了中國頂級人才,不包括外國專家。

DeepSeek圖片:ensigame.com

儘管DeepSeek的整體投資超過5億美元,但其精益結構可以有效地創新。這筆600萬美元的數字具有誤導性;真正的成本要高得多。但是,即使有校正成本,DeepSeek的模型培訓仍然比Chatgpt4O等競爭對手(1億美元與DeepSeek估計為R1的500萬美元)便宜得多。

DeepSeek圖片:ensigame.com

DeepSeek的成功凸顯了資金豐富,獨立的AI公司的競爭潛力。儘管“預算友好”的敘述被誇大了,但其成就是不可否認的,這表明大量投資,技術進步和強大的團隊是在AI市場中取得成功的關鍵。

熱門新聞

Copyright ruanh.com © 2024 — All rights reserved