DeepSeek令人驚訝的是,廉價的AI聊天機器人挑戰行業規範。最初被吹捧為僅需600萬美元的培訓,DeepSeek V3(一種強大的AI模型)已成為主要的競爭對手,甚至導致NVIDIA的股票下跌。然而,這似乎很低的成本掩蓋了更大的投資。
圖片:ensigame.com
DeepSeek V3的成功源於其創新的建築,並結合了:
圖片:ensigame.com
與最初的主張相反,半分析顯示,DeepSeek的基礎設施包括多個數據中心的大約50,000個NVIDIA GPU(包括H800,H100和H20單位),約為16億美元的投資和約9.44億美元的運營費用。這與公開的600萬美元預培訓成本形成鮮明對比,後者不包括研究,改進,數據處理和整體基礎設施。
中國對沖基金高級基金的子公司DeepSeek擁有其數據中心,與依靠雲的競爭對手不同,具有更大的控制權和更快的創新。它的自資助本質也提高了敏捷性。高薪(對於一些研究人員來說,每年超過130萬美元)吸引了中國頂級人才,不包括外國專家。
圖片:ensigame.com
儘管DeepSeek的整體投資超過5億美元,但其精益結構可以有效地創新。這筆600萬美元的數字具有誤導性;真正的成本要高得多。但是,即使有校正成本,DeepSeek的模型培訓仍然比Chatgpt4O等競爭對手(1億美元與DeepSeek估計為R1的500萬美元)便宜得多。
圖片:ensigame.com
DeepSeek的成功凸顯了資金豐富,獨立的AI公司的競爭潛力。儘管“預算友好”的敘述被誇大了,但其成就是不可否認的,這表明大量投資,技術進步和強大的團隊是在AI市場中取得成功的關鍵。