Deepseekの驚くほど安価なAIチャットボットは、業界の規範に挑戦しています。当初、訓練に600万ドルしかかかりませんでしたが、強力なAIモデルであるDeepseek V3が主要な競合他社になり、Nvidiaの大幅な在庫減少を引き起こしました。ただし、この一見低コストは、はるかに大きな投資に匹敵します。
画像:Ensigame.com
Deepseek V3の成功は、革新的なアーキテクチャに由来し、以下を取り入れています。
画像:Ensigame.com
初期の主張とは反対に、Semianalysisは、Deepseekのインフラストラクチャが複数のデータセンターにわたって約50,000のNvidia GPU(H800、H100、およびH20ユニットを含む)で構成されており、16億ドルの投資と9億4,400万ドルの運用費を表しています。これは、研究、洗練、データ処理、および全体的なインフラストラクチャを除外する、宣伝された600万ドルのトレーニング前のコストとは対照的です。
中国のヘッジファンドであるHigh-Flyerの子会社であるDeepseekは、クラウドに依存している競合他社とは異なり、データセンターを所有しており、より大きな管理とより迅速なイノベーションを認めています。その自己資金の性質も敏ility性を高めます。外国人の専門家を除く、高給(一部の研究者にとって年間130万ドル以上)が中国のトップの才能を引き付けています。
画像:Ensigame.com
Deepseekの全体的な投資は5億ドルを超えていますが、その無駄のない構造により効率的なイノベーションが可能になります。 600万ドルの数字は誤解を招くものです。真のコストははるかに高くなっています。ただし、修正されたコストがあっても、DeepSeekのモデルトレーニングは、CHATGPT4Oのような競合他社よりも大幅に安価なままです(1億ドル対R1の推定500万ドル)。
画像:Ensigame.com
Deepseekの成功は、資金提供された独立したAI企業の競争の可能性を強調しています。 「予算に優しい」物語は誇張されていますが、その成果は否定できず、重要な投資、技術の進歩、強力なチームがAI市場で成功する鍵であることを示しています。