首页 > 新闻 > DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

DeepSeek令人惊讶的是,廉价的AI聊天机器人挑战行业规范。最初被吹捧为仅需600万美元的培训,DeepSeek V3(一种强大的AI模型)已成为主要的竞争对手,甚至导致NVIDIA的股票下跌。但是,这似乎很低的成本掩盖了我更大的我
By David
Mar 06,2025

DeepSeek令人惊讶的是,廉价的AI聊天机器人挑战行业规范。最初被吹捧为仅需600万美元的培训,DeepSeek V3(一种强大的AI模型)已成为主要的竞争对手,甚至导致NVIDIA的股票下跌。然而,这似乎很低的成本掩盖了更大的投资。

DeepSeek测试图片:ensigame.com

DeepSeek V3的成功源于其创新的建筑,并结合了:

  • 多语预测(MTP):同时预测多个单词,以提高准确性和效率。
  • 专家的混合物(MOE):利用256个神经网络,每个令牌激活8个,以加速训练并增强性能。
  • 多头潜在注意力(MLA):反复提取关键细节,以最大程度地减少信息丢失并捕获至关重要的细微差别。

DeepSeek V3图片:ensigame.com

与最初的主张相反,半分析显示,DeepSeek的基础设施包括多个数据中心的大约50,000个NVIDIA GPU(包括H800,H100和H20单位),约为16亿美元的投资和约9.44亿美元的运营费用。这与公开的600万美元预培训成本形成鲜明对比,后者不包括研究,改进,数据处理和整体基础设施。

中国对冲基金高级基金的子公司DeepSeek拥有其数据中心,与依靠云的竞争对手不同,具有更大的控制权和更快的创新。它的自资助本质也提高了敏捷性。高薪(对于一些研究人员来说,每年超过130万美元)吸引了中国顶级人才,不包括外国专家。

DeepSeek图片:ensigame.com

尽管DeepSeek的整体投资超过5亿美元,但其精益结构可以有效地创新。这笔600万美元的数字具有误导性;真正的成本要高得多。但是,即使有校正成本,DeepSeek的模型培训仍然比Chatgpt4O等竞争对手(1亿美元与DeepSeek估计为R1的500万美元)便宜得多。

DeepSeek图片:ensigame.com

DeepSeek的成功凸显了资金丰富,独立的AI公司的竞争潜力。尽管“预算友好”的叙述被夸大了,但其成就是不可否认的,这表明大量投资,技术进步和强大的团队是在AI市场中取得成功的关键。

热门新闻

Copyright ruanh.com © 2024 — All rights reserved