首页 > 新闻 > DeepSeek的负担能力是一个神话：革命性的AI实际上花费了16亿美元

DeepSeek的负担能力是一个神话：革命性的AI实际上花费了16亿美元

DeepSeek令人惊讶的是，廉价的AI聊天机器人挑战行业规范。最初被吹捧为仅需600万美元的培训，DeepSeek V3（一种强大的AI模型）已成为主要的竞争对手，甚至导致NVIDIA的股票下跌。但是，这似乎很低的成本掩盖了我更大的我

By David: Mar 06,2025

DeepSeek令人惊讶的是，廉价的AI聊天机器人挑战行业规范。最初被吹捧为仅需600万美元的培训，DeepSeek V3（一种强大的AI模型）已成为主要的竞争对手，甚至导致NVIDIA的股票下跌。然而，这似乎很低的成本掩盖了更大的投资。

DeepSeek测试图片：ensigame.com

DeepSeek V3的成功源于其创新的建筑，并结合了：

多语预测（MTP）：同时预测多个单词，以提高准确性和效率。
专家的混合物（MOE）：利用256个神经网络，每个令牌激活8个，以加速训练并增强性能。
多头潜在注意力（MLA）：反复提取关键细节，以最大程度地减少信息丢失并捕获至关重要的细微差别。

DeepSeek V3 图片：ensigame.com

与最初的主张相反，半分析显示，DeepSeek的基础设施包括多个数据中心的大约50,000个NVIDIA GPU（包括H800，H100和H20单位），约为16亿美元的投资和约9.44亿美元的运营费用。这与公开的600万美元预培训成本形成鲜明对比，后者不包括研究，改进，数据处理和整体基础设施。

中国对冲基金高级基金的子公司DeepSeek拥有其数据中心，与依靠云的竞争对手不同，具有更大的控制权和更快的创新。它的自资助本质也提高了敏捷性。高薪（对于一些研究人员来说，每年超过130万美元）吸引了中国顶级人才，不包括外国专家。

DeepSeek 图片：ensigame.com

尽管DeepSeek的整体投资超过5亿美元，但其精益结构可以有效地创新。这笔600万美元的数字具有误导性；真正的成本要高得多。但是，即使有校正成本，DeepSeek的模型培训仍然比Chatgpt4O等竞争对手（1亿美元与DeepSeek估计为R1的500万美元）便宜得多。

DeepSeek 图片：ensigame.com

DeepSeek的成功凸显了资金丰富，独立的AI公司的竞争潜力。尽管“预算友好”的叙述被夸大了，但其成就是不可否认的，这表明大量投资，技术进步和强大的团队是在AI市场中取得成功的关键。

DeepSeek的负担能力是一个神话：革命性的AI实际上花费了16亿美元

最新新闻

热门新闻

艺术与设计

车辆与交通

美容时尚

图书与工具书

商业

漫画

通讯

约会

教育

娱乐

活动

财务

食物和美食

健康与健身

家居装修

软件与演示

时尚生活

地图和导航

医疗

音乐与音频

新闻杂志

育儿

个性化

摄影

商务办公

购物

社交

体育

工具

旅游

视频播放和编辑

天气

角色扮演

冒险

动作

战略

休闲

模拟

竞速

体育

儿童

卡牌

文字

家庭

桌游

问答

益智解谜

音乐

棋牌

街机