DeepSeek令人惊讶的是,廉价的AI聊天机器人挑战行业规范。最初被吹捧为仅需600万美元的培训,DeepSeek V3(一种强大的AI模型)已成为主要的竞争对手,甚至导致NVIDIA的股票下跌。然而,这似乎很低的成本掩盖了更大的投资。
图片:ensigame.com
DeepSeek V3的成功源于其创新的建筑,并结合了:
图片:ensigame.com
与最初的主张相反,半分析显示,DeepSeek的基础设施包括多个数据中心的大约50,000个NVIDIA GPU(包括H800,H100和H20单位),约为16亿美元的投资和约9.44亿美元的运营费用。这与公开的600万美元预培训成本形成鲜明对比,后者不包括研究,改进,数据处理和整体基础设施。
中国对冲基金高级基金的子公司DeepSeek拥有其数据中心,与依靠云的竞争对手不同,具有更大的控制权和更快的创新。它的自资助本质也提高了敏捷性。高薪(对于一些研究人员来说,每年超过130万美元)吸引了中国顶级人才,不包括外国专家。
图片:ensigame.com
尽管DeepSeek的整体投资超过5亿美元,但其精益结构可以有效地创新。这笔600万美元的数字具有误导性;真正的成本要高得多。但是,即使有校正成本,DeepSeek的模型培训仍然比Chatgpt4O等竞争对手(1亿美元与DeepSeek估计为R1的500万美元)便宜得多。
图片:ensigame.com
DeepSeek的成功凸显了资金丰富,独立的AI公司的竞争潜力。尽管“预算友好”的叙述被夸大了,但其成就是不可否认的,这表明大量投资,技术进步和强大的团队是在AI市场中取得成功的关键。