DeepSeek의 놀랍게도 저렴한 AI 챗봇은 업계 규범에 도전합니다. 강력한 AI 모델 인 DeepSeek V3는 훈련하는 데 6 백만 달러에 불과한 것으로 처음으로 선전되었으며, 주요 경쟁자가되어 NVIDIA에 상당한 주식 하락을 일으켰습니다. 그러나이 저렴한 비용은 훨씬 더 큰 투자에 달려 있습니다.
이미지 : ensigame.com
DeepSeek V3의 성공은 다음과 같은 혁신적인 건축에서 비롯됩니다.
이미지 : ensigame.com
초기 청구와는 달리, 반 발전은 DeepSeek의 인프라가 여러 데이터 센터에서 ~ 16 억 달러의 투자와 ~ 944 백만 달러의 운영 비용을 나타내는 여러 데이터 센터에서 약 50,000 개의 NVIDIA GPU (H800, H100 및 H20 단위 포함)로 구성되어 있음을 밝혀 냈습니다. 이는 연구, 개선, 데이터 처리 및 전반적인 인프라를 배제하는 6 백만 달러의 사전 훈련 비용과 크게 대조됩니다.
중국 헤지 펀드 인 High-Flyer의 자회사 인 Deepseek는 클라우드 관련 경쟁 업체와 달리 데이터 센터를 소유하여 더 큰 통제력과 더 빠른 혁신을 부여합니다. 자체 자금 지원 자연은 또한 민첩성을 높입니다. 높은 급여 (일부 연구원의 경우 매년 130 만 달러 이상)는 외국 전문가를 제외하고 중국 최고의 인재를 유치합니다.
이미지 : ensigame.com
DeepSeek의 전체 투자는 5 억 달러를 초과하지만 린 구조는 효율적인 혁신을 가능하게합니다. 6 백만 달러의 수치는 오해의 소지가 있습니다. 실제 비용은 훨씬 높습니다. 그러나 수정 된 비용으로도 DeepSeek의 모델 교육은 ChatGPT4O와 같은 경쟁 업체보다 훨씬 저렴합니다 (DeepSeek의 R1에 대해 DeepSeek의 약 5 백만 달러).
이미지 : ensigame.com
DeepSeek의 성공은 잘 자금을 지원받는 독립 AI 회사의 경쟁 잠재력을 강조합니다. "예산 친화적 인"이야기는 과장되어 있지만, 그 성과는 부인할 수 없으므로 상당한 투자, 기술 발전 및 강력한 팀이 AI 시장에서 성공의 열쇠임을 보여줍니다.