DeepSeek의 놀랍도록 저렴한 AI 모델은 업계 규범에 도전합니다. DeepSeek은 Deepseek V3 모델의 6 백만 달러에 불과한 훈련 비용을 자랑하지만, 자세히 살펴보면 훨씬 더 많은 투자가 나타납니다.
이미지 : ensigame.com
DeepSeek V3는 혁신적인 기술을 활용합니다 : 동시 단어 예측, 전문가 혼합 (MOE) 256 개의 신경망을 활용하여 MLA (Multi-Head Watent Interetent) **를 활용하십시오. 중요한 문장 요소에 중점을 둡니다. 이러한 발전은 정확도와 효율성에 기여합니다.
이미지 : ensigame.com
그러나 Semianalysis는 상당한 불일치를 발견했습니다. DeepSeek의 인프라는 실제로 약 50,000 개의 Nvidia Hopper GPU로 구성되어 있으며, 16 억 달러의 운영 비용으로 16 억 달러의 투자입니다. 이는 연구, 개선, 데이터 처리 및 인프라를 제외한 사전 훈련 GPU 사용 만 반영하는 공개 6 백만 달러의 교육 수치와 크게 대조됩니다.
이미지 : ensigame.com
High-Flyer의 자회사 인 Deepseek는 데이터 센터를 소유하여 제어 및 빠른 혁신을 장려합니다. 자체 자금 지원 지위와 높은 급여 (일부 연구원의 경우 매년 130 만 달러 이상)는 중국 최고의 인재를 유치합니다. AI 개발에 대한 5 억 달러 이상의 투자에도 불구하고 간소화 된 구조는 효율적인 혁신을 가능하게합니다.
이미지 : ensigame.com
DeepSeek의 성공은 잘 자금을 지원하는 독립 AI 회사의 잠재력을 보여 주지만 "혁명 예산"주장은 오해의 소지가 있습니다. 실제 비용은 훨씬 높지만 여전히 ChatGpt4o와 같은 경쟁 업체보다 훨씬 적습니다. R1의 DeepSeek의 5 백만 달러에 비해 훈련하는 데 1 억 달러가 소요될 것으로 알려졌다. 불균형은 상당한 투자에도 불구하고 DeepSeek의 효율성을 강조합니다.