Deepseekの驚くほど安価なAIモデルは、業界の規範に挑戦しています。 DeepSeekは、DeepSeek V3モデルにわずか600万ドルのトレーニングコストを誇っていますが、よく見てもはるかに大きな投資が明らかになります。
画像:Ensigame.com
Deepseek V3は革新的なテクノロジーを活用しています:マルチトークン予測(MTP)同時単語予測のために、専門家の混合(MOE) 256のニューラルネットワーク、およびマルチヘッド潜在的注意(MLA)重要な文要素に焦点を当てるために。これらの進歩は、精度と効率の両方に貢献します。
画像:Ensigame.com
しかし、セミアンアリシスは重大な矛盾を明らかにしました。 Deepseekのインフラストラクチャは、実際には約50,000のNvidia Hopper GPUで構成されており、16億ドルの投資で9億4,400万ドルの運用コストがあります。これは、研究、洗練、データ処理、インフラストラクチャを除く、トレーニング前のGPU使用のみを反映するだけである、600万ドルの宣伝された600万ドルのトレーニング数値とは対照的です。
画像:Ensigame.com
High-Flyerの子会社であるDeepseekは、データセンターを所有しており、制御と迅速なイノベーションを促進しています。自己資金のステータスと高い給与(一部の研究者にとって年間130万ドル以上)が中国の才能を引き付けています。 AI開発への5億ドル以上の投資にもかかわらず、その合理化された構造により効率的なイノベーションが可能になります。
画像:Ensigame.com
Deepseekの成功は、十分に資金提供された独立したAI企業の可能性を示していますが、「革新的な予算」の主張は誤解を招くものです。真のコストははるかに高くなっていますが、ChatGPT4Oのような競合他社よりもはるかに少ないです。これは、R1の500万ドルと比較して、訓練に1億ドルかかると伝えられています。格差は、その実質的な投資にもかかわらず、Deepseekの効率を強調しています。