Le modèle d'IA de Deepseek est étonnamment bon marché remet en question les normes de l'industrie. Alors que Deepseek possède un coût de formation de 6 millions de dollars pour son modèle Deepseek V3, un examen plus approfondi révèle un investissement beaucoup plus substantiel.
Image: esigame.com
Deepseek V3 exploite les technologies innovantes: Prédiction multi-token (MTP) pour la prédiction des mots simultanés, Mélange d'experts (MOE) Utilisation de 256 réseaux neuronaux, et Attention latente multiples (MLA) pour une mise au point accrue sur les éléments de phrase cruciaux. Ces progrès contribuent à la fois à la précision et à l'efficacité.
Image: esigame.com
Cependant, la semianalyse a révélé un écart significatif. L'infrastructure de Deepseek comprend en fait environ 50 000 GPU Nvidia Hopper, un investissement de 1,6 milliard de dollars avec 944 millions de dollars en coûts opérationnels. Cela contraste fortement avec le chiffre de formation de 6 millions de dollars médiatisé, qui ne reflète que l'utilisation du GPU avant la formation, l'exclusion de la recherche, du raffinement, du traitement des données et des infrastructures.
Image: esigame.com
Deepseek, une filiale de High Flyer, possède ses centres de données, favorisant le contrôle et l'innovation rapide. Son statut autofinancé et ses salaires élevés (plus de 1,3 million de dollars par an pour certains chercheurs) attirent les meilleurs talents chinois. Malgré l'investissement de 500 millions de dollars + dans le développement de l'IA, sa structure rationalisée permet une innovation efficace.
Image: esigame.com
Alors que le succès de Deepseek présente le potentiel des sociétés d'IA indépendantes bien financées, la réclamation du "budget révolutionnaire" est trompeuse. Le coût réel est beaucoup plus élevé, mais encore beaucoup moins que des concurrents comme ChatGpt4O, qui aurait coûté 100 millions de dollars pour s'entraîner, par rapport aux 5 millions de dollars de Deepseek pour R1. La disparité met en évidence l'efficacité de Deepseek malgré son investissement substantiel.