Qu’est-ce que DeepSeek AI ? Le modèle ouvert qui révolutionne la cryptomonnaie
Une application gratuite d'une jeune entreprise chinoise peu connue a réalisé un exploit inédit dans le secteur des cryptomonnaies. En une seule journée, elle a fait perdre 589 milliards de dollars à Nvidia , soit la plus grosse perte journalière de l'histoire boursière américaine. Et le phénomène ne s'est pas limité à Wall Street. Le Bitcoin a chuté de 7 %, plus de 300 milliards de dollars se sont volatilisés du marché total des cryptomonnaies, et les jetons d'intelligence artificielle ont subi la plus forte baisse.
L'application s'appelait DeepSeek. Son modèle, DeepSeek R1, était une IA ouverte et peu coûteuse, suffisamment performante pour remettre en question l'idée reçue qui sous-tend le marché de l'IA et une partie importante du secteur des cryptomonnaies : celle selon laquelle la création d'une intelligence artificielle robuste exige des quantités considérables de puces onéreuses. Ce guide explique ce qu'est réellement l'IA de DeepSeek, comment elle accomplit autant avec si peu de ressources, comment elle se compare à ChatGPT et pourquoi elle a provoqué un véritable séisme dans le monde des cryptomonnaies basées sur l'IA, dont les répercussions se font encore sentir.
Qu'est-ce que DeepSeek AI et qui l'a créé ?
DeepSeek est un laboratoire chinois d'intelligence artificielle, mais il n'a pas débuté comme tel. Issu d'un fonds spéculatif, son histoire explique en grande partie son mode de fonctionnement.
D'un fonds spéculatif quantitatif à un laboratoire d'IA
DeepSeek a été fondée le 17 juillet 2023 à Hangzhou, en Chine, par Liang Wenfeng. Ce dernier dirigeait déjà High-Flyer, un fonds spéculatif quantitatif qui investissait sur les marchés financiers grâce à l'apprentissage automatique et avait constitué un important stock de GPU Nvidia à cet effet. Lorsque ces puces n'étaient pas utilisées pour les transactions, il les orientait vers la modélisation du langage. Ainsi, DeepSeek a démarré avec une puissance de calcul bon marché, une équipe de chercheurs et sans pression d'investisseurs pour développer le modèle le plus performant possible. L'entreprise est restée agile, avec seulement 160 employés environ, et a appris à optimiser le rendement de son matériel. L'efficacité n'était pas un argument marketing, mais bien une culture d'entreprise. Ironie du sort, High-Flyer avait constitué ce stock de puces en partie par anticipation des restrictions américaines à l'exportation qui ont par la suite privé la Chine des meilleurs GPU de Nvidia. Contraints de faire plus avec moins de puces et moins puissantes, les ingénieurs de DeepSeek ont développé une grande maîtrise de la frugalité, transformant cette contrainte en atout.
La gamme de modèles : V3, R1 et V4
DeepSeek a connu un déploiement rapide. DeepSeek Coder est arrivé fin 2023, la version 2 en mai 2024, et la version révolutionnaire DeepSeek 3 en décembre 2024. Puis, le 20 janvier 2025, est apparue DeepSeek R1, le modèle de raisonnement qui a tout déclenché. En avril 2026, le laboratoire a présenté en avant-première DeepSeek 4, avec une version V4-Pro et une version allégée V4-Flash, repoussant les limites des fenêtres de contexte à près d'un million de jetons. Chaque version a suivi la même stratégie : repousser les limites, proposer un prix attractif et offrir une solution économique.
Poids ouverts, l'API et deepseek.com
Ce dernier point est crucial. Depuis la version R1, les modèles DeepSeek sont distribués sous licence MIT permissive, disponibles en téléchargement libre sur Hugging Face et GitHub. Chacun peut les télécharger, les examiner, les optimiser ou les exécuter sur sa propre machine. Il est également possible d'utiliser gratuitement le chatbot sur deepseek.com ou d'accéder à l'API DeepSeek pour un coût minime. L'association de modèles libres et d'une API abordable est rare et constitue le moteur de cette révolution.

Comment fonctionnent réellement les DeepSeek R1 et V3
La réputation de DeepSeek repose sur un fait simple, mais gênant pour ses concurrents : il égale des modèles bien plus volumineux et bien plus coûteux tout en consommant beaucoup moins de ressources de calcul. Le secret réside dans son architecture, et non dans de la magie.
Mélange d'experts et inférence efficace
DeepSeek V3 possède 671 milliards de paramètres, mais ne les utilise pas tous simultanément. Modèle de type « mix-of-experts », il n'active pour chaque jeton qu'environ 37 milliards de paramètres, soit la poignée d'« experts » pertinents pour la tâche. Le laboratoire a combiné ce modèle avec l'attention latente multi-têtes, une méthode qui compresse la mémoire pendant l'inférence. Le résultat : un modèle gigantesque qui fonctionne comme un petit. Moins de mémoire, moins d'énergie, coût par réponse réduit. Pour un concurrent qui a dépensé des milliards en partant du principe que plus grand rime avec plus cher, c'est une démonstration de force peu réjouissante.
R1, raisonnement et chaîne de pensée
DeepSeek R1 a ajouté une seconde fonctionnalité : il raisonne à voix haute. À l’instar d’o1 d’OpenAI, il s’agit d’un modèle de raisonnement qui résout les problèmes étape par étape, en suivant un raisonnement logique, avant de fournir une réponse. C’est ce qui explique ses excellents résultats sur les tâches complexes. R1 a atteint 97,3 % au benchmark MATH-500 et 79,8 % à AIME 2024, et a résolu 49,2 % des problèmes réels de GitHub sur SWE-bench , le plaçant ainsi au même niveau que les meilleurs modèles d’OpenAI de l’époque.
Le détail de la demande de remboursement de 5,6 millions de dollars pour les frais de formation
Voici le chiffre qui a fait le buzz sur internet. Selon un article de DeepSeek, l'entraînement final de la version 3 a coûté environ 5,58 millions de dollars en temps GPU. Face aux 100 millions de dollars souvent cités pour GPT-4, cela paraissait humiliant. Mais il faut lire les détails. Ce chiffre ne couvre que l'entraînement final, et non la recherche, les expériences infructueuses ou les puces elles-mêmes. Les analystes de SemiAnalysis ont estimé que les dépenses matérielles réelles de DeepSeek dépassaient largement les 500 millions de dollars. Le titre était à la fois exact et trompeur, ce qui explique précisément son succès.
| Modèle DeepSeek | Libéré | Taper | Notes |
|---|---|---|---|
| DeepSeek V3 | Décembre 2024 | Ministère de l'Éducation LLM | 671 octets de paramètres, 37 octets actifs, MIT |
| DeepSeek R1 | Janvier 2025 | Raisonnement | Poids libre, rivalisant avec OpenAI o1 |
| DeepSeek V4 | Avril 2026 | Famille MoE | V4-Pro et V4-Flash, environ 1 million de contexte |
DeepSeek AI contre ChatGPT, Claude et Gemini
DeepSeek est-il donc meilleur que ChatGPT ? Cela dépend de vos besoins. En mathématiques, en programmation et en raisonnement pur, il rivalise avec les meilleurs modèles d'OpenAI et d'Anthropic. Ses points faibles résident dans la fluidité du traitement, la gestion des entrées multimodales et la fiabilité. Les modèles phares de DeepSeek sont principalement conçus pour le texte, tandis que ChatGPT gère les images, la voix et la vidéo. Le rendu d'OpenAI reste plus agréable à lire pour l'écriture courante. Gemini de Google se situe entre les deux, performant en multimodalité et en recherche, mais moins en matière d'accès libre. Et pour de nombreuses entreprises occidentales, le facteur décisif n'est pas un critère de performance, mais la confiance : un modèle entraîné et hébergé en Chine présente des inconvénients qu'un modèle hébergé aux États-Unis n'a pas.
Vient ensuite la question du prix, où l'écart est considérable. Le tableau ci-dessous l'illustre, et c'est pourquoi les développeurs continuent de migrer leurs charges de travail vers l'API de DeepSeek.
| Modèle | Entrée / 1M de jetons | Poids libres | Multimodal |
|---|---|---|---|
| DeepSeek V3.2 | ~0,28 $ | Oui (MIT) | Non |
| GPT-5.2 (OpenAI) | ~1,75 $ | Non | Oui |
| Claude (Anthropique) | Niveau Premium | Non | Oui |
Pour le traitement de texte et de code à grande échelle, DeepSeek est environ six fois moins gourmand en ressources que GPT-5.2. De plus, grâce à l'ouverture des poids, il est possible de se passer complètement de l'API et de l'exécuter en local. DeepSeek représente ainsi une option remarquablement rentable, et un défi de taille pour un laboratoire fermé.
L'affaire DeepSeek qui a secoué le monde des cryptomonnaies
Marc Andreessen a parlé du « moment Spoutnik de l'IA ». Il évoquait la fierté nationale, mais les marchés ont perçu quelque chose de plus froid : peut-être que la chose la plus précieuse en IA n'est pas, après tout, un stock de puces.
589 milliards de dollars disparus en une journée
Lorsque DeepSeek a dominé l'App Store américain le 27 janvier 2025, avec 16 millions de téléchargements en seulement 18 jours, les investisseurs ont immédiatement fait le calcul inverse. Si un laboratoire chinois pouvait atteindre une telle performance avec un matériel bien moins puissant, la demande future pour les puces Nvidia paraissait soudainement plus incertaine. Ce jour-là, l'action Nvidia a chuté d'environ 17 % et sa capitalisation boursière a perdu 589 milliards de dollars , soit la plus forte baisse journalière de l'histoire des États-Unis. L'ensemble du Nasdaq a été touché.
Pourquoi les jetons crypto basés sur l'IA ont-ils chuté le plus fortement ?
Le secteur des cryptomonnaies n'a pas été épargné. Le Bitcoin a chuté d'environ 7 % pour s'établir aux alentours de 97 750 dollars, et plus de 300 milliards de dollars ont quitté le marché total des cryptomonnaies. Mais le véritable carnage a touché les tokens d'IA. Cette catégorie a dégringolé d'environ 9 % ce jour-là, contre environ 5 % pour le marché dans son ensemble, avec des baisses de 12,6 % pour Render et d'environ 10 % pour Fetch.ai. La raison est troublante. Une grande partie de la valeur des tokens d'IA reposait sur le même constat que celui de Nvidia : l'IA est gourmande en puissance de calcul, la puissance de calcul est rare, donc tout ce qui vend de la puissance de calcul ou des GPU est précieux. DeepSeek a mis à mal ce scénario, et les tokens qui en dépendaient le plus ont été les plus touchés. La chute elle-même n'a pas duré ; en quelques jours, le Bitcoin a récupéré la majeure partie de ses pertes, les analystes qualifiant la panique de réaction excessive. Mais le secteur des tokens d'IA est resté instable bien plus longtemps, signe que le marché réévaluait l'ensemble du scénario, et ne traversait pas simplement une mauvaise passe.
Jetons crypto IA après DeepSeek
Voici le paradoxe. Le même choc qui a fait chuter les tokens d'IA leur a aussi fourni un argument de poids à long terme. Si les modèles de pointe peuvent être peu coûteux et ouverts, alors les barrières à l'entrée des grands laboratoires fermés s'amenuisent, et une infrastructure d'IA ouverte et résistante à la censure commence à prendre de la valeur, et non l'inverse. Les réseaux de calcul décentralisés comme Akash , les réseaux de rendu comme Render et les plateformes d'intelligence artificielle comme Bittensor proposent tous un monde où l'IA n'est plus confinée à trois entreprises américaines. DeepSeek a rendu ce monde plus accessible. Bittensor, dont le token TAO récompense un réseau de modèles d'apprentissage automatique concurrents, est l'exemple le plus abouti de cette idée : un marché de l'intelligence ouverte plutôt qu'un seul cerveau d'entreprise. La capacité de ces réseaux à fournir une IA de pointe reste à prouver, mais DeepSeek a déplacé le poids du doute sur les laboratoires fermés.
Le marché l'a remarqué. En mai 2025, Grayscale a officialisé un secteur crypto dédié à l'IA, couvrant 20 tokens d'une valeur totale d'environ 21 milliards de dollars , soit une augmentation d'environ 4,7 fois par rapport aux 4,5 milliards de dollars du début de 2023. Soyez prudents. Le lancement a également attiré des escrocs : en une seule journée, plus de 75 faux tokens « DeepSeek » sont apparus, et les traders qui les ont adoptés ont perdu plus de 100 millions de dollars . DeepSeek n'a jamais lancé de token. Toute affirmation contraire est un piège.

L'IA DeepSeek est-elle sûre ? Interdictions et confidentialité
C'est là que la prudence est de mise. Si vous utilisez l'application ou le site web officiel de DeepSeek, vos données, y compris vos messages, sont transférées vers des serveurs en Chine et traitées selon une politique de confidentialité régie par le droit chinois. Plusieurs gouvernements ont jugé cela problématique. L'Italie a bloqué DeepSeek le 30 janvier 2025 pour des raisons de protection des données. Plus d'une douzaine d'États américains l'ont interdit sur les appareils officiels jusqu'au début de l'année 2025, et le Congrès a présenté la loi « No DeepSeek on Government Devices Act ». Le modèle reflète également la réglementation chinoise sur le contenu, évitant ou édulcorant les sujets politiquement sensibles. Les méthodes de DeepSeek ont également suscité la polémique. Début 2008, Anthropic a accusé le laboratoire d'utiliser des milliers de faux comptes pour collecter des millions de conversations Claude à des fins d'entraînement, une accusation que DeepSeek conteste. L'histoire du génie économe a donc une version controversée.
Rien de tout cela ne rend la technologie elle-même dangereuse. Grâce à l'ouverture des poids, un utilisateur ou une entreprise soucieux de la confidentialité peut télécharger le modèle et l'exécuter localement, sans que les données ne quittent ses locaux. Le risque réside dans l'application hébergée. Le modèle ouvert, quant à lui, constitue une solution de repli.
Comment utiliser DeepSeek AI : déploiement local
Vous avez trois options. La plus simple est le chatbot gratuit sur deepseek.com ou l'application mobile, parfait pour les questions courantes si le compromis en matière de confidentialité ne vous dérange pas. La deuxième est l'API DeepSeek, suffisamment abordable pour que les développeurs l'utilisent pour des charges de travail importantes ; la documentation de l'API DeepSeek vous guide dans sa configuration, et DeepSeek Coder est optimisé pour la programmation. La troisième, et la plus sûre pour les données sensibles, est le déploiement local : téléchargez les fichiers open source depuis Hugging Face ou exécutez une version allégée avec un outil comme Ollama sur votre propre matériel. Même principe, aucune exposition des données. Pour les questions courantes, l'application gratuite est largement suffisante ; pour toute personne manipulant des données privées ou réglementées, le déploiement local justifie la configuration supplémentaire.
Que signifie DeepSeek pour l'IA et les cryptomonnaies ?
La leçon à tirer de DeepSeek n'a que peu à voir avec la victoire de la Chine. Le véritable changement réside dans le fait que l'IA de pointe est devenue abordable et ouverte plus rapidement que prévu. Pour les utilisateurs lambda, cela se traduit par de meilleurs outils à moindre coût. Pour les laboratoires fermés, cela signifie que leur avantage concurrentiel lié aux GPU est moins important que ne le laissaient supposer leurs valorisations. Et pour les cryptomonnaies, l'impact est double : les jetons d'IA construits sur la rareté ont subi un revers, tandis que ceux qui développent une infrastructure d'IA ouverte et décentralisée ont trouvé une nouvelle raison d'être. La vraie question n'est donc pas de savoir si DeepSeek est une bonne solution. Elle l'est manifestement. La question est plutôt de savoir qui sera rémunéré lorsque l'intelligence cessera d'être onéreuse.