Was ist DeepSeek AI? Das offene Modell, das die Kryptowelt erschüttert
Eine kostenlose App eines bis dahin unbekannten chinesischen Startups schaffte etwas, was keinem Krypto-Crash zuvor gelungen war. Innerhalb eines einzigen Tages vernichtete sie 589 Milliarden US-Dollar bei Nvidia – der größte Tagesverlust eines Unternehmens in der Geschichte des US-Aktienmarktes. Und die Auswirkungen beschränkten sich nicht auf die Wall Street. Bitcoin fiel um 7 Prozent, mehr als 300 Milliarden US-Dollar verschwanden vom gesamten Kryptomarkt, und die sogenannten KI-Token brachen am stärksten ein.
Die App hieß DeepSeek. Das dahinterstehende Modell, DeepSeek R1, war ein offenes, kostengünstiges KI-Modell, das die Annahme, die sowohl den KI-Handel als auch einen Großteil des Kryptomarktes stützte, ins Wanken brachte: dass der Aufbau leistungsstarker künstlicher Intelligenz Unmengen teurer Chips erfordert. Dieser Leitfaden erklärt, was DeepSeek AI genau ist, wie es mit so wenig Aufwand so viel erreicht, wie es sich im Vergleich zu ChatGPT schlägt und warum es bei KI-Kryptotoken einen bis heute spürbaren Aufschwung auslöste.
Was ist DeepSeek AI und wer hat es entwickelt?
DeepSeek ist ein chinesisches Labor für künstliche Intelligenz, aber es begann nicht als solches. Es entstand aus einem Hedgefonds, und diese Vorgeschichte erklärt fast alles über seine Denkweise.
Vom quantitativen Hedgefonds zum KI-Labor
DeepSeek wurde am 17. Juli 2023 in Hangzhou, China, von Liang Wenfeng gegründet. Liang leitete zuvor High-Flyer, einen quantitativen Hedgefonds, der mithilfe von maschinellem Lernen an den Märkten handelte und zu diesem Zweck einen großen Bestand an Nvidia-GPUs angehäuft hatte. Wenn diese Chips nicht für den Handel im Einsatz waren, nutzte er sie für Sprachmodelle. So startete DeepSeek mit kostengünstiger Rechenleistung, einem Team von Forschern und ohne den Druck von Investoren, das größtmögliche Modell zu entwickeln. Das Unternehmen blieb schlank, mit nur rund 160 Mitarbeitern, und lernte, mit der vorhandenen Hardware optimale Ergebnisse zu erzielen. Effizienz war kein Marketing-Slogan, sondern die gesamte Unternehmenskultur. Eine bemerkenswerte Ironie: High-Flyer hatte diese Chips teilweise im Vorfeld der US-Exportkontrollen angehäuft, die China später von Nvidias leistungsstärksten GPUs abschnitten. Gezwungen, mit leistungsschwächeren und weniger Chips mehr zu erreichen, entwickelten die Ingenieure von DeepSeek eine hohe Sparsamkeit – und diese Einschränkung wurde zum Vorteil.
Die Modellfamilie: V3, R1 und V4
DeepSeek wurde schnell veröffentlicht. DeepSeek Coder erschien Ende 2023, V2 im Mai 2024 und das bahnbrechende DeepSeek V3 im Dezember 2024. Am 20. Januar 2025 folgte DeepSeek R1, das Reasoning-Modell, das den Durchbruch brachte. Im April 2026 präsentierte das Labor DeepSeek V4 mit einer V4-Pro-Version und einer schlankeren V4-Flash-Version, wodurch die Anzahl der Kontextfenster auf eine Million Tokens erhöht wurde. Jede Version folgte demselben Prinzip: die neuesten Entwicklungen nutzen, einen Bruchteil des Preises berechnen und die Gewichtung kostenlos anbieten.
Offene Gewichte, die API und deepseek.com
Dieser letzte Punkt ist entscheidend. Seit R1 werden die Modelle von DeepSeek unter der liberalen MIT-Lizenz als Open-Wave-Downloads auf Hugging Face und GitHub bereitgestellt. Jeder kann sie herunterladen, untersuchen, optimieren oder auf dem eigenen Rechner ausführen. Alternativ kann man den kostenlosen Chatbot auf deepseek.com nutzen oder die DeepSeek-API für wenige Cent verwenden. Open Weights und eine günstige API sind eine seltene Kombination und der Motor für den Durchbruch.

Wie DeepSeek R1 und V3 tatsächlich funktionieren
DeepSeeks Ruf beruht auf einer einfachen, für die Konkurrenz ungewöhnlichen Tatsache: Die Geräte erreichen die Leistung deutlich größerer und teurerer Modelle, benötigen dabei aber wesentlich weniger Rechenleistung. Der Trick liegt in der Architektur – nicht in der Zauberei.
Mischung von Experten und effiziente Schlussfolgerung
DeepSeek V3 verfügt über 671 Milliarden Parameter, nutzt diese aber nicht alle gleichzeitig. Es handelt sich um ein Mixture-of-Experts-Modell, das für jedes Token nur etwa 37 Milliarden Parameter aktiviert – die wenigen „Experten“, die für die jeweilige Aufgabe relevant sind. Das Labor kombinierte dies mit Multi-Head-Latent Attention, einer Methode, die den Speicherverbrauch während der Inferenz komprimiert. Das Ergebnis ist ein riesiges Modell, das wie ein kleines arbeitet. Weniger Speicher, weniger Stromverbrauch, geringere Kosten pro Antwort. Für einen Konkurrenten, der Milliarden investierte, weil er annahm, größer bedeute immer teurer, ist dies ein unerwünschter Machbarkeitsnachweis.
R1, logisches Denken und Gedankenkette
DeepSeek R1 hat einen weiteren Trick: Es denkt laut. Wie OpenAIs o1 ist es ein Denkmodell, das Probleme Schritt für Schritt anhand einer Gedankenkette durchgeht, bevor es eine Antwort gibt. Deshalb erzielt es bei schwierigen Aufgaben so gute Ergebnisse. R1 erreichte 97,3 Prozent im MATH-500-Benchmark und 79,8 Prozent im AIME 2024 und löste 49,2 Prozent der realen GitHub-Probleme im SWE-bench , womit es damals mit den besten Modellen von OpenAI mithalten konnte.
Die Forderung nach 5,6 Millionen Dollar an Trainingskosten, detailliert aufgeschlüsselt
Hier ist die Zahl, die im Internet für Furore sorgte. Laut DeepSeeks eigener Veröffentlichung kostete der letzte Trainingslauf für V3 rund 5,58 Millionen US-Dollar an GPU-Zeit. Verglichen mit den viel zitierten 100 Millionen US-Dollar für GPT-4 wirkte das wie eine Demütigung. Doch Vorsicht: Diese Zahl umfasst lediglich den letzten Lauf, nicht die Forschung, die fehlgeschlagenen Experimente oder die Chips selbst. Analysten von SemiAnalysis schätzten DeepSeeks tatsächliche Hardwareausgaben auf deutlich über 500 Millionen US-Dollar. Die Schlagzeile war gleichermaßen korrekt und irreführend – und genau deshalb verbreitete sie sich so rasant.
| DeepSeek-Modell | Freigegeben | Typ | Anmerkungen |
|---|---|---|---|
| DeepSeek V3 | Dezember 2024 | MoE LLM | 671B Parameter, 37B aktiv, MIT |
| DeepSeek R1 | Januar 2025 | Argumentation | Offenes Gewicht, konkurrierte mit OpenAI o1 |
| DeepSeek V4 | April 2026 | MoE-Familie | V4-Pro und V4-Flash, ~1M Kontext |
DeepSeek AI im Vergleich zu ChatGPT, Claude und Gemini
Ist DeepSeek also besser als ChatGPT? Das hängt von den Anforderungen ab. In den Bereichen Mathematik, Programmierung und logisches Denken kann es mit den Topmodellen von OpenAI und Anthropic mithalten. Schwächen zeigt es bei der Benutzerfreundlichkeit, der Verarbeitung multimodaler Eingaben und dem Vertrauen. Die Flaggschiffmodelle von DeepSeek sind größtenteils textbasiert, während ChatGPT Bilder, Sprache und Video verarbeiten kann. Die Texte von OpenAI lesen sich im Alltag immer noch flüssiger. Googles Gemini liegt dazwischen: stark in der Verarbeitung multimodaler Daten und der Suche, schwächer im offenen Zugang. Und für viele westliche Unternehmen ist letztendlich nicht ein Benchmark, sondern das Vertrauen ausschlaggebend: Ein in China trainiertes und gehostetes Modell birgt Risiken, ein in den USA gehostetes nicht.
Dann ist da noch der Preis, wo die Differenz erheblich ist. Die folgende Tabelle verdeutlicht dies und ist der Grund, warum Entwickler ihre Workloads weiterhin auf die DeepSeek-API migrieren.
| Modell | Eingabe / 1 Mio. Token | Offene Gewichtsklassen | Multimodal |
|---|---|---|---|
| DeepSeek V3.2 | ~0,28 $ | Ja (MIT) | NEIN |
| GPT-5.2 (OpenAI) | ~1,75 $ | NEIN | Ja |
| Claude (Anthropisch) | Premium-Stufe | NEIN | Ja |
Für die Verarbeitung großer Text- und Codemengen ist DeepSeek im Vergleich zu GPT-5.2 etwa sechsmal günstiger. Da die Gewichte offen sind, kann die API komplett umgangen und das Programm lokal bereitgestellt werden. Dadurch ist DeepSeek eine bemerkenswert kosteneffiziente Option, die für geschlossene Labore schwer zu beantworten ist.
Der DeepSeek-Moment, der die Kryptowelt erschütterte
Marc Andreessen nannte es den „Sputnik-Moment der KI“. Er sprach von Nationalstolz, aber die Märkte verstanden etwas Kälteres – vielleicht ist das Wertvollste an KI doch nicht ein Vorrat an Chips.
589 Milliarden Dollar an einem Tag verschwunden
Als DeepSeek am 27. Januar 2025 mit 16 Millionen Downloads in den ersten 18 Tagen die Spitze des US-App-Stores eroberte, rechneten Händler die Folgen rückwärts durch. Sollte ein chinesisches Labor mit einem Bruchteil der Hardware diese Spitzenleistung erzielen können, schien die zukünftige Nachfrage nach Nvidias Chips plötzlich deutlich unsicherer. Nvidia verlor an diesem Tag rund 17 Prozent an Marktkapitalisierung und büßte 589 Milliarden US-Dollar ein – der größte Kursverlust an einem einzigen Tag in der US-Geschichte. Der gesamte Nasdaq geriet ins Wanken.
Warum KI-Krypto-Token am stärksten gefallen sind
Auch Kryptowährungen blieben nicht verschont. Bitcoin fiel um etwa 7 Prozent auf rund 97.750 US-Dollar, und über 300 Milliarden US-Dollar flossen aus dem gesamten Kryptomarkt. Doch die größten Verluste gab es bei KI-Token. Diese Kategorie verzeichnete an diesem Tag einen Rückgang von etwa 9 Prozent , verglichen mit rund 5 Prozent beim Gesamtmarkt. Render gab um 12,6 Prozent nach, Fetch.ai um etwa 10 Prozent. Der Grund dafür ist beunruhigend. Der Wert vieler KI-Token basierte auf der gleichen Annahme wie bei Nvidia: KI benötigt viel Rechenleistung, Rechenleistung ist knapp, daher ist alles, was Rechenleistung oder GPUs verkauft, wertvoll. DeepSeek widerlegte diese Annahme, und die Token, die am stärksten darauf angewiesen waren, verloren am meisten. Der Kurssturz selbst war nicht von Dauer; innerhalb weniger Tage erholte sich Bitcoin größtenteils, da Analysten die Panik als Überreaktion bezeichneten. Der KI-Token-Sektor blieb jedoch deutlich länger instabil – ein Zeichen dafür, dass der Markt die gesamte Situation neu bewertete und nicht nur einen schlechten Tag erlebte.
KI-Krypto-Token nach DeepSeek
Und hier kommt der Clou: Derselbe Schock, der KI-Token so stark getroffen hat, lieferte ihnen auch ein langfristiges Argument. Wenn Spitzenmodelle kostengünstig und offen zugänglich sind, schrumpfen die Schutzwälle der großen, geschlossenen Labore, und eine offene, zensurresistente KI-Infrastruktur gewinnt an Wert. Dezentrale Rechennetzwerke wie Akash , Rendering-Netzwerke wie Render und Märkte für maschinelle Intelligenz wie Bittensor entwerfen eine Welt, in der KI nicht mehr von drei amerikanischen Konzernen beherrscht wird. DeepSeek hat diese Welt greifbarer gemacht. Bittensor, dessen TAO-Token ein Netzwerk konkurrierender Modelle für maschinelles Lernen belohnt, ist die überzeugendste Strategie: ein Marktplatz für offene Intelligenz anstelle eines einzelnen Konzerns. Ob diese Netzwerke tatsächlich Spitzen-KI liefern können, ist noch unbewiesen, aber DeepSeek hat die Zweifel an dieser Frage auf die geschlossenen Labore verlagert.
Der Markt reagierte. Bis Mai 2025 hatte Grayscale einen eigenen KI-Kryptosektor mit 20 Token im Gesamtwert von rund 21 Milliarden US-Dollar formalisiert – ein Anstieg um das 4,7-Fache gegenüber 4,5 Milliarden US-Dollar Anfang 2023. Seien Sie vorsichtig! Der Start lockte auch Betrüger an: Innerhalb eines Tages tauchten über 75 gefälschte „DeepSeek“-Memecoins auf, und Händler, die ihnen hinterherjagten, verloren über 100 Millionen US-Dollar . DeepSeek hat nie einen Token herausgegeben. Alles, was etwas anderes behauptet, ist eine Falle.

Ist die Nutzung von DeepSeek AI sicher? Sperrungen und Datenschutz
Hier ist Vorsicht geboten. Wer die offizielle DeepSeek-App oder -Website nutzt, riskiert, dass seine Daten, einschließlich der Eingabeaufforderungen, an Server in China übertragen und gemäß chinesischem Recht verarbeitet werden. Mehrere Regierungen sahen darin ein Problem. Italien blockierte DeepSeek am 30. Januar 2025 aus Datenschutzgründen. Über ein Dutzend US-Bundesstaaten verboten die Nutzung auf offiziellen Geräten bis Anfang 2025, und der US-Kongress brachte den „No DeepSeek on Government Devices Act“ ein. Das Geschäftsmodell spiegelt zudem chinesische Inhaltsrichtlinien wider, die politisch sensible Themen umgehen oder zensieren. Auch DeepSeeks Methoden stießen auf Kritik. Anfang 2009 beschuldigte Anthropic das Labor, Tausende gefälschter Konten genutzt zu haben, um Millionen von Claude- Konversationen für Trainingszwecke zu sammeln – ein Vorwurf, den DeepSeek zurückweist. Die Geschichte vom sparsamen Genie hat also auch eine umstrittene Seite.
Nichts davon macht die Technologie an sich unsicher. Da die Gewichte offen zugänglich sind, kann ein datenschutzbewusster Nutzer oder ein Unternehmen das Modell herunterladen und lokal ausführen, ohne dass Daten das Gebäude verlassen. Das Risiko liegt in der gehosteten Anwendung. Das offene Modell bietet die Lösung.
So verwenden Sie DeepSeek AI: Lokale Bereitstellung
Es gibt drei Möglichkeiten. Am einfachsten ist der kostenlose Chatbot auf deepseek.com oder die mobile App – ideal für einfache Fragen, wenn Sie sich nicht an den Datenschutzbeschränkungen stören. Die zweite Möglichkeit ist die DeepSeek API. Sie ist so kostengünstig, dass Entwickler auch rechenintensive Aufgaben darüber abwickeln. Die DeepSeek API-Dokumentation führt Sie durch die Einrichtung, und DeepSeek Coder ist speziell für die Programmierung optimiert. Die dritte und sicherste Möglichkeit für sensible Daten ist die lokale Bereitstellung: Laden Sie die Open Weights von Hugging Face herunter oder führen Sie eine kleinere Version mit einem Tool wie Ollama auf Ihrer eigenen Hardware aus. Gleiches Prinzip, aber ohne Datenverlust. Für einfache Fragen ist die kostenlose App völlig ausreichend; für alle, die mit privaten oder regulierten Daten arbeiten, lohnt sich der zusätzliche Aufwand für die lokale Bereitstellung.
Was DeepSeek für KI und Krypto bedeutet
Die wichtigste Lehre aus DeepSeeks Erfolg hat wenig mit Chinas vermeintlichem Sieg zu tun. Der eigentliche Umbruch liegt darin, dass fortschrittliche KI schneller erschwinglich und zugänglich wurde, als erwartet. Für normale Nutzer bedeutet das bessere Werkzeuge zu geringeren Kosten. Für geschlossene Forschungseinrichtungen bedeutet es, dass der Wettbewerbsvorteil durch GPUs geringer ist als in ihren Bewertungen angenommen. Und für Kryptowährungen hat dies zwei Seiten: KI-Token, die auf der Annahme von Knappheit basieren, erlitten Verluste, während diejenigen, die offene, dezentrale KI-Infrastruktur aufbauen, eine neue Daseinsberechtigung erhielten. Die eigentliche Frage ist also nicht, ob DeepSeek gut ist. Das ist es eindeutig. Die Frage ist vielmehr, wer noch profitiert, wenn Intelligenz nicht mehr teuer ist.