Sora AI: Das Text-zu-Video-Modell von OpenAI, erklärt

Sora AI: Das Text-zu-Video-Modell von OpenAI, erklärt

Etwa einen Monat lang war Sora AI die meist heruntergeladene App in den USA. Dann schaltete OpenAI sie ab. Die App, mit der jeder einen Satz eingeben und eine Minute synchronisiertes, filmreifes Video erhalten konnte, erreichte Platz eins, zog eine Flut von Deepfakes von Prominenten und Studio-Ghibli-Kopien nach sich und wurde dann im April 2026 still und leise eingestellt. Immer wieder stellten sich die Leute die naheliegende Frage: Wie kann etwas so Beliebtes einfach verschwinden?

Die kurze Antwort lautet: Geld. Die ausführlichere Antwort ist jedoch aufschlussreicher, insbesondere wenn man für KI-Tools bezahlt oder sie verkauft. Der Wert von Sora AI lag nie wirklich im kostenlosen Social-Media-Feed. Er lag in der Rechenleistung, die man sekundengenau mietet, um Videos zu generieren. Diese Unterscheidung ist der Kern der Sache und führt zu einem Punkt, den die meisten Artikel auslassen: Wie bezahlen die Leute tatsächlich für solche Dinge, und warum die Zahlungsmodalitäten mittlerweile genauso wichtig werden wie das Geschäftsmodell selbst.

Was Sora AI ist und wie das Videomodell funktioniert

Sora AI ist ein von OpenAI entwickeltes Text-zu-Video-Modell. Man gibt einen Text ein, und das Modell generiert daraus einen kurzen Videoclip. Das ist die Grundidee der KI-Videogenerierung. Im Kern handelt es sich um einen Diffusionstransformator, der zur selben Familie gehört, die auch moderne KI-Bildbearbeitungswerkzeuge antreibt – nur eben trainiert mit Video- und Zeitdaten.

OpenAI präsentierte Sora im Februar 2024 mit einigen Democlips und veröffentlichte im Dezember 2024 eine erste Version in ChatGPT. Die frühen Sora-Versionen generierten Clips von bis zu einer Minute Länge und entwickelten erstaunlicherweise ein grobes Verständnis für 3D-Raum und Kamerabewegungen, ohne dass ihnen dies explizit beigebracht wurde. Niemand programmierte Parallaxe ein. Sora lernte – ähnlich wie ein Kind – durch das Betrachten genügend vieler Beispiele, dass sich die Sicht durch Kamerabewegungen verändert.

Das erklärt auch die uneinheitlichen Ergebnisse. Das Modell konnte zwar eine realistische Straßenszene darstellen, aber dann konnte eine Person durch eine Wand gehen, weil es die Gesetze der Physik nie als solche, sondern nur als Muster verstanden hatte. Merken Sie sich: Wenn ein Clip makellos aussieht, hat das System keine Ahnung von Schwerkraft.

sora-ai

Wie man mit Sora 2 KI-Videos erstellt

Die Version, die viral ging, war Sora 2, die am 30. September 2025 zusammen mit der iOS-App veröffentlicht wurde. Das war der eigentliche Durchbruch, und es lohnt sich, einen Blick darauf zu werfen, wie das Erstellen damit tatsächlich aussah.

Synchronisierter Ton, Physik und filmische Aufnahmen

Sora 2 bot nun auch Ton. Dialoge, Schritte und Hintergrundgeräusche wurden synchron zum Bild wiedergegeben, anstatt als separate, stumme Sequenz, die man selbst vertonen musste. Realistischere Bewegungen waren die sichtbare Verbesserung: Objekte kollidierten und fielen nun auf realistische Weise. Das Modell konnte außerdem mehrere Kameraperspektiven in einer Sequenz aneinanderreihen und verlieh kurzen Clips so einen filmischen Charakter, der der ersten Version fehlte. Es war der Unterschied zwischen einer bewegten Postkarte und einem Filmschnitt.

Gastauftritte, Remix und Bearbeitung

Das wichtigste soziale Feature war der Cameo-Auftritt: Man konnte sich einmal selbst aufnehmen und dann sein Abbild in eine beliebige Szene einfügen. Das, mehr noch als die reine Bildqualität, trug maßgeblich zur Verbreitung der App bei. Zusätzlich gab es ein kleines Bearbeitungswerkzeug. Mit „Remix“ konnte man einen bestehenden Clip mit einer neuen Anweisung bearbeiten. „Neu schneiden“ erstellte ein einzelnes Segment neu. „Schleife“ verwandelte einen Clip in eine saubere Wiederholung, und „Überblenden“ fügte zwei Videos zusammen. Für all das waren keine Bearbeitungskenntnisse erforderlich – und genau das war der Sinn der Sache.

Schreiben einer Schreibanregung: Text und Bild-zu-Video

Ein gutes Ergebnis hängt von der Textvorgabe ab. Das System belohnt Präzision. „Ein Hund“ liefert Geräusche. „Ein nasser Golden Retriever schüttelt sich in Zeitlupe, gegen das Licht der späten Nachmittagssonne, gefilmt mit einem 50-mm-Objektiv“ liefert hingegen brauchbare Informationen. Beschreiben Sie das Motiv, die Handlung, das Licht und die Kamera. Sie konnten auch ein Bild hochladen und es von Sora animieren lassen – ein Bild-zu-Video-Modus, der ein Standbild in einige Sekunden Bewegung verwandelte und somit gleichzeitig als eine Art Bewegtbildgenerator diente. Die größte Herausforderung bestand darin, die Vorgaben so zu formulieren, wie ein Regisseur seine Kameraeinstellungen schreibt.

Standardmäßig enthielt jeder Clip ein sichtbares Wasserzeichen und C2PA-Metadaten, die ihn als KI-generiert kennzeichneten. Beides spielte später eine Rolle.

Warum wurde die Sora AI-App abgeschaltet?

OpenAI kündigte die Einstellung des Betriebs am 24. März 2026 an und schaltete die Anwendung am 26. April ab. Die Technologie funktionierte. Das Geschäft nicht.

Berichten zufolge kostete der Betrieb von Sora im Massenmarkt rund eine Million Dollar pro Tag an Rechenleistung. Demgegenüber erzielte die App laut TechCrunch während ihrer gesamten Laufzeit etwa 1,4 Millionen Dollar durch In-App-Käufe. Die Nutzerbasis erreichte ihren Höhepunkt bei fast einer Million und fiel dann innerhalb weniger Wochen nach dem Start auf unter eine halbe Million – ein typischer Verlauf für Neuheiten. Ein separater Lizenzvertrag mit Disney im Wert von rund einer Milliarde Dollar für die Rechte an über 200 Charakteren endete mit dem Ende der App.

Datum Was ist passiert
Februar 2024 Sora wurde öffentlich vorgestellt
Dezember 2024 Erste Version innerhalb von ChatGPT veröffentlicht
30. September 2025 Sora 2 und der Start der iOS-App
24. März 2026 Einstellung angekündigt
26. April 2026 App heruntergefahren

OpenAI hat die Technologie jedoch nicht aufgegeben, und genau das gerät oft in Vergessenheit. Die Funktionalität lebt in ChatGPT und Unternehmensprodukten weiter, und das Sora-Modell selbst blieb über die API für Entwickler zugänglich. Was OpenAI jedoch verhinderte, war die Entwicklung kostenloser Social-Media-Apps, die auf Sora AI basierten – die teuerste und unrentabelste Art der Bereitstellung. Für alle Anbieter von KI-Dienstleistungen ist die Lehre eindeutig: Wert entsteht dort, wo Nutzer für Ergebnisse bezahlen, nicht dort, wo sie kostenlos Inhalte nutzen.

Kosten von Sora AI: Abonnements, Guthaben, API

Sora erhielt sein Geld auf drei Wegen, und die Unterschiede erklären viel darüber, wie bezahlte KI im Allgemeinen funktioniert.

Zufahrtsweg Was Sie erhalten Preis
ChatGPT Plus Sora im Chat, Standardgenerationen 20 $ / Monat
ChatGPT Pro Höhere Limits, längere und HD-Clips 200 US-Dollar / Monat
Guthabenpakete (kostenlose Stufe) Bezahlung pro einzelnem Video Variiert je nach Packung
API, sora-2 (720p) Abrechnung pro Sekunde Video ca. 0,10 $ / Sekunde
API, sora-2-pro (1080p) Abrechnung pro Sekunde Video ca. 0,30 bis 0,50 US-Dollar/Sekunde

Die meisten Gelegenheitsnutzer zahlten nie direkt. Sora war Teil eines ChatGPT-Abonnements und profitierte somit von den monatlichen Ausgaben von 20 oder 200 US-Dollar, die Nutzer bereits für den Chatbot tätigten. Diese Bündelung ist wichtig, denn OpenAIs eigentlicher Erfolgsmotor sind Abonnements: rund 50 Millionen zahlende Abonnenten, geschätzte 25 Milliarden US-Dollar jährlich wiederkehrende Einnahmen und etwa 900 Millionen wöchentlich aktive Nutzer. Im Vergleich dazu waren die 1,4 Millionen US-Dollar der Sora-App vernachlässigbar.

Das Interessante daran ist die API. Hier kaufte man keinen Tarif. Die Abrechnung erfolgte pro generierter Videosekunde, etwa zehn Cent pro Sekunde bei 720p und das Drei- bis Fünffache für 1080p-Pro-Ausgabe, laut OpenAI-API-Dokumentation (Stand: 2026). Ein zehnsekündiger Clip kostete im günstigsten Fall einen Dollar. Es handelt sich um nutzungsbasierte Abrechnung – genau wie bei Cloud-Servern oder Strom. Man kauft die Nutzung, nicht einen Lizenzplatz oder einen Tarif. Für Entwickler und Content-Ersteller, die Sora häufig nutzen, ist die sekundengenaue Abrechnung das eigentliche Produkt, und sie ist nach wie vor gültig.

Überlegen Sie einmal, was dieser Zähler bedeutet. Ein Studio, das hundert Clips pro Tag rendert, hat eine Rechnung, die mit der Leistung skaliert, ähnlich wie bei einem Stromanbieter. Ein Hobbyfilmer, der ein Video im Monat erstellt, zahlt nur wenige Cent. Das gleiche Modell ist für beide geeignet, da der Preis an die Rechenleistung und nicht an einen Arbeitsplatz gekoppelt ist. Auf dieses Modell konvergiert die Abrechnung von KI-Anwendungen zunehmend, von Sprachmodellen bis hin zu Bildgeneratoren: Sie zahlen für Ihren Verbrauch, gemessen in Token, Sekunden oder Megapixeln. Pauschale Monatstarife sind die freundliche Hülle. Die nutzungsbasierte Abrechnung ist der Motor dahinter, und ich wette, dass hier die KI-Einnahmen des nächsten Jahrzehnts ihren Ursprung haben werden.

Sora 2 im Vergleich zu anderen KI-Videogeneratoren

Sora AI sorgte für Schlagzeilen, war aber nie allein, und der Markt darum herum ist lukrativ. Laut Fortune Business Insights hatte der Markt für KI-Videogeneratoren im Jahr 2025 einen Wert von rund 716 Millionen US-Dollar und steuert bis 2025 auf etwa 847 Millionen US-Dollar zu, was einem jährlichen Wachstum von fast 19 % entspricht . Runway , ein Konkurrent, sammelte Anfang 2020 in einer Finanzierungsrunde 315 Millionen US-Dollar bei einer Bewertung von 5,3 Milliarden US-Dollar ein. Dies ist eine ernstzunehmende Branche, keine Demo.

Werkzeug Hersteller Synchronisierter Ton Zugang Preismodell
Sora 2 OpenAI Ja ChatGPT, API Abonnement + pro Sekunde
Veo 3 Google Ja Gemini, Vertex AI Abonnement + pro Sekunde
Runway Runway Beschränkt Web, App Guthaben, Abonnement
Kling Kuaishou Ja Web, App Guthaben, Abonnement

Das Wettbewerbsumfeld ähnelt dem von Sora. Googles Veo rechnet über Gemini-Abonnements ab, während Vertex AI sekundengenau abgerechnet wird und sich preislich in etwa mit Sora bewegt. Kling und Runway setzen auf Guthabenpakete, bei denen man ein Kontingent an Generationen im Voraus erwirbt und dieses dann verbraucht. Lässt man die Marken außer Acht, vergleicht man im Wesentlichen zwei Abrechnungsmodelle: Prepaid-Guthaben oder nutzungsbasierte Abrechnung. Die zugrundeliegenden Modelle bieten im Grunde alle dasselbe. Wenn man sich für Sora statt für Veo oder Kling entscheidet, wählt man ein Ökosystem und ein Zahlungsmodell, nicht etwa grundlegend andere Funktionen. Die Qualität verbessert sich alle paar Monate sprunghaft. Die Preisstruktur hingegen nicht.

sora-ai

Bezahlung von KI-Videotools mit Stablecoins

Hier wird der Bezug zu Kryptowährungen deutlich. Betrachten wir noch einmal die Abrechnungsmethoden dieser KI-Tools: kleine Beträge, häufig abgebucht, an Nutzer weltweit. Das ist ein Problem im Zahlungsverkehr, und genau dieses Problem lösen Stablecoins erfolgreich.

Warum Stablecoins zu KI-gestützter Abrechnung passen

Ein API-Aufruf für zehn Cent pro Sekunde ist eine Mikrozahlung. Kartennetzwerke hassen Mikrozahlungen, da feste Gebühren selbst Beträge unter einem Dollar schnell auffressen. Wiederkehrende Abonnements über Ländergrenzen hinweg verursachen zusätzlich Währungsumrechnungen und Probleme mit fehlgeschlagenen Zahlungen. Stablecoins , an den Dollar gekoppelte Token, deren Abrechnung On-Chain erfolgt, umgehen diese Probleme. Die Abrechnung ist günstig, nahezu sofort und unabhängig vom Standort des Nutzers – ob in Ohio oder Lagos. Das ist keine Theorie mehr. Stripe hat im Oktober 2025 Stablecoin-Zahlungen für Abonnements eingeführt und ermöglicht es Unternehmen, wiederkehrende Zahlungen in USDC genauso abzurechnen wie mit Kreditkarten. Die Infrastruktur dafür wird bereits geschaffen.

Auszahlungen an Kreative und globaler Zugang

Die andere Hälfte besteht darin, nicht nur Einnahmen, sondern auch Ausgaben zu generieren. KI-Video ist eine Kreativwirtschaft, und Kreative sind überall ansässig, auch dort, wo die Zahlungsabwicklung langsam ist oder Auszahlungen eine Woche dauern. Die Bezahlung eines Kreativen in Stablecoins erfolgt innerhalb von Minuten in US-Dollar, unabhängig vom lokalen Bankinstitut. Für eine Plattform, die monatlich Tausende kleiner Kreativer auszahlt, können allein die Einsparungen bei Bearbeitungsgebühren und Währungsumrechnung darüber entscheiden, ob das gesamte Modell rentabel ist. Das Ausmaß ist enorm: Die Marktkapitalisierung von Stablecoins überstieg 323 Milliarden US-Dollar im Jahr 2020, und Visa schätzt , dass das Bruttohandelsvolumen von Stablecoins im Jahr 2025 bei rund 33 Billionen US-Dollar liegen wird. Wenn die nutzungsbasierte Abrechnung von KI-Anwendungen und die weltweiten Auszahlungen an Kreative auf dieselbe Plattform zurückgreifen, wirkt diese Plattform weniger wie ein Krypto-Experiment und mehr wie eine etablierte Infrastruktur. Ein Händler, der heute Kryptozahlungen für ein KI-Tool akzeptieren möchte, kann dies tun, ohne einen Zahlungsdienstleister zu beauftragen.

Sora-KI-Risiken: Deepfakes, Urheberrecht, Wasserzeichen

Nichts davon ist sauber. Soras Wasserzeichen und C2PA-Tags sollten KI-generierte Clips kennzeichnen, doch schon innerhalb einer Woche nach dem Start tauchten Tools zum Entfernen der Wasserzeichen auf. Da die Urheberrechtseinstellungen standardmäßig auf Opt-out statt Opt-in basierten, reproduzierte Sora geschützte Charaktere und Stile, bis die Rechteinhaber Einspruch erhoben. Studio Ghibli und Square Enix forderten beide die Entfernung der Inhalte. Ein KI-Bild oder -Video, das realistisch aussieht und sein eigenes Wasserzeichen entfernt, ist ein Problem, das die Branche bisher nicht gelöst, sondern nur benannt hat.

Was die Sora-Geschichte dir wirklich sagt

Die Sora-App scheiterte aus einem banalen Grund: Ihre Betriebskosten überstiegen die Einnahmen. Die Technologie war nie das Problem. Hinter dem kostenlosen Angebot verbarg sich ein Geschäftsmodell, das erst dann wirklich Geld generiert, wenn sekundengenau abgerechnet wird. Der nachhaltige Wert von KI-Videos liegt in der nutzungsbasierten Rechenleistung, und diese ist in erster Linie eine Abrechnungsfrage. Wenn Sie also für KI sekundengenau bezahlen oder für deren Entwicklung bezahlt werden wollen, fragen Sie sich, welche Zahlungsmethode so kleine Beträge so schnell und global transferiert. Die ehrliche Antwort lautet derzeit nicht: eine Kreditkarte. Wie lange dauert es noch, bis Stablecoins die Standardantwort sind?

Irgendwelche Fragen?

Die eigenständige Sora-App wurde im April 2026 eingestellt, da ihre Betriebskosten täglich rund 1 Million US-Dollar betrugen, während sie über die gesamte Laufzeit nur etwa 1,4 Millionen US-Dollar einbrachte. OpenAI behielt das zugrundeliegende Modell in ChatGPT und dessen API bei und stellte lediglich die unrentable kostenlose Social-Media-App ein.

Nicht wirklich. Der Gelegenheitszugang war an kostenpflichtige ChatGPT-Abos ab 20 US-Dollar pro Monat gekoppelt, und kostenlose Nutzer mussten Guthaben kaufen, um einzelne Videos zu generieren. Drittanbieterseiten werben zwar mit „kostenlosen“ Sora-Generierungen, diese funktionieren aber mit eigenen Guthabensystemen und Nutzungsbeschränkungen.

Die Nutzer-App ist nicht mehr verfügbar, das Modell jedoch schon. Die Sora-Funktionen sind weiterhin in ChatGPT für zahlende Abonnenten enthalten, und Entwickler können über die OpenAI-API auf das Modell zugreifen. Somit kann die Öffentlichkeit weiterhin Sora-Videos erstellen, nur eben nicht mehr über die virale, eigenständige App, die 2025 erscheinen sollte.

Über ChatGPT kostete die Plus-Version 20 US-Dollar pro Monat, die Pro-Version 200 US-Dollar. Über die API wurde pro Videosekunde abgerechnet: etwa 0,10 US-Dollar pro Sekunde bei 720p und ungefähr 0,30 bis 0,50 US-Dollar pro Sekunde für 1080p-Pro-Ausgabe. Ein zehnsekündiger Clip kostete ab einem US-Dollar.

Das hängt von der Quelle ab. Die Nutzungsbedingungen von OpenAI erlaubten zwar eine gewisse kommerzielle Nutzung, das größere Risiko lag jedoch im Urheberrecht: Sora konnte geschützte Charaktere und Stile reproduzieren, was mehrere Studios beanstandeten. Viele Drittanbieter-Wrapper für Sora gewähren zwar eine kommerzielle Lizenz, die zugrundeliegenden Rechtefragen gelten aber weiterhin für die vom Modell generierten Inhalte.

Immer häufiger ja. Stripe führte Ende 2025 die Abrechnung von Abonnements mit Stablecoins ein, und Krypto-Zahlungsgateways ermöglichen es Unternehmen, Stablecoins direkt für Software- und KI-Dienstleistungen zu akzeptieren. Für die nutzungsbasierte, grenzüberschreitende Abrechnung von KI-Dienstleistungen eignen sich Stablecoins besser als Karten, die bei kleinen und internationalen Beträgen Schwierigkeiten haben.

Ready to Get Started?

Create an account and start accepting payments – no contracts or KYC required. Or, contact us to design a custom package for your business.

Make first step

Always know what you pay

Integrated per-transaction pricing with no hidden fees

Start your integration

Set up Plisio swiftly in just 10 minutes.