Sora AI : Le modèle de conversion texte-vidéo d’OpenAI expliqué
Pendant environ un mois, Sora AI a été l'application la plus téléchargée aux États-Unis. Puis OpenAI l'a désactivée. L'application, qui permettait à quiconque de taper une phrase et d'obtenir en retour une minute de vidéo synchronisée et de qualité cinématographique, a atteint la première place, a suscité une avalanche de deepfakes de célébrités et de parodies du Studio Ghibli, avant de disparaître discrètement en avril 2026. Une question revenait sans cesse : comment une application aussi populaire peut-elle disparaître du jour au lendemain ?
La réponse courte, c'est l'argent. Une réponse plus détaillée est plus pertinente, surtout si vous payez pour des outils d'IA ou si vous les vendez. La valeur de Sora AI n'a jamais résidé dans le flux social gratuit, mais dans la puissance de calcul louée à la seconde pour générer des vidéos. Cette distinction est essentielle et nous amène à un point souvent négligé : comment les gens financent concrètement ces services et pourquoi le système de paiement devient aussi important que le modèle économique lui-même.
Qu'est-ce que Sora AI et comment fonctionne le modèle vidéo ?
Sora AI est un modèle de conversion texte-vidéo développé par OpenAI. Il suffit de lui fournir une entrée textuelle pour qu'il génère un court clip vidéo. C'est le principe même de la génération vidéo par IA. En interne, il s'agit d'un transformateur de diffusion, appartenant à la même famille d'architecture que celle utilisée par les outils d'imagerie IA modernes, mais entraîné cette fois-ci sur la vidéo et le temps.
OpenAI a présenté Sora en avant-première en février 2024 avec quelques extraits vidéo de démonstration, puis a intégré une première version à ChatGPT en décembre 2024. Les premières versions de Sora généraient des séquences d'une minute environ et, curieusement, parvenaient à appréhender rudimentairement l'espace 3D et les mouvements de caméra sans apprentissage explicite. La parallaxe n'avait pas été programmée. Sora a appris que le déplacement de la caméra modifie la perception visuelle, à la manière d'un enfant, en observant suffisamment d'exemples.
C’est aussi pourquoi le résultat était inégal. Le modèle pouvait générer une scène de rue crédible, puis faire traverser un mur à une personne, car il n’a jamais appris la physique comme une série de règles, mais seulement comme des schémas. Il est bon de s’en souvenir lorsqu’une vidéo semble parfaite : le modèle ignore tout de la gravité.

Comment créer des vidéos IA avec Sora 2
La version qui a connu un succès viral est Sora 2, sortie le 30 septembre 2025, en même temps que l'application iOS. C'était un véritable tournant, et il est intéressant de voir à quoi ressemblait la création avec cette version.
Synchronisation audio, physique et plans cinématographiques
Sora 2 a intégré le son. Les dialogues, les bruits de pas et les sons d'ambiance étaient désormais synchronisés avec l'image, au lieu d'être des clips muets qu'il fallait ajouter soi-même. Le réalisme des mouvements était l'amélioration la plus visible : les objets entraient en collision et tombaient de manière convaincante. Le modèle pouvait également enchaîner plusieurs angles de caméra en une seule génération, donnant aux courts clips une dimension cinématographique qui faisait défaut à la première version. C'était la différence entre une carte postale animée et une séquence digne d'un film.
Apparitions, remix et montage
La fonctionnalité phare était Caméo : s’enregistrer une seule fois, puis intégrer son image dans n’importe quelle scène générée. C’est cette fonctionnalité, plus encore que la qualité brute, qui a assuré le succès de l’application. Un petit outil de montage était également proposé. Remix permettait de modifier un clip existant à l’aide d’une nouvelle commande. Recut régénérait un segment. Loop transformait un clip en une répétition fluide, et Blend fusionnait deux vidéos. Aucune compétence en montage n’était requise, et c’était bien là l’objectif.
Rédaction d'une consigne : conversion de texte et d'image en vidéo
L'obtention d'un bon résultat dépendait de la précision du texte d'entraînement. Le modèle privilégie les descriptions détaillées. « Un chien » vous donne un son. « Un golden retriever mouillé qui s'ébroue au ralenti, à contre-jour sous le soleil de fin d'après-midi, filmé avec un objectif 50 mm » vous donne un résultat exploitable. Décrivez le sujet, l'action, la lumière et la caméra. Vous pouviez également importer une image et la faire animer par Sora : un mode image vers vidéo qui transformait une image fixe en quelques secondes de mouvement, faisant ainsi office de générateur d'images animées. La principale difficulté résidait dans l'apprentissage de la rédaction de consignes similaires aux notes de plan d'un réalisateur.
Par défaut, chaque clip comportait un filigrane visible et des métadonnées C2PA indiquant qu'il était généré par IA. Ces deux éléments se sont avérés importants par la suite.
Pourquoi l'application Sora AI a-t-elle été fermée ?
OpenAI a annoncé la fermeture progressive de l'application le 24 mars 2026 et l'a désactivée le 26 avril. La technologie fonctionnait. L'entreprise, non.
L'exécution de Sora à grande échelle aurait coûté environ un million de dollars par jour en ressources de calcul. En contrepartie, l'application a généré environ 1,4 million de dollars grâce aux achats intégrés, selon TechCrunch . Le nombre d'utilisateurs a culminé à près d'un million, avant de chuter sous la barre des 500 000 quelques semaines après son lancement, une courbe classique de popularité liée à la nouveauté. Un contrat de licence distinct avec Disney, d'une valeur d'environ un milliard de dollars pour les droits d'utilisation de plus de 200 personnages, a pris fin en même temps que l'application.
| Date | Ce qui s'est passé |
|---|---|
| Février 2024 | Sora a été présenté en avant-première au public |
| Décembre 2024 | Première version publiée dans ChatGPT |
| 30 septembre 2025 | Sora 2 et le lancement de l'application iOS |
| 24 mars 2026 | Arrêt annoncé |
| 26 avril 2026 | L'application s'est arrêtée. |
OpenAI n'a pourtant pas abandonné la technologie, et cet aspect est souvent négligé. Ses fonctionnalités sont toujours présentes dans ChatGPT et les produits destinés aux entreprises, et le modèle Sora lui-même reste accessible aux développeurs via l'API. Ce qu'OpenAI a en revanche supprimé, c'est l'application sociale gratuite basée sur Sora AI – la solution la plus coûteuse et la moins rentable pour la déployer. Pour quiconque propose des services d'IA, la leçon est claire : la valeur ajoutée se crée là où les utilisateurs paient pour un résultat, et non là où ils consultent du contenu gratuitement.
Coût de Sora AI : abonnements, crédits, API
L'argent est arrivé chez Sora de trois manières différentes, et ces différences expliquent beaucoup de choses sur le fonctionnement général de l'IA payante.
| Voie d'accès | Ce que vous obtenez | Prix |
|---|---|---|
| ChatGPT Plus | Sora dans le chat, générations standard | 20 $ par mois |
| ChatGPT Pro | Des limites plus élevées, des clips plus longs et en HD | 200 $ par mois |
| Packs de crédits (niveau gratuit) | Paiement par vidéo individuelle | Varie selon l'emballage |
| API, sora-2 (720p) | Facturation à la seconde de vidéo | ~0,10 $/sec |
| API, sora-2-pro (1080p) | Facturation à la seconde de vidéo | ~0,30 $ à 0,50 $ / seconde |
La plupart des utilisateurs occasionnels n'ont jamais payé directement. Sora était proposé avec un abonnement ChatGPT, profitant ainsi des 20 ou 200 dollars mensuels que les utilisateurs dépensaient déjà pour le chatbot. Cette offre groupée est importante, car le véritable moteur d'OpenAI repose sur les abonnements : environ 50 millions d'abonnés payants, un chiffre d'affaires annuel récurrent estimé à 25 milliards de dollars et près de 900 millions d'utilisateurs actifs hebdomadaires. À côté de cela, les 1,4 million de dollars de l'application Sora étaient une goutte d'eau dans l'océan.
Le niveau le plus intéressant est l'API. Ici, pas d'abonnement. Le paiement se fait à la seconde de vidéo générée, environ dix centimes la seconde en 720p et trois à cinq fois plus pour une sortie professionnelle en 1080p, selon la documentation de l'API d'OpenAI (en date du 2026). Un clip de dix secondes coûtait un dollar au minimum. C'est une facturation à l'usage, comme pour les serveurs cloud ou l'électricité. Vous payez pour l'utilisation, pas pour une licence ou un abonnement. Pour un développeur ou un créateur utilisant Sora en grande quantité, la facturation à la seconde constitue le produit à part entière, et ce système n'a jamais disparu.
Réfléchissez à ce que ce compteur implique. Un studio qui produit une centaine de clips par jour voit sa facture augmenter proportionnellement à sa production, comme pour un service public. Un amateur qui réalise une vidéo par mois ne paie que quelques centimes. Ce même modèle convient aux deux car le prix est lié à la puissance de calcul, et non à l'utilisation du poste. C'est vers ce modèle que convergent presque tous les systèmes de facturation sérieux en IA, des modèles de langage aux générateurs d'images : vous êtes facturé à l'usage, mesuré en jetons, en secondes ou en mégapixels. Les forfaits mensuels sont l'interface conviviale. La facturation à l'usage est le moteur sous-jacent, et je parierais que c'est là que se trouveront les revenus de l'IA pour la prochaine décennie.
Sora 2 contre d'autres générateurs vidéo IA
Sora AI a fait la une des journaux, mais elle n'était pas seule, et le marché qui l'entoure représente un véritable enjeu financier. Le secteur des générateurs vidéo IA pesait environ 716 millions de dollars en 2025 et devrait atteindre près de 847 millions de dollars en 2020, soit une croissance annuelle de près de 19 %, selon Fortune Business Insights . Runway , un concurrent, a levé 315 millions de dollars début 2020, pour une valorisation de 5,3 milliards de dollars. Il s'agit d'un secteur sérieux, et non d'une simple démonstration.
| Outil | Fabricant | Audio synchronisé | Accéder | Modèle de tarification |
|---|---|---|---|---|
| Sora 2 | OpenAI | Oui | ChatGPT, API | Abonnement + par seconde |
| Veo 3 | Oui | Gemini, IA Vertex | Abonnement + par seconde | |
| Piste | Piste | Limité | Web, application | Crédits, abonnement |
| Kling | Kuaishou | Oui | Web, application | Crédits, abonnement |
Le paysage concurrentiel est similaire à celui de Sora. Google Veo facture via des abonnements Gemini et une tarification à la seconde pour Vertex AI, ce qui le place dans la même catégorie que Sora. Kling et Runway s'appuient sur des forfaits de crédits : vous achetez un ensemble de générations à l'avance et vous les utilisez ensuite. Au-delà des marques, la comparaison se résume principalement à deux modes de facturation : crédits prépayés ou paiement à l'usage, intégrés à des modèles qui offrent tous plus ou moins les mêmes fonctionnalités. Choisir Sora plutôt que Veo ou Kling, c'est choisir un écosystème et un modèle de paiement, et non des capacités radicalement différentes. La qualité progresse rapidement tous les quelques mois. La structure tarifaire, elle, reste la même.

Payer des outils vidéo IA avec des stablecoins
C’est là que l’apport des cryptomonnaies devient évident. Prenons l’exemple de ces outils d’IA : de petits montants, facturés fréquemment, à des utilisateurs du monde entier. Il s’agit d’un problème de paiement, et c’est précisément le problème que les stablecoins résolvent efficacement.
Pourquoi les stablecoins sont adaptés à la facturation IA à l'usage
Un appel API à dix centimes la seconde correspond à un micropaiement. Les réseaux de cartes bancaires détestent les micropaiements, car les frais fixes absorbent rapidement les transactions inférieures à un dollar. Les abonnements internationaux récurrents ajoutent à cela les conversions de devises et les pertes liées aux paiements échoués. Les stablecoins , jetons indexés sur le dollar et réglés sur la blockchain, permettent de contourner ces deux problèmes. Le règlement est peu coûteux, quasi instantané et identique, que l'utilisateur soit dans l'Ohio ou à Lagos. Ce n'est plus de la théorie. Stripe a lancé les paiements en stablecoins pour les abonnements en octobre 2025, permettant aux entreprises de facturer les paiements récurrents en USDC de la même manière que les paiements par carte. L'infrastructure est en cours de déploiement.
Rémunération des créateurs et accès mondial
L'autre moitié du problème réside dans la distribution des fonds, et pas seulement dans leur encaissement. La vidéo IA repose sur une économie de créateurs, et ces derniers sont présents partout dans le monde, y compris dans les régions où les réseaux de paiement par carte sont peu développés ou les délais de versement d'une semaine. Payer un créateur en stablecoins est instantané, en dollars, indépendamment du système bancaire local. Pour une plateforme qui rémunère des milliers de petits créateurs chaque mois, les économies réalisées sur les frais de traitement et de conversion de devises peuvent à elles seules déterminer la viabilité du modèle. L'ampleur du phénomène est désormais considérable : la capitalisation boursière des stablecoins a dépassé les 323 milliards de dollars en 2003, et le volume brut des transactions en stablecoins devrait atteindre environ 33 000 milliards de dollars en 2025, selon les estimations de Visa . Lorsque la facturation à l'usage pour l'IA et les paiements aux créateurs du monde entier convergent vers le même système, ce dernier ressemble moins à une expérience crypto qu'à une véritable infrastructure. Un commerçant souhaitant accepter les paiements en cryptomonnaies pour un outil d'IA peut le faire dès aujourd'hui sans passer par un processeur de cartes.
Risques liés à l'IA de Sora : deepfakes, droits d'auteur, filigranes
Rien de tout cela n'est irréprochable. Le filigrane et les étiquettes C2PA de Sora AI étaient censés signaler les clips générés par l'IA, mais des outils de suppression de filigrane sont apparus une semaine après le lancement. Le système de droits d'auteur étant par défaut optionnel, et non optionnel, Sora a reproduit des personnages et des styles protégés jusqu'à ce que les ayants droit protestent. Studio Ghibli et Square Enix ont tous deux exigé le retrait des contenus. Une image ou une vidéo générée par IA qui paraît réelle et supprime son propre filigrane est un problème que l'industrie n'a pas résolu, mais seulement identifié.
Ce que l'histoire de Sora vous apprend réellement
L'application Sora a disparu pour une raison banale : son coût d'exploitation dépassait ses revenus. La technologie n'a jamais été le problème. Derrière le flux gratuit se cachait un modèle économique qui génère des profits considérables dès lors qu'il est facturé à la seconde. La valeur durable de la vidéo IA réside dans la puissance de calcul mesurée, et cette mesure relève davantage de la facturation que de la création. Ainsi, si vous comptez payer pour l'IA à la seconde, ou être rémunéré pour sa création, demandez-vous quel moyen de paiement permet de faire circuler des sommes aussi faibles, aussi rapidement et à l'échelle mondiale. Actuellement, la réponse honnête n'est pas une carte bancaire. Combien de temps faudra-t-il avant que la solution par défaut ne soit un stablecoin ?