Sora AI: il modello di OpenAI per la conversione da testo a video, spiegato in dettaglio.
Per circa un mese, Sora AI è stata l'app più scaricata negli Stati Uniti. Poi OpenAI l'ha disattivata. L'app che permetteva a chiunque di digitare una frase e ottenere in cambio un minuto di video cinematografico sincronizzato ha raggiunto il primo posto, ha attirato una valanga di deepfake di celebrità e imitazioni dello Studio Ghibli, per poi chiudere silenziosamente nell'aprile del 2026. La gente continuava a porsi la domanda ovvia: com'è possibile che qualcosa di così popolare scompaia così all'improvviso?
La risposta breve è: soldi. La risposta più lunga è più utile, soprattutto se si pagano strumenti di intelligenza artificiale o li si vendono. Il valore di Sora AI non è mai stato nel feed social gratuito. Il suo valore risiede nella potenza di calcolo che si affitta al secondo per generare video. Questa distinzione è fondamentale e ci porta a un punto che la maggior parte degli articoli tralascia: come le persone pagano effettivamente per questi servizi e perché il meccanismo di pagamento sta diventando importante quanto il modello stesso.
Cos'è Sora AI e come funziona il modello video.
Sora AI è un modello di conversione da testo a video sviluppato da OpenAI. Gli si fornisce un input di testo e il modello di generazione video restituisce una breve clip. Questa è l'idea alla base della generazione video tramite intelligenza artificiale. A livello tecnico, si tratta di un trasformatore di diffusione, appartenente alla stessa ampia famiglia di algoritmi utilizzati nei moderni strumenti di elaborazione delle immagini basati sull'IA, addestrato però su video e tempo.
Nel febbraio 2024 OpenAI ha presentato in anteprima Sora con alcuni brevi video dimostrativi, per poi rilasciare una prima versione all'interno di ChatGPT nel dicembre 2024. Le prime versioni di Sora generavano clip della durata massima di circa un minuto e, stranamente, acquisivano una vaga idea dello spazio 3D e del movimento della telecamera senza che nessuno dei due concetti fosse esplicitamente insegnato. Nessuno aveva programmato l'effetto parallasse. Imparava che muovere la telecamera modifica la percezione visiva – nello stesso modo in cui lo impara un bambino – guardando un numero sufficiente di esempi.
Questo è anche il motivo per cui il risultato era discontinuo. Il modello poteva riprodurre una scena di strada credibile e poi far attraversare un muro a una persona, perché non aveva mai imparato le leggi della fisica come regole, ma solo come schemi. È utile ricordarlo quando un video sembra impeccabile: il sistema non ha idea di cosa sia la gravità.

Come creare video con intelligenza artificiale utilizzando Sora 2
La versione che è diventata virale è stata Sora 2, rilasciata il 30 settembre 2025, insieme all'app per iOS. Questo è stato il vero salto di qualità, e vale la pena vedere com'era effettivamente creare contenuti con essa.
Audio, fisica e inquadrature cinematografiche sincronizzati.
Sora 2 ha introdotto l'audio. Dialoghi, passi e rumori di sottofondo venivano ora sincronizzati con le immagini, anziché essere clip silenziose da gestire manualmente. Il miglioramento più evidente è stato il movimento realistico: gli oggetti si scontravano e cadevano in modo perlopiù credibile. Il modello era inoltre in grado di concatenare diverse angolazioni di ripresa in una singola generazione, conferendo alle brevi clip un'atmosfera cinematografica che mancava alla prima versione. Era la differenza tra una cartolina animata e qualcosa che sembrava un montaggio cinematografico.
Camei, remix e montaggio
La funzionalità social di punta era Cameo: registrati una volta e poi inserisci la tua immagine in qualsiasi scena generata. È stata proprio questa, più che la qualità intrinseca del video, a decretare il successo dell'app. A completare il tutto, un piccolo kit di editing. Remix permetteva di modificare una clip esistente con un nuovo suggerimento. Recut rigenerava un singolo segmento. Loop trasformava una clip in una ripetizione continua e Blend univa due video. Nessuna di queste funzioni richiedeva competenze di editing, ed era proprio questo l'obiettivo.
Scrittura di un prompt: testo e immagine in video
Ottenere un buon risultato dipendeva dal testo di input. Il modello premia la specificità. "Un cane" genera rumore. "Un golden retriever bagnato che si scrolla di dosso l'acqua al rallentatore, controluce grazie al sole del tardo pomeriggio, ripreso con un obiettivo da 50 mm" fornisce qualcosa di utilizzabile. Descrivi il soggetto, l'azione, la luce e la telecamera. Potevi anche caricare un'immagine e farla animare da Sora, una modalità da immagine a video che trasformava un'immagine statica in pochi secondi di movimento, fungendo quindi anche da una sorta di generatore di immagini in movimento. Gran parte del lavoro consisteva nell'imparare a scrivere i prompt come un regista scrive le note di ripresa.
Di default, ogni clip presentava una filigrana visibile e metadati C2PA che la identificavano come generata dall'intelligenza artificiale. Entrambi gli elementi si sarebbero rivelati importanti in seguito.
Perché l'app Sora AI è stata chiusa?
OpenAI ha annunciato la cessazione delle attività il 24 marzo 2026 e ha disattivato l'applicazione il 26 aprile. La tecnologia funzionava. Il modello di business no.
Secondo alcune fonti, la gestione di Sora su larga scala per il mercato consumer avrebbe comportato costi di elaborazione pari a circa un milione di dollari al giorno. A fronte di ciò, l'app ha generato circa 1,4 milioni di dollari di ricavi dagli acquisti in-app nel corso della sua intera vita, come riportato da TechCrunch . La base di utenti ha raggiunto un picco di quasi un milione per poi scendere sotto il mezzo milione nelle settimane successive al lancio, seguendo la classica curva di crescita tipica delle novità. Un accordo di licenza separato con Disney, del valore di circa un miliardo di dollari per i diritti di utilizzo di oltre 200 personaggi, si è concluso con la chiusura dell'app.
| Data | Quello che è successo |
|---|---|
| Febbraio 2024 | Sora è stata presentata in anteprima al pubblico |
| Dicembre 2024 | Prima versione rilasciata all'interno di ChatGPT |
| 30 settembre 2025 | Sora 2 e il lancio dell'app iOS |
| 24 marzo 2026 | Interruzione annunciata |
| 26 aprile 2026 | Chiusura dell'app |
OpenAI non ha abbandonato la tecnologia, e questo aspetto tende a passare inosservato. La funzionalità sopravvive all'interno di ChatGPT e dei prodotti aziendali, e il modello Sora stesso rimane accessibile tramite API per gli sviluppatori. Ciò che OpenAI ha eliminato è stata l'app social gratuita basata sull'IA di Sora, il modo più costoso e meno redditizio per offrirla. Per chiunque venda servizi di IA, la lezione è chiara: il valore si crea dove le persone pagano per un risultato, non dove navigano gratuitamente.
Quanto costa Sora AI: abbonamenti, crediti, API
Il denaro affluiva in Sora in tre modi diversi, e le differenze spiegano molto su come funziona l'intelligenza artificiale a pagamento in generale.
| Percorso di accesso | Ciò che ottieni | Prezzo |
|---|---|---|
| ChatGPT Plus | Sora in chat, generazioni standard | 20 dollari al mese |
| ChatGPT Pro | Limiti più elevati, clip più lunghe e in HD. | 200 dollari al mese |
| Pacchetti di crediti (livello gratuito) | Pagamento per singolo video | Varia a seconda della confezione |
| API, sor-2 (720p) | Fatturazione al secondo di video | Circa 0,10 dollari al secondo |
| API, sor-2-pro (1080p) | Fatturazione al secondo di video | Da circa 0,30 a 0,50 dollari al secondo. |
La maggior parte degli utenti occasionali non ha mai pagato direttamente. Sora veniva offerto in bundle con un abbonamento a ChatGPT, quindi si basava sugli stessi 20 o 200 dollari al mese che le persone già spendevano per il chatbot. Questo abbinamento è importante, perché il vero motore di OpenAI sono gli abbonamenti: circa 50 milioni di abbonati paganti, un fatturato annuo ricorrente stimato di 25 miliardi di dollari e circa 900 milioni di utenti attivi settimanali. Rispetto a ciò, 1,4 milioni di dollari dell'app Sora erano una cifra irrisoria.
Il livello più interessante è l'API. In questo caso, non si acquista un piano tariffario. Si paga al secondo di video generato, circa dieci centesimi al secondo a 720p e da tre a cinque volte tanto per l'output professionale a 1080p, secondo la documentazione dell'API di OpenAI (aggiornata al 2026). Una clip di dieci secondi costava almeno un dollaro. Si tratta di un sistema di calcolo a consumo, allo stesso modo in cui si pagano i server cloud o l'elettricità. Si acquista l'utilizzo, non una postazione o un piano tariffario. Per uno sviluppatore o un creatore che utilizza Sora in grandi quantità, il consumo al secondo rappresenta il prodotto reale, e non è mai stato eliminato.
Pensate a cosa implica quel sistema di misurazione. Uno studio che elabora cento clip al giorno ha una bolletta che aumenta in base alla produzione, come una bolletta di un'utenza. Un hobbista che realizza un video al mese paga pochi centesimi. Lo stesso modello funziona per entrambi perché il prezzo è legato alla potenza di calcolo, non al numero di postazioni. Questa è la forma verso cui sta convergendo quasi tutta la fatturazione dell'IA, dai modelli linguistici ai generatori di immagini: si paga per ciò che si consuma, misurato in token, secondi o megapixel. I piani mensili fissi sono solo l'involucro. Il consumo misurato è il motore sottostante, e scommetto che è lì che risiederanno i ricavi dell'IA per il prossimo decennio.
Sora 2 contro altri generatori di video basati sull'IA
Sora AI ha fatto parlare di sé, ma non è mai stata sola, e il mercato che la circonda è davvero redditizio. Il settore dei generatori video basati sull'intelligenza artificiale valeva circa 716 milioni di dollari nel 2025 e si prevede che raggiungerà circa 847 milioni di dollari nel 2018, con una crescita di quasi il 19% all'anno, secondo Fortune Business Insights . Runway , un concorrente, ha raccolto 315 milioni di dollari in un round di finanziamento all'inizio del 2018, con una valutazione di 5,3 miliardi di dollari. Si tratta di un settore serio, non di una semplice dimostrazione.
| Attrezzo | Creatore | Audio sincronizzato | Accesso | Modello di prezzo |
|---|---|---|---|---|
| Sora 2 | OpenAI | SÌ | ChatGPT, API | Abbonamento + al secondo |
| Veo 3 | SÌ | Gemini, Vertex AI | Abbonamento + al secondo | |
| Pista | Pista | Limitato | Web, app | Crediti, abbonamento |
| Kling | Kuaishou | SÌ | Web, app | Crediti, abbonamento |
Il quadro competitivo è molto simile a quello di Sora. Veo di Google fattura tramite abbonamenti Gemini e prezzi al secondo per Vertex AI, che si collocano nella stessa fascia di prezzo di Sora. Kling e Runway si basano su pacchetti di crediti, in cui si acquista un blocco di generazioni in anticipo e lo si utilizza. Al di là del marchio, si tratta sostanzialmente di confrontare due stili di fatturazione, crediti prepagati o pagamento a consumo, basati su modelli che offrono tutti sostanzialmente la stessa funzionalità. Scegliere Sora al posto di Veo o Kling significa scegliere un ecosistema e un modello di pagamento, non una funzionalità radicalmente diversa. La qualità migliora a passi da gigante ogni pochi mesi, ma la struttura dei prezzi rimane invariata.

Pagare strumenti video basati sull'intelligenza artificiale con stablecoin
È qui che il collegamento con le criptovalute smette di essere forzato e inizia a essere evidente. Osservate di nuovo come questi strumenti basati sull'intelligenza artificiale addebitano i costi: piccole somme, addebitate frequentemente, a utenti di tutto il mondo. Questo è un problema di pagamenti, ed è esattamente il problema che le stablecoin risolvono efficacemente.
Perché le stablecoin sono adatte alla fatturazione a consumo dell'IA
Una chiamata API da dieci centesimi al secondo è un micropagamento. I circuiti di pagamento non gradiscono i micropagamenti, perché le commissioni fisse si fanno sentire anche con importi inferiori a un dollaro. Gli abbonamenti ricorrenti transfrontalieri comportano inoltre costi aggiuntivi dovuti alla conversione di valuta e ai mancati pagamenti. Le stablecoin , token ancorati al dollaro che vengono regolati on-chain, aggirano entrambi questi problemi. La transazione è economica, quasi istantanea e la stessa sia che l'utente si trovi in Ohio o a Lagos. Non si tratta più di una teoria. Stripe ha lanciato i pagamenti in stablecoin per gli abbonamenti nell'ottobre 2025, consentendo alle aziende di fatturare in USDC con la stessa modalità utilizzata per le carte di credito. Le infrastrutture sono in fase di realizzazione.
Pagamenti ai creatori e accesso globale
L'altra metà consiste nel prelevare denaro, non solo riceverlo. I video basati sull'IA sono un'economia dei creatori, e i creatori si trovano ovunque, anche in luoghi dove i circuiti di pagamento con carta sono deboli o i pagamenti richiedono una settimana. Pagare un creatore in stablecoin significa che il pagamento avviene in pochi minuti, in dollari, indipendentemente dal sistema bancario locale. Per una piattaforma che paga migliaia di piccoli creatori ogni mese, il solo risparmio sulle commissioni di elaborazione e sulla conversione di valuta può determinare la redditività dell'intero modello. La portata di questo fenomeno non è più trascurabile: la capitalizzazione di mercato delle stablecoin ha superato i 323 miliardi di dollari nel 2025 e, secondo le stime di Visa , nel 2025 sono stati movimentati circa 33 trilioni di dollari di volume lordo. Quando la fatturazione a consumo dell'IA e i pagamenti globali ai creatori convergono sulla stessa infrastruttura, quest'ultima inizia ad assomigliare meno a un esperimento nel mondo delle criptovalute e più a una vera e propria infrastruttura. Un commerciante che desidera accettare pagamenti in criptovalute per uno strumento basato sull'IA può farlo oggi senza dover ricorrere a un sistema di elaborazione dei pagamenti con carta.
Rischi di Sora AI: deepfake, copyright, filigrane
Niente di tutto ciò è pulito. La filigrana e i tag C2PA di Sora AI erano pensati per segnalare i video generati dall'IA, ma gli strumenti per la rimozione della filigrana sono comparsi entro una settimana dal lancio. L'impostazione predefinita del copyright era l'opt-out, non l'opt-in, quindi Sora ha riprodotto personaggi e stili protetti fino a quando i detentori dei diritti non si sono opposti. Sia Studio Ghibli che Square Enix hanno richiesto la rimozione. Un'immagine o un video generato dall'IA che sembra reale e rimuove la propria filigrana è un problema che il settore non ha risolto, ma solo etichettato.
Cosa ti racconta davvero la storia di Sora
L'app Sora è fallita per un motivo banale: i costi di gestione superavano i guadagni. La tecnologia non è mai stata il problema. Dietro il feed gratuito si celava un modello che genera profitti reali nel momento in cui si inizia a fatturare al secondo. Il valore duraturo dei video con intelligenza artificiale risiede nella potenza di calcolo a consumo, e la potenza di calcolo a consumo è una questione di fatturazione prima ancora che di creatività. Quindi, se si intende pagare per l'IA al secondo, o essere pagati per crearla, bisogna chiedersi quale sistema di pagamento permetta di movimentare somme così piccole, così rapide e a livello globale. Al momento, la risposta onesta non è una carta di credito. Quanto tempo passerà prima che la risposta predefinita sia una stablecoin?