Sora AI: O modelo de texto para vídeo da OpenAI, explicado.
Por cerca de um mês, o Sora AI foi o aplicativo mais baixado nos Estados Unidos. Então, a OpenAI o desativou. O aplicativo que permitia a qualquer pessoa digitar uma frase e receber um minuto de vídeo sincronizado e cinematográfico chegou ao primeiro lugar, atraiu uma enxurrada de deepfakes de celebridades e imitações do Studio Ghibli, e então foi silenciosamente desativado em abril de 2026. As pessoas continuavam fazendo a pergunta óbvia: como algo tão popular simplesmente desaparece?
A resposta curta é dinheiro. A resposta mais longa é mais útil, especialmente se você paga por ferramentas de IA ou as vende. O valor da IA da Sora nunca esteve realmente no feed social gratuito. Ele residia no poder computacional que você aluga por segundo para gerar vídeos. Essa distinção é toda a história e nos leva a um ponto que a maioria dos artigos ignora: como as pessoas realmente pagam por isso e por que o sistema de pagamento está começando a importar tanto quanto o próprio modelo.
O que é a IA Sora e como funciona o modelo de vídeo.
Sora AI é um modelo de conversão de texto em vídeo desenvolvido pela OpenAI. Você fornece um texto como entrada e o modelo de geração de vídeo retorna um pequeno clipe. Essa é a ideia por trás da geração de vídeo por IA. Internamente, trata-se de um transformador de difusão, a mesma família que alimenta as ferramentas modernas de IA para processamento de imagens, porém treinado com vídeo e tempo.
A OpenAI apresentou uma prévia do Sora em fevereiro de 2024 com alguns vídeos de demonstração e, em seguida, lançou uma primeira versão dentro do ChatGPT em dezembro de 2024. O Sora inicial gerava vídeos de até aproximadamente um minuto de duração e, curiosamente, adquiria uma noção básica de espaço 3D e movimento de câmera sem que isso lhe fosse explicitamente ensinado. Ninguém programou paralaxe nele. Ele aprendeu que mover a câmera altera o que se vê — da mesma forma que uma criança aprende — assistindo a exemplos suficientes.
É por isso também que o resultado era irregular. O modelo conseguia renderizar uma cena de rua convincente e, em seguida, mostrar uma pessoa atravessando uma parede, porque nunca aprendeu física como regras, apenas como padrões. É útil lembrar disso quando um vídeo parece perfeito: o modelo não tem ideia do que é gravidade.

Como criar vídeos com IA usando o Sora 2
A versão que viralizou foi a Sora 2, lançada em 30 de setembro de 2025, juntamente com o aplicativo para iOS. Esse foi o verdadeiro salto, e vale a pena ver como era criar conteúdo com ela na prática.
Sincronização de áudio, física e tomadas cinematográficas.
Sora 2 adicionou som. Diálogos, passos e ruídos de fundo agora chegavam sincronizados com a imagem, em vez de serem clipes silenciosos que você tinha que sincronizar manualmente. O movimento realista foi a melhoria visível, de modo que os objetos colidiam e caíam de maneiras que, em sua maioria, se mantinham convincentes. O modelo também podia combinar vários ângulos de câmera em uma única geração, dando aos clipes curtos uma sensação cinematográfica que faltava na primeira versão. Era a diferença entre um cartão-postal animado e algo que parecia um corte de filme.
Participações especiais, remixes e edições
O principal recurso social era o "cameo": grave-se uma vez e insira sua imagem em qualquer cena gerada. Isso, mais do que a qualidade bruta, foi o que fez o aplicativo se popularizar. Além disso, havia um pequeno conjunto de ferramentas de edição. O recurso "Remix" permitia ajustar um clipe existente com um novo comando. O "Re-cut" regenerava um único segmento. O "Loop" transformava um clipe em uma repetição contínua e o "Blend" mesclava dois vídeos. Nada disso exigia habilidades de edição, que era exatamente a proposta.
Elaboração de um prompt: texto e conversão de imagem em vídeo
Para obter um bom resultado, tudo dependia da descrição do texto. O modelo valoriza detalhes específicos. "Um cachorro" fornece ruído. "Um golden retriever molhado se sacudindo em câmera lenta, com a luz do sol do final da tarde iluminando o fundo, filmado com uma lente de 50 mm" fornece algo útil. Descreva o assunto, a ação, a luz e a câmera. Você também pode enviar uma imagem e pedir para o Sora animá-la, um modo de conversão de imagem em vídeo que transforma uma imagem estática em alguns segundos de movimento, funcionando também como uma espécie de gerador de imagens em movimento. A maior parte da habilidade consistia em aprender a escrever descrições da mesma forma que um diretor escreve anotações de cena.
Por padrão, cada clipe continha uma marca d'água visível e metadados C2PA indicando que havia sido gerado por IA. Ambos os elementos seriam importantes posteriormente.
Por que o aplicativo Sora AI foi desativado?
A OpenAI anunciou o encerramento das atividades em 24 de março de 2026 e desativou o aplicativo em 26 de abril. A tecnologia funcionou. O negócio, não.
Segundo relatos, executar o Sora em escala comercial custava cerca de um milhão de dólares por dia em poder computacional. Em contrapartida, o aplicativo arrecadou aproximadamente US$ 1,4 milhão em compras dentro do app durante toda a sua existência, conforme relatado pelo TechCrunch . A base de usuários atingiu um pico próximo a um milhão e, em seguida, caiu para menos de meio milhão poucas semanas após o lançamento, uma curva típica de aplicativos inovadores. Um contrato de licenciamento separado com a Disney, avaliado em cerca de um bilhão de dólares pelos direitos de uso de mais de 200 personagens, terminou junto com o aplicativo.
| Data | O que aconteceu |
|---|---|
| Fevereiro de 2024 | Sora teve uma prévia pública. |
| Dezembro de 2024 | Primeira versão lançada dentro do ChatGPT |
| 30 de setembro de 2025 | Sora 2 e o lançamento do aplicativo para iOS |
| 24 de março de 2026 | Anúncio de descontinuação |
| 26 de abril de 2026 | Aplicativo encerrado |
A OpenAI não abandonou a tecnologia, e essa parte tende a ser esquecida. A funcionalidade continua presente no ChatGPT e em produtos corporativos, e o próprio modelo Sora permaneceu acessível por meio da API para desenvolvedores. O que a OpenAI acabou foi com o aplicativo social gratuito baseado na IA Sora — a forma mais cara e menos lucrativa de oferecê-la. Para quem vende serviços de IA, a lição é clara: o valor se acumula onde as pessoas pagam pelo resultado, não onde elas navegam gratuitamente.
Custo do Sora AI: assinaturas, créditos, API
O dinheiro chegou a Sora de três maneiras diferentes, e essas diferenças explicam muito sobre como a IA remunerada funciona em geral.
| Rota de acesso | O que você recebe | Preço |
|---|---|---|
| ChatGPT Plus | Sora no chat, gerações padrão | US$ 20 por mês |
| ChatGPT Pro | Limites mais altos, vídeos mais longos e em HD. | US$ 200 por mês |
| Pacotes de créditos (nível gratuito) | Pagamento por vídeo individual | Varia conforme a embalagem. |
| API, sora-2 (720p) | Cobrado por segundo de vídeo | ~$0,10 / segundo |
| API, sora-2-pro (1080p) | Cobrado por segundo de vídeo | Aproximadamente US$ 0,30 a US$ 0,50 por segundo |
A maioria dos usuários casuais nunca pagou diretamente. O Sora vinha incluído em uma assinatura do ChatGPT, então aproveitava os mesmos US$ 20 ou US$ 200 mensais que as pessoas já gastavam com o chatbot. Essa inclusão é importante, porque o verdadeiro motor da OpenAI são as assinaturas: cerca de 50 milhões de assinantes pagantes, uma receita recorrente anual estimada em US$ 25 bilhões e aproximadamente 900 milhões de usuários ativos semanais. Comparado a isso, os US$ 1,4 milhão do aplicativo Sora eram insignificantes.
O aspecto interessante é a API. Nela, você não comprava um plano. O pagamento era feito por segundo de vídeo gerado, cerca de dez centavos de dólar por segundo em 720p e de três a cinco vezes mais para saída profissional em 1080p, conforme a documentação da API da OpenAI (em 2026). Um clipe de dez segundos custava um dólar no plano mais básico. Trata-se de computação medida — da mesma forma que você paga por servidores em nuvem ou eletricidade. Você compra o uso, não uma licença ou um plano. Para um desenvolvedor ou criador que utiliza o Sora em grande escala, a cobrança por segundo é o produto em si, e essa prática nunca desapareceu.
Pense no que esse medidor implica. Um estúdio que renderiza cem vídeos por dia tem uma conta que aumenta proporcionalmente à produção, como um serviço público. Um amador que faz um vídeo por mês paga centavos. O mesmo modelo serve para ambos, porque o preço está atrelado ao poder computacional, não à licença. Esse é o formato para o qual quase toda a cobrança séria em IA está convergindo, de modelos de linguagem a geradores de imagens: você paga pelo que consome, medido em tokens, segundos ou megapixels. Planos mensais fixos são a embalagem amigável. O uso medido é o motor por trás disso, e eu apostaria que é aí que reside a receita da IA na próxima década.
Sora 2 vs outros geradores de vídeo com IA
A Sora AI ganhou as manchetes, mas nunca esteve sozinha, e o mercado ao seu redor movimenta muito dinheiro. O setor de geradores de vídeo com IA valia cerca de US$ 716 milhões em 2025 e está caminhando para aproximadamente US$ 847 milhões em 2019, crescendo cerca de 19% ao ano, de acordo com a Fortune Business Insights . A Runway , uma concorrente, levantou US$ 315 milhões em uma rodada de investimentos no início de 2019, atingindo uma avaliação de US$ 5,3 bilhões. Este é um setor sério, não uma mera demonstração.
| Ferramenta | Fabricante | Áudio sincronizado | Acesso | Modelo de preços |
|---|---|---|---|---|
| Sora 2 | OpenAI | Sim | ChatGPT, API | Assinatura + por segundo |
| Veo 3 | Sim | Gemini, Vertex AI | Assinatura + por segundo | |
| Pista | Pista | Limitado | Web, aplicativo | Créditos, assinatura |
| Kling | Kuaishou | Sim | Web, aplicativo | Créditos, assinatura |
O cenário competitivo é bastante semelhante ao da Sora. O Veo, do Google, cobra por meio de assinaturas Gemini e preços por segundo do Vertex AI, que se situam na mesma faixa de preço que a Sora. Kling e Runway se baseiam em pacotes de créditos, nos quais você compra um bloco de gerações antecipadamente e o utiliza. Removendo as marcas, você está basicamente comparando dois estilos de cobrança: créditos pré-pagos ou pagamento por uso, modelos que fazem praticamente a mesma coisa. Ao escolher a Sora em vez do Veo ou do Kling, você está escolhendo um ecossistema e um modelo de pagamento, não uma capacidade radicalmente diferente. A qualidade dá um salto a cada poucos meses. A estrutura de preços, não.

Pagamento por ferramentas de vídeo com IA usando stablecoins
É aqui que a relação com as criptomoedas deixa de ser forçada e se torna óbvia. Observe novamente como essas ferramentas de IA cobram: pequenos valores, cobrados com frequência, para usuários em todo o mundo. Esse é um problema de pagamentos, e por acaso é exatamente o problema que as stablecoins resolvem bem.
Por que as stablecoins se encaixam na cobrança de IA por consumo?
Uma chamada de API de dez centavos por segundo é um micropagamento. As redes de cartões detestam micropagamentos, porque as taxas fixas corroem o valor de uma cobrança inferior a um dólar. Assinaturas recorrentes internacionais adicionam a isso a conversão de moeda e o problema das falhas de pagamento. As stablecoins , tokens atrelados ao dólar com liquidação on-chain, contornam ambos os problemas. A liquidação é barata, quase instantânea e a mesma, independentemente de o usuário estar em Ohio ou Lagos. Isso não é mais teórico. A Stripe lançou pagamentos com stablecoins para assinaturas em outubro de 2025, permitindo que empresas cobrem USDC recorrente da mesma forma que cobram com cartão. A infraestrutura está sendo construída agora.
Pagamentos aos criadores e acesso global
A outra metade da questão é a distribuição de dinheiro, não apenas a sua entrada. Vídeos com IA são uma economia de criadores, e os criadores estão em todos os lugares, inclusive em locais onde as redes de cartões são frágeis ou os pagamentos demoram uma semana. Pagar um criador em stablecoins é um processo que chega em minutos, em dólares, independentemente do sistema bancário local. Para uma plataforma que paga milhares de pequenos criadores todos os meses, a economia com taxas de processamento e conversão de moeda por si só pode determinar a viabilidade de todo o modelo. A escala por trás disso não é mais pequena: o valor de mercado das stablecoins ultrapassou US$ 323 bilhões em 2013, e o volume bruto movimentado por elas deve chegar a US$ 33 trilhões em 2025, segundo estimativa da Visa . Quando a cobrança por uso de IA e os pagamentos globais aos criadores convergem para a mesma infraestrutura, essa infraestrutura começa a parecer menos um experimento com criptomoedas e mais uma infraestrutura de fato. Um comerciante que deseja aceitar pagamentos em criptomoedas por uma ferramenta de IA hoje pode fazê-lo sem precisar de um processador de cartões.
Riscos da IA Sora: deepfakes, direitos autorais, marcas d'água
Nada disso é limpo. A marca d'água e as tags C2PA da Sora AI tinham como objetivo sinalizar clipes gerados por IA, mas ferramentas de remoção de marca d'água surgiram em menos de uma semana após o lançamento. A configuração padrão de direitos autorais era de exclusão (opt-out), e não de inclusão (opt-in), então a Sora reproduziu personagens e estilos protegidos até que os detentores dos direitos se opusessem. Tanto o Studio Ghibli quanto a Square Enix exigiram a remoção. Uma imagem ou vídeo gerado por IA que parece real e remove sua própria marca d'água é um problema que a indústria não resolveu, apenas rotulou.
O que a história de Sora realmente te conta
O aplicativo Sora morreu por um motivo banal: o custo de operação era maior do que a receita gerada. A tecnologia nunca foi o problema. Por trás da transmissão gratuita, havia um modelo que gera lucro real no momento em que se cobra por segundo. O valor duradouro em vídeos com IA reside na computação medida, e computação medida é uma questão de faturamento antes de ser uma questão criativa. Portanto, se você vai pagar por IA por segundo, ou ser pago para criá-la, pergunte-se qual meio de transporte movimenta dólares tão pequenos, tão rápidos e em escala global. No momento, a resposta honesta não é um cartão. Quanto tempo até que a resposta padrão seja uma stablecoin?