Sora AI: Explicación del modelo de conversión de texto a vídeo de OpenAI
Durante aproximadamente un mes, Sora AI fue la aplicación más descargada en Estados Unidos. Luego, OpenAI la desactivó. La aplicación que permitía a cualquiera escribir una frase y obtener un minuto de vídeo cinematográfico sincronizado alcanzó el número uno, generó una avalancha de deepfakes de famosos e imitaciones de Studio Ghibli, y finalmente cerró discretamente en abril de 2026. La gente seguía haciéndose la pregunta obvia: ¿cómo es posible que algo tan popular desaparezca así sin más?
La respuesta corta es el dinero. La respuesta más larga es más útil, sobre todo si pagas por herramientas de IA o las vendes. El valor de Sora AI nunca residió realmente en el feed social gratuito, sino en la capacidad de procesamiento que se alquila por segundo para generar vídeos. Esa distinción es clave y nos lleva a un punto que la mayoría de los análisis pasan por alto: cómo se paga realmente por estas herramientas y por qué el sistema de pago está empezando a ser tan importante como el modelo en sí.
Qué es Sora AI y cómo funciona el modelo de vídeo.
Sora AI es un modelo de conversión de texto a vídeo desarrollado por OpenAI. Se le proporciona un texto y el modelo de generación de vídeo devuelve un breve clip. Esa es la idea principal detrás de la generación de vídeo mediante IA. En esencia, se trata de un transformador de difusión, de la misma familia que impulsa las herramientas modernas de IA para imágenes, pero entrenado con vídeo y tiempo.
OpenAI presentó una vista previa de Sora en febrero de 2024 con algunos clips de demostración, y luego lanzó una primera versión integrada en ChatGPT en diciembre de 2024. Las primeras versiones de Sora generaban clips de hasta aproximadamente un minuto de duración y, curiosamente, captaban una noción básica del espacio 3D y el movimiento de la cámara sin haber recibido ninguna instrucción explícita. Nadie le programó el paralaje. Aprendió que mover la cámara cambia lo que se ve —de la misma manera que lo aprende un niño— observando suficientes ejemplos.
Esa es también la razón por la que el resultado fue irregular. El modelo podía renderizar una escena callejera creíble y luego mostrar a una persona atravesando una pared, porque nunca aprendió las leyes de la física como reglas, sino solo como patrones. Es útil recordarlo cuando un vídeo parece perfecto: el sistema no tiene ni idea de lo que es la gravedad.

Cómo crear vídeos con IA usando Sora 2
La versión que se hizo viral fue Sora 2, lanzada el 30 de septiembre de 2025 junto con la aplicación para iOS. Este fue el verdadero salto, y vale la pena ver cómo era crear con ella.
Audio, física y tomas cinematográficas sincronizadas.
Sora 2 incorporó sonido. Los diálogos, los pasos y el ruido de fondo ahora se sincronizaban con la imagen, en lugar de ser clips mudos que había que añadir manualmente. La mejora visible fue el movimiento realista, por lo que los objetos chocaban y caían de forma bastante natural. El modelo también podía combinar varios ángulos de cámara en una sola generación, lo que daba a los clips cortos un toque cinematográfico del que carecía la primera versión. Era la diferencia entre una postal animada y algo que parecía un montaje cinematográfico.
Cameos, remezclas y edición
La función social estrella era Cameo: grábate una vez y luego inserta tu imagen en cualquier escena generada. Eso, más que la calidad original, fue lo que hizo que la aplicación se popularizara. Además, contaba con un pequeño kit de edición. Remix te permitía ajustar un clip existente con una nueva sugerencia. Re-cut regeneraba un segmento. Loop convertía un clip en una repetición limpia, y Blend fusionaba dos vídeos. Nada de esto requería conocimientos de edición, que era precisamente la idea.
Redacción de una consigna: texto e imagen a vídeo
Para obtener un buen resultado, la clave estaba en la descripción del texto. El modelo premia la especificidad. "Un perro" genera ruido. "Un golden retriever mojado sacudiéndose el agua a cámara lenta, a contraluz por el sol de la tarde, filmado con un objetivo de 50 mm" genera algo útil. Describe el sujeto, la acción, la luz y la cámara. También podías subir una imagen y dejar que Sora la animara, en un modo de conversión de imagen a vídeo que transformaba una imagen fija en unos segundos de movimiento, funcionando así como una especie de generador de imágenes en movimiento. La mayor parte del trabajo consistía en aprender a escribir las descripciones como un director escribe las notas de toma.
Por defecto, cada clip llevaba una marca de agua visible y metadatos C2PA que lo identificaban como generado por IA. Ambos datos resultaron importantes más adelante.
¿Por qué se cerró la aplicación Sora AI?
OpenAI anunció su cese de operaciones el 24 de marzo de 2026 y desactivó la aplicación el 26 de abril. La tecnología funcionó. El negocio, no.
Según se informa, ejecutar Sora a escala de consumidor costaba alrededor de un millón de dólares al día en computación. En contraste, la aplicación generó aproximadamente 1,4 millones de dólares en compras dentro de la aplicación, según informó TechCrunch . La base de usuarios alcanzó un pico cercano al millón y luego cayó por debajo del medio millón a las pocas semanas de su lanzamiento, una curva típica de las aplicaciones novedosas. Un acuerdo de licencia independiente con Disney, valorado en unos mil millones de dólares por los derechos de uso de más de 200 personajes, finalizó cuando la aplicación dejó de funcionar.
| Fecha | Qué pasó |
|---|---|
| Febrero de 2024 | Sora se presentó públicamente |
| Diciembre de 2024 | Primera versión publicada dentro de ChatGPT |
| 30 de septiembre de 2025 | Sora 2 y el lanzamiento de la aplicación para iOS |
| 24 de marzo de 2026 | Anuncio de descontinuación |
| 26 de abril de 2026 | La aplicación se cerró |
OpenAI no abandonó la tecnología, aunque ese aspecto suele olvidarse. La funcionalidad sigue presente en ChatGPT y en productos empresariales, y el modelo Sora se mantuvo accesible para desarrolladores a través de su API. Lo que OpenAI eliminó fue la aplicación social gratuita basada en Sora AI, la forma más costosa y menos rentable de ofrecerla. Para quienes venden servicios de IA, la lección es clara: el valor se genera donde se paga por los resultados, no donde se navega gratis.
Coste de Sora AI: suscripciones, créditos, API
El dinero llegó a Sora de tres maneras, y las diferencias explican mucho sobre cómo funciona la IA de pago en general.
| Ruta de acceso | Lo que obtienes | Precio |
|---|---|---|
| ChatGPT Plus | Sora en el chat, generaciones estándar | $20 al mes |
| ChatGPT Pro | Límites más altos, clips más largos y en HD. | $200 al mes |
| Paquetes de créditos (nivel gratuito) | Pago por vídeo individual | Varía según el paquete. |
| API, sora-2 (720p) | Facturación por segundo de vídeo | ~$0,10 / segundo |
| API, sora-2-pro (1080p) | Se factura por segundo de vídeo. | ~$0,30 a $0,50 por segundo |
La mayoría de los usuarios ocasionales nunca pagaron directamente. Sora venía incluida con una suscripción a ChatGPT, por lo que se beneficiaba de los mismos 20 o 200 dólares mensuales que la gente ya gastaba en el chatbot. Esta inclusión es importante, porque el verdadero motor de OpenAI son las suscripciones: alrededor de 50 millones de suscriptores de pago, unos 25.000 millones de dólares en ingresos recurrentes anuales y aproximadamente 900 millones de usuarios activos semanales. En comparación, los 1,4 millones de dólares de la aplicación Sora eran una cifra insignificante.
El nivel interesante es la API. Allí, no se compraba un plan. Se pagaba por segundo de vídeo generado, aproximadamente diez centavos por segundo a 720p y de tres a cinco veces más para la salida profesional a 1080p, según la documentación de la API de OpenAI (a fecha de 2026). Un clip de diez segundos costaba un dólar en el extremo inferior. Esto es computación medida, de la misma manera que se paga por los servidores en la nube o la electricidad. Se compra el uso, no una licencia ni un plan. Para un desarrollador o creador que utiliza Sora a gran escala, el contador por segundo es el producto real, y nunca desapareció.
Piensa en lo que implica ese contador. Un estudio que renderiza cien clips al día tiene una factura que aumenta con la producción, como una compañía eléctrica. Un aficionado que crea un vídeo al mes paga unos céntimos. El mismo modelo sirve para ambos porque el precio se basa en la capacidad de procesamiento, no en el uso del equipo. Esa es la forma en que casi toda la facturación de IA seria está convergiendo, desde modelos de lenguaje hasta generadores de imágenes: se cobra por lo que se consume, medido en tokens, segundos o megapíxeles. Los planes mensuales de tarifa plana son la forma más sencilla de presentación. El consumo medido es el motor subyacente, y apostaría a que ahí es donde reside realmente el futuro de los ingresos de la IA en la próxima década.
Sora 2 frente a otros generadores de vídeo con IA
Sora AI acaparó los titulares, pero nunca estuvo sola, y el mercado que la rodea mueve mucho dinero. El sector de los generadores de vídeo con IA valía unos 716 millones de dólares en 2025 y se encamina a alcanzar los 847 millones de dólares en 2019, con un crecimiento cercano al 19% anual, según Fortune Business Insights . Runway , una empresa rival, recaudó 315 millones de dólares en una ronda de financiación a principios de 2020, con una valoración de 5300 millones de dólares. Se trata de una industria seria, no de una demostración.
| Herramienta | Fabricante | Audio sincronizado | Acceso | Modelo de precios |
|---|---|---|---|---|
| Sora 2 | OpenAI | Sí | ChatGPT, API | Suscripción + por segundo |
| Veo 3 | Sí | Géminis, Vertex AI | Suscripción + por segundo | |
| Pista | Pista | Limitado | Web, aplicación | Créditos, suscripción |
| Kling | Kuaishou | Sí | Web, aplicación | Créditos, suscripción |
El panorama competitivo es similar al de Sora. Veo de Google factura mediante suscripciones Gemini y precios por segundo de Vertex AI que se sitúan en un rango similar al de Sora. Kling y Runway se basan en paquetes de créditos, donde se compra un bloque de generaciones por adelantado y se consume. Si dejamos de lado la marca, básicamente comparamos dos estilos de facturación: créditos prepago o pago por uso, basados en modelos que ofrecen prácticamente la misma funcionalidad. Al elegir Sora en lugar de Veo o Kling, se elige un ecosistema y un modelo de pago, no una funcionalidad radicalmente diferente. La calidad mejora notablemente cada pocos meses. La estructura de precios, no.

Pagar por herramientas de vídeo con IA utilizando stablecoins
Aquí es donde la conexión con las criptomonedas deja de ser una idea descabellada y se vuelve evidente. Observemos de nuevo cómo cobran estas herramientas de IA: pequeñas cantidades, cobradas con frecuencia, a usuarios de todo el mundo. Ese es un problema de pagos, y resulta ser precisamente el problema que las stablecoins resuelven con eficacia.
Por qué las stablecoins son adecuadas para la facturación por consumo de IA
Una llamada a la API de diez centavos por segundo es un micropago. Las redes de tarjetas rechazan los micropagos, ya que las comisiones fijas consumen rápidamente cualquier cargo inferior a un dólar. Las suscripciones recurrentes transfronterizas añaden la conversión de divisas y la pérdida de clientes por pagos fallidos. Las stablecoins , tokens vinculados al dólar que se liquidan en la cadena de bloques, evitan ambos problemas. La liquidación es económica, casi instantánea y la misma tanto si el usuario se encuentra en Ohio como en Lagos. Esto ya no es una teoría. Stripe lanzó los pagos con stablecoins para suscripciones en octubre de 2025, permitiendo a las empresas facturar USDC recurrentes de la misma manera que facturan a las tarjetas. La infraestructura ya se está implementando.
Pagos a creadores y acceso global
La otra mitad consiste en generar ingresos, no solo ingresos. El vídeo con IA es una economía de creadores, y estos se encuentran en todas partes, incluso en lugares donde las redes de tarjetas son débiles o los pagos tardan una semana. Pagar a un creador con stablecoins se realiza en minutos, en dólares, independientemente de la banca local. Para una plataforma que paga a miles de pequeños creadores cada mes, el ahorro en comisiones de procesamiento y conversión de divisas por sí solo puede determinar la viabilidad de todo el modelo. La magnitud de esto ya no es pequeña: la capitalización de mercado de las stablecoins superó los 323 mil millones de dólares en 2025, y se estima que en 2025 el volumen bruto de stablecoins alcanzó los 33 billones de dólares, según Visa . Cuando la facturación de IA por consumo y los pagos globales a los creadores apuntan a la misma red, esta empieza a parecerse menos a un experimento con criptomonedas y más a una infraestructura. Un comerciante que quiera aceptar pagos con criptomonedas para una herramienta de IA hoy puede hacerlo sin necesidad de un procesador de tarjetas.
Riesgos de Sora AI: deepfakes, derechos de autor, marcas de agua.
Nada de esto es transparente. La marca de agua y las etiquetas C2PA de Sora AI estaban diseñadas para identificar los clips generados por IA, pero las herramientas para eliminar la marca de agua aparecieron apenas una semana después del lanzamiento. La configuración predeterminada de derechos de autor era de exclusión voluntaria, no de inclusión voluntaria, por lo que Sora reprodujo personajes y estilos protegidos hasta que los titulares de los derechos se opusieron. Tanto Studio Ghibli como Square Enix exigieron su eliminación. Una imagen o video generado por IA que parece real y elimina su propia marca de agua es un problema que la industria no ha resuelto, solo ha identificado.
Lo que realmente te cuenta la historia de Sora
La aplicación Sora fracasó por una razón simple: costaba más mantenerla que generar ingresos. La tecnología nunca fue el problema. Detrás del contenido gratuito se escondía un modelo que generaba dinero real en el momento en que se cobraba por segundo. El valor duradero del vídeo con IA reside en la computación medida, y la computación medida es una cuestión de facturación antes que de creatividad. Así que, si vas a pagar por la IA por segundo, o a cobrar por crearla, pregúntate qué sistema permite mover cantidades tan pequeñas de dinero, tan rápido y a nivel global. Ahora mismo, la respuesta honesta no es una tarjeta. ¿Cuánto tardará la respuesta por defecto en ser una criptomoneda estable?