Sora AI: Mô hình chuyển đổi văn bản thành video của OpenAI, giải thích chi tiết.

Sora AI: Mô hình chuyển đổi văn bản thành video của OpenAI, giải thích chi tiết.

Trong khoảng một tháng, Sora AI là ứng dụng được tải xuống nhiều nhất ở Hoa Kỳ. Sau đó, OpenAI đã tắt nó đi. Ứng dụng cho phép bất cứ ai gõ một câu và nhận lại một phút video được đồng bộ hóa, mang tính điện ảnh đã đạt vị trí số một, thu hút hàng loạt video giả mạo người nổi tiếng và các bản nhái Studio Ghibli, rồi lặng lẽ đóng cửa vào tháng 4 năm 2026. Mọi người liên tục đặt câu hỏi hiển nhiên: làm thế nào mà một ứng dụng phổ biến đến vậy lại biến mất một cách bí ẩn như thế?

Câu trả lời ngắn gọn là tiền. Câu trả lời dài hơn sẽ hữu ích hơn, đặc biệt nếu bạn trả tiền cho các công cụ AI hoặc bán chúng. Giá trị thực sự của Sora AI chưa bao giờ nằm ở nguồn cấp dữ liệu mạng xã hội miễn phí. Nó nằm ở sức mạnh tính toán mà bạn thuê theo giây để tạo video. Sự khác biệt đó là toàn bộ câu chuyện, và nó dẫn đến một điểm mà hầu hết các bài viết đều bỏ qua: cách mọi người thực sự trả tiền cho những thứ này, và tại sao kênh thanh toán lại bắt đầu quan trọng như chính mô hình kinh doanh.

Sora AI là gì và mô hình video hoạt động như thế nào?

Sora AI là một mô hình chuyển đổi văn bản thành video được xây dựng bởi OpenAI. Bạn cung cấp cho nó một đoạn văn bản, và mô hình tạo video sẽ trả về một đoạn clip ngắn. Đó là toàn bộ ý tưởng đằng sau việc tạo video bằng AI. Về mặt kỹ thuật, nó là một bộ chuyển đổi khuếch tán, cùng một họ mô hình rộng lớn được sử dụng trong các công cụ xử lý hình ảnh AI hiện đại, nhưng được huấn luyện dựa trên video và thời gian.

OpenAI đã giới thiệu Sora vào tháng 2 năm 2024 với một vài đoạn video demo, sau đó phát hành phiên bản đầu tiên bên trong ChatGPT vào tháng 12 năm 2024. Sora phiên bản đầu tiên tạo ra các đoạn video dài khoảng một phút và, kỳ lạ thay, nó nắm bắt được cảm giác sơ bộ về không gian 3D và chuyển động của camera mà không cần được dạy một cách rõ ràng. Không ai lập trình hiệu ứng thị sai vào nó. Nó học được rằng việc di chuyển camera sẽ thay đổi những gì bạn nhìn thấy — giống như cách một đứa trẻ học — bằng cách xem đủ nhiều ví dụ.

Đó cũng là lý do tại sao kết quả đầu ra không đồng đều. Mô hình có thể tạo ra một cảnh đường phố chân thực, nhưng sau đó lại có cảnh một người đi xuyên qua tường, bởi vì nó chưa bao giờ học vật lý như những quy luật, mà chỉ học như những mô hình. Điều hữu ích cần nhớ khi một đoạn video trông hoàn hảo là: thứ đó không hề biết trọng lực là gì.

sora-ai

Hướng dẫn tạo video AI bằng Sora 2

Phiên bản gây sốt trên mạng là Sora 2, được phát hành vào ngày 30 tháng 9 năm 2025, cùng với ứng dụng iOS. Đây mới thực sự là bước nhảy vọt, và rất đáng để xem việc sáng tạo với nó trông như thế nào.

Âm thanh, vật lý và cảnh quay điện ảnh được đồng bộ hóa.

Sora 2 đã bổ sung âm thanh. Lời thoại, tiếng bước chân và tiếng động nền giờ đây được đồng bộ với hình ảnh thay vì là những đoạn âm thanh im lặng mà bạn phải tự thêm vào. Chuyển động chân thực là sự nâng cấp dễ thấy nhất, vì vậy các vật thể va chạm và rơi xuống theo cách khá tự nhiên. Mô hình cũng có thể ghép nhiều góc máy quay trong một khung hình, mang lại cho các đoạn phim ngắn cảm giác điện ảnh mà phiên bản đầu tiên thiếu. Đó là sự khác biệt giữa một tấm bưu thiếp chuyển động và một đoạn phim được dàn dựng công phu.

Vai diễn khách mời, phối lại và chỉnh sửa

Tính năng nổi bật nhất trên mạng xã hội là Cameo: tự quay video một lần, sau đó ghép hình ảnh của bạn vào bất kỳ cảnh nào được tạo sẵn. Chính điều đó, hơn cả chất lượng hình ảnh thô, đã giúp ứng dụng lan rộng. Bên cạnh đó là một bộ công cụ chỉnh sửa nhỏ. Remix cho phép bạn điều chỉnh một đoạn video hiện có với một gợi ý mới. Re-cut tạo lại một đoạn video duy nhất. Loop biến một đoạn video thành một đoạn lặp lại liền mạch, và Blend ghép hai video lại với nhau. Tất cả đều không yêu cầu kỹ năng chỉnh sửa, và đó chính là điểm mấu chốt.

Viết kịch bản theo yêu cầu: chuyển đổi văn bản và hình ảnh thành video.

Để có kết quả tốt, điều quan trọng là phải viết đúng nội dung yêu cầu. Mô hình này đánh giá cao sự cụ thể. "Một con chó" chỉ cho bạn âm thanh. "Một chú chó săn lông vàng ướt sũng đang rũ nước trong chuyển động chậm, được chiếu sáng bởi ánh nắng chiều muộn, chụp bằng ống kính 50mm" sẽ cho bạn một hình ảnh hữu ích. Hãy mô tả chủ thể, hành động, ánh sáng và máy ảnh. Bạn cũng có thể tải lên một hình ảnh và để Sora tạo hoạt ảnh cho nó, chế độ chuyển ảnh thành video biến một hình ảnh tĩnh thành vài giây chuyển động, giúp nó hoạt động như một loại trình tạo hình ảnh chuyển động. Phần quan trọng nhất là học cách viết yêu cầu giống như cách một đạo diễn viết ghi chú cảnh quay.

Theo mặc định, mỗi đoạn video đều có hình mờ hiển thị rõ ràng và siêu dữ liệu C2PA đánh dấu nó là sản phẩm do AI tạo ra. Cả hai đều quan trọng về sau.

Vì sao ứng dụng Sora AI bị ngừng hoạt động?

OpenAI đã thông báo về việc ngừng hoạt động vào ngày 24 tháng 3 năm 2026 và tắt ứng dụng vào ngày 26 tháng 4. Công nghệ đã thành công. Nhưng mô hình kinh doanh thì không.

Theo báo cáo, việc vận hành ứng dụng Sora ở quy mô người dùng thông thường tiêu tốn khoảng một triệu đô la mỗi ngày cho chi phí tính toán. Ngược lại, ứng dụng này chỉ thu về khoảng 1,4 triệu đô la trong suốt vòng đời của mình từ các giao dịch mua trong ứng dụng, theo TechCrunch . Lượng người dùng đạt đỉnh điểm gần một triệu người rồi giảm xuống dưới nửa triệu người chỉ trong vài tuần sau khi ra mắt, một đường cong điển hình của sự mới lạ. Một thỏa thuận cấp phép riêng của Disney, trị giá khoảng một tỷ đô la cho quyền sử dụng hơn 200 nhân vật, đã kết thúc khi ứng dụng ngừng hoạt động.

Ngày Chuyện gì đã xảy ra thế
Tháng 2 năm 2024 Sora đã công khai giới thiệu trước.
Tháng 12 năm 2024 Phiên bản đầu tiên được phát hành trên ChatGPT.
Ngày 30 tháng 9 năm 2025 Sora 2 và sự ra mắt ứng dụng iOS.
Ngày 24 tháng 3 năm 2026 Thông báo ngừng sản xuất
Ngày 26 tháng 4 năm 2026 Ứng dụng đã tắt

Tuy nhiên, OpenAI không từ bỏ công nghệ này, và điều đó thường bị bỏ qua. Khả năng này vẫn tồn tại trong ChatGPT và các sản phẩm dành cho doanh nghiệp, và mô hình Sora vẫn có thể truy cập được thông qua API dành cho các nhà phát triển. Điều mà OpenAI đã loại bỏ là ứng dụng xã hội miễn phí được xây dựng dựa trên Sora AI — cách thức tốn kém nhất và ít lợi nhuận nhất để cung cấp nó. Đối với bất kỳ ai bán dịch vụ AI, bài học rất rõ ràng: giá trị được tạo ra ở nơi mọi người trả tiền cho sản phẩm đầu ra, chứ không phải nơi họ lướt web miễn phí.

Chi phí sử dụng Sora AI: phí đăng ký, tín dụng, API

Tiền đổ vào Sora theo ba cách, và sự khác biệt giữa các cách này giải thích rất nhiều về cách thức hoạt động của trí tuệ nhân tạo trả phí nói chung.

Lối đi Những gì bạn nhận được Giá
ChatGPT Plus Sora trong cuộc trò chuyện, thế hệ tiêu chuẩn 20 đô la/tháng
ChatGPT Pro Giới hạn cao hơn, thời lượng dài hơn và video HD. 200 đô la/tháng
Gói tín dụng (gói miễn phí) Trả tiền cho mỗi video riêng lẻ Tùy thuộc vào từng gói sản phẩm.
API, sora-2 (720p) Tính phí theo từng giây video ~0,10 đô la/giây
API, sora-2-pro (1080p) Tính phí theo từng giây video Khoảng 0,30 đến 0,50 đô la Mỹ/giây

Hầu hết người dùng thông thường không bao giờ trả tiền trực tiếp. Sora được bán kèm với gói đăng ký ChatGPT, vì vậy nó tận dụng khoản phí 20 đô la hoặc 200 đô la mỗi tháng mà mọi người đã chi cho chatbot này. Việc bán kèm này rất quan trọng, bởi vì động lực thực sự của OpenAI là các gói đăng ký: khoảng 50 triệu người đăng ký trả phí, ước tính 25 tỷ đô la doanh thu định kỳ hàng năm và khoảng 900 triệu người dùng hoạt động hàng tuần. So với đó, 1,4 triệu đô la của ứng dụng Sora chỉ là một con số không đáng kể.

Điều thú vị ở đây là API. Ở đó, bạn không mua gói dịch vụ. Bạn trả tiền theo từng giây video được tạo ra, khoảng mười xu một giây ở độ phân giải 720p và gấp ba đến năm lần con số đó cho đầu ra chuyên nghiệp 1080p, theo tài liệu API của OpenAI (tính đến ngày 2026). Một đoạn video mười giây có giá thấp nhất là một đô la. Đây là hình thức tính toán theo mức sử dụng — giống như cách bạn trả tiền cho máy chủ đám mây hoặc điện. Bạn mua quyền sử dụng, chứ không phải mua giấy phép hay gói dịch vụ. Đối với nhà phát triển hoặc người sáng tạo sử dụng Sora với số lượng lớn, mức phí tính theo giây chính là sản phẩm thực sự, và nó chưa bao giờ biến mất.

Hãy nghĩ về ý nghĩa của đơn vị đo đó. Một studio xử lý hàng trăm clip mỗi ngày sẽ có hóa đơn tăng theo sản lượng, giống như hóa đơn điện nước. Một người làm video nghiệp dư chỉ làm một video mỗi tháng thì chỉ phải trả vài xu. Mô hình này áp dụng cho cả hai trường hợp vì giá cả gắn liền với sức mạnh tính toán, chứ không phải với số lượng người dùng. Đó là hình thức mà hầu hết các hệ thống tính phí AI chuyên nghiệp đang hướng tới, từ các mô hình ngôn ngữ đến các công cụ tạo ảnh: bạn bị tính phí cho những gì bạn sử dụng, được đo bằng token, giây hoặc megapixel. Các gói cước cố định hàng tháng là lớp vỏ bọc thân thiện. Việc tính phí dựa trên số lượng người dùng là động cơ bên dưới, và tôi cá rằng đó chính là nơi tạo ra doanh thu AI trong thập kỷ tới.

Sora 2 so với các phần mềm tạo video AI khác

Sora AI đã thu hút sự chú ý của giới truyền thông, nhưng nó không phải là trường hợp duy nhất, và thị trường xung quanh nó thực sự rất tiềm năng. Theo Fortune Business Insights , lĩnh vực tạo video bằng AI có giá trị khoảng 716 triệu đô la vào năm 2025 và đang hướng tới mức khoảng 847 triệu đô la vào năm 2021, tăng trưởng gần 19% mỗi năm. Runway , một đối thủ cạnh tranh, đã huy động được 315 triệu đô la vào đầu năm 2022 với mức định giá 5,3 tỷ đô la. Đây là một ngành công nghiệp nghiêm túc, chứ không phải chỉ là bản demo.

Dụng cụ Nhà sản xuất Âm thanh đồng bộ Truy cập Mô hình định giá
Sora 2 OpenAI Đúng ChatGPT, API Đăng ký + tính phí theo giây
Veo 3 Google Đúng Gemini, Trí tuệ nhân tạo Vertex Đăng ký + tính phí theo giây
Đường băng Đường băng Giới hạn Web, ứng dụng Tín dụng, đăng ký
Kling Kuaishou Đúng Web, ứng dụng Tín dụng, đăng ký

Bức tranh cạnh tranh khá tương đồng với chính Sora. Veo của Google tính phí thông qua các gói đăng ký Gemini và giá AI Vertex tính theo giây, nằm trong cùng phân khúc giá với Sora. Kling và Runway dựa vào các gói tín dụng, nơi bạn mua một khối lượng thế hệ trả trước và sử dụng hết. Nếu bỏ qua thương hiệu, bạn chủ yếu đang so sánh hai kiểu tính phí, tín dụng trả trước hoặc tính phí theo mức sử dụng, được gói gọn trong các mô hình đều thực hiện chức năng tương tự. Khi bạn chọn Sora thay vì Veo hoặc Kling, bạn đang chọn một hệ sinh thái và một mô hình thanh toán, chứ không phải một khả năng khác biệt hoàn toàn. Chất lượng có thể cải thiện đáng kể sau mỗi vài tháng. Nhưng cấu trúc giá cả thì không.

sora-ai

Thanh toán cho các công cụ video AI bằng stablecoin

Đây là lúc mà khía cạnh tiền điện tử không còn là điều khó hiểu nữa mà trở nên rõ ràng. Hãy xem lại cách các công cụ AI này tính phí: những khoản phí nhỏ, được tính thường xuyên, cho người dùng trên toàn thế giới. Đó là một vấn đề về thanh toán, và đó chính xác là vấn đề mà stablecoin giải quyết rất tốt.

Vì sao stablecoin phù hợp với mô hình tính phí AI theo mức sử dụng?

Một cuộc gọi API với giá mười xu mỗi giây là một khoản thanh toán nhỏ. Các mạng lưới thẻ tín dụng không thích các khoản thanh toán nhỏ, bởi vì phí cố định sẽ làm hao hụt đáng kể khoản phí dưới một đô la. Các gói đăng ký định kỳ xuyên biên giới còn làm tăng thêm chi phí chuyển đổi tiền tệ và tỷ lệ thanh toán thất bại. Stablecoin , các token được neo giá với đô la và thanh toán trên chuỗi khối, giải quyết được cả hai vấn đề này. Việc thanh toán rẻ, gần như tức thời và giống nhau cho dù người dùng ở Ohio hay Lagos. Điều này không còn là lý thuyết nữa. Stripe đã ra mắt thanh toán bằng stablecoin cho các gói đăng ký vào tháng 10 năm 2025, cho phép các doanh nghiệp lập hóa đơn USDC định kỳ giống như cách họ lập hóa đơn thẻ. Hệ thống cơ sở hạ tầng đang được xây dựng ngay bây giờ.

Thanh toán cho người sáng tạo và quyền truy cập toàn cầu

Nửa còn lại là việc rút tiền ra, chứ không chỉ là thu tiền vào. Video AI là một nền kinh tế của người sáng tạo, và người sáng tạo có mặt ở khắp mọi nơi, kể cả những nơi có hệ thống thanh toán thẻ yếu hoặc việc thanh toán mất cả tuần. Thanh toán cho người sáng tạo bằng stablecoin được chuyển đến trong vài phút, bằng đô la, bất kể hệ thống ngân hàng địa phương. Đối với một nền tảng thanh toán cho hàng ngàn người sáng tạo nhỏ mỗi tháng, chỉ riêng khoản tiết kiệm từ phí xử lý và chuyển đổi tiền tệ cũng có thể quyết định liệu toàn bộ mô hình có khả thi hay không. Quy mô đằng sau điều này không còn nhỏ nữa: vốn hóa thị trường stablecoin đã vượt quá 323 tỷ đô la vào năm 2013, và theo ước tính của Visa , stablecoin đã giao dịch khoảng 33 nghìn tỷ đô la tổng khối lượng vào năm 2025. Khi việc tính phí AI theo lượt sử dụng và thanh toán cho người sáng tạo trên toàn cầu đều hướng đến cùng một hệ thống, hệ thống đó bắt đầu trông giống cơ sở hạ tầng hơn là một thử nghiệm tiền điện tử. Một người bán muốn chấp nhận thanh toán bằng tiền điện tử cho một công cụ AI ngày nay có thể làm điều đó mà không cần thông qua bộ xử lý thẻ.

Rủi ro của Sora AI: deepfake, bản quyền, watermark

Chẳng có gì trong sạch cả. Hình mờ và thẻ C2PA của Sora AI được dùng để đánh dấu các đoạn video do AI tạo ra, nhưng các công cụ xóa hình mờ đã xuất hiện chỉ trong vòng một tuần sau khi ra mắt. Chế độ bản quyền mặc định là từ chối, chứ không phải chấp nhận, vì vậy Sora đã sao chép các nhân vật và phong cách được bảo hộ cho đến khi chủ sở hữu bản quyền phản đối. Cả Studio Ghibli và Square Enix đều yêu cầu gỡ bỏ. Một hình ảnh hoặc video do AI tạo ra trông giống thật và tự động xóa hình mờ của chính nó là một vấn đề mà ngành công nghiệp chưa giải quyết được, mà chỉ mới đặt tên cho nó.

Câu chuyện về Sora thực sự nói lên điều gì?

Ứng dụng Sora chết vì một lý do khá nhàm chán: chi phí vận hành cao hơn lợi nhuận kiếm được. Công nghệ chưa bao giờ là vấn đề. Bên dưới gói dịch vụ miễn phí là một mô hình tạo ra lợi nhuận thực sự ngay khi bạn tính phí theo từng giây. Giá trị bền vững của video AI nằm ở khả năng tính toán theo từng giây, và tính toán theo từng giây là vấn đề về thanh toán trước khi là vấn đề sáng tạo. Vì vậy, nếu bạn định trả tiền cho AI theo từng giây, hoặc được trả tiền để tạo ra nó, hãy tự hỏi tuyến đường nào có thể vận chuyển những khoản tiền nhỏ như vậy, nhanh như vậy, trên phạm vi toàn cầu. Hiện tại, câu trả lời trung thực không phải là thẻ tín dụng. Bao lâu nữa thì câu trả lời mặc định sẽ là một loại tiền ổn định (stablecoin)?

Bất kỳ câu hỏi?

Ứng dụng Sora độc lập đã bị ngừng hoạt động vào tháng 4 năm 2026 vì chi phí vận hành mỗi ngày lên tới khoảng 1 triệu đô la, trong khi lợi nhuận thu về chỉ khoảng 1,4 triệu đô la trong suốt vòng đời của nó. OpenAI đã giữ lại mô hình nền tảng bên trong ChatGPT và API của nó, chỉ loại bỏ ứng dụng mạng xã hội miễn phí không sinh lời.

Thực ra không hẳn vậy. Quyền truy cập thông thường được tích hợp sẵn trong các gói ChatGPT trả phí bắt đầu từ 20 đô la một tháng, và người dùng miễn phí phải mua tín dụng để tạo video riêng lẻ. Các trang web bên thứ ba quảng cáo tính năng tạo video Sora "miễn phí", nhưng chúng hoạt động dựa trên hệ thống tín dụng và giới hạn sử dụng riêng của họ.

Ứng dụng dành cho người dùng cuối đã biến mất, nhưng mô hình thì vẫn còn. Khả năng của Sora vẫn được giữ nguyên trong ChatGPT dành cho người dùng trả phí, và các nhà phát triển có thể truy cập mô hình thông qua API của OpenAI. Vì vậy, công chúng vẫn có thể tạo video Sora, chỉ là không còn thông qua ứng dụng độc lập gây sốt ra mắt năm 2025 nữa.

Thông qua ChatGPT, giá là 20 đô la một tháng cho gói Plus hoặc 200 đô la cho gói Pro. Qua API, bạn trả tiền theo từng giây video: khoảng 0,10 đô la mỗi giây ở độ phân giải 720p và khoảng 0,30 đến 0,50 đô la mỗi giây cho đầu ra 1080p chuyên nghiệp. Một đoạn video mười giây có giá từ một đô la trở lên.

Điều đó phụ thuộc vào nguồn gốc. Điều khoản của OpenAI cho phép một số mục đích sử dụng thương mại, nhưng rủi ro lớn hơn là bản quyền: Sora có thể sao chép các nhân vật và phong cách được bảo hộ, điều mà một số studio đã phản đối. Nhiều phần mềm bên thứ ba hỗ trợ Sora cấp phép thương mại, nhưng các vấn đề về quyền sở hữu trí tuệ vẫn áp dụng đối với những gì mô hình tạo ra.

Câu trả lời là có, ngày càng nhiều. Stripe đã triển khai hình thức thanh toán thuê bao bằng stablecoin vào cuối năm 2025, và các cổng thanh toán tiền điện tử cho phép doanh nghiệp chấp nhận stablecoin trực tiếp cho các dịch vụ phần mềm và trí tuệ nhân tạo. Đối với việc thanh toán AI xuyên biên giới theo mức sử dụng, stablecoin phù hợp hơn thẻ tín dụng, vốn gặp khó khăn với các khoản phí nhỏ và quốc tế.

Ready to Get Started?

Create an account and start accepting payments – no contracts or KYC required. Or, contact us to design a custom package for your business.

Make first step

Always know what you pay

Integrated per-transaction pricing with no hidden fees

Start your integration

Set up Plisio swiftly in just 10 minutes.