AI Khuếch tán không ổn định: Bản phân nhánh Khuếch tán ổn định không kiểm duyệt (NSFW)
Nếu bạn đã tìm kiếm "Trí tuệ nhân tạo khuếch tán không ổn định" trong năm qua, có lẽ bạn đã gặp phải rất nhiều trang web mâu thuẫn. Một số mô tả một cộng đồng Discord đã tăng vọt từ 50.000 thành viên vào tháng 11 năm 2022 lên khoảng 97.000 vào tháng 12 và sau đó lên hơn 300.000 theo các trang web bên thứ ba vào năm 2025. Những trang khác lại mô tả một ứng dụng web trả phí hiện đại với gói miễn phí và bốn mô hình được đặt tên. Điều gây khó hiểu là cả hai đều có thật, cả hai đều có cùng tên gọi và cả hai đều bắt nguồn từ cùng một ý tưởng: lấy Trí tuệ nhân tạo khuếch tán ổn định, loại bỏ lớp bảo vệ, và để internet tự tạo ra bất cứ thứ gì nó muốn.
Hướng dẫn này sẽ làm sáng tỏ hai khái niệm đó. Chúng tôi sẽ đề cập đến Unstable Diffusion AI thực sự là gì vào năm 2026, mối liên hệ của nó với Stable Diffusion từ Stability AI, câu chuyện về lệnh cấm trên Kickstarter vào tháng 12 năm 2022, danh sách các mô hình, giá cả, những câu hỏi đạo đức vẫn còn bỏ ngỏ và các giải pháp thay thế đã vượt trội hơn nó. Mục tiêu là cung cấp một lời giải thích mà người ngoài cuộc tò mò có thể đọc một lần và hiểu được, chứ không phải một bài viết thổi phồng.
Trí tuệ nhân tạo khuếch tán không ổn định thực sự là gì vào năm 2026?
Cái tên "Unstable Diffusion" (Lan tỏa không ổn định) bao hàm một vài khái niệm chồng chéo, và mọi người thường xuyên nhầm lẫn chúng. Nguồn gốc của nó là một cộng đồng bắt đầu từ một chủ đề trên Reddit vào tháng 8 năm 2022 và gần như ngay lập tức chuyển sang Discord, nơi nó trở thành trung tâm cho các kết quả đầu ra của Stable Diffusion không bị kiểm duyệt và các trọng số được tinh chỉnh. Những người đại diện công khai của dự án là CEO Arman Chaudhry và đồng quản trị AshleyEvelyn, làm việc dưới công ty mẹ Equilibrium AI.
Cộng đồng Discord đó đã tách ra một nền tảng web trả phí tại unstability.ai, hiện nay bán quyền truy cập theo gói đăng ký vào bốn thuật toán tinh chỉnh nội bộ (Merlin, Echo, Izanagi, Pan) được huấn luyện trên một tập dữ liệu được chọn lọc gồm hơn 30 triệu hình ảnh người lớn. Đó là cùng một dự án, không phải là bản sao. Sự nhầm lẫn đến từ một cửa hàng riêng biệt của BasedLabs hiển thị unstability.ai dưới thương hiệu "Unstable Diffusion" trong thư mục công cụ của họ, khiến cả hai tên đều xuất hiện trong cùng một kết quả tìm kiếm.
Một cách sử dụng thứ ba của cái tên này khá lỏng lẻo và mang tính báo chí: bất kỳ bản phân nhánh hoặc tinh chỉnh mã nguồn mở nào của Stable Diffusion có khả năng tạo ra nội dung không phù hợp với trẻ em (NSFW), bất kể ai là người tạo ra nó. Ý nghĩa thứ ba này đã trở nên ít hữu ích hơn khi cộng đồng rộng lớn hơn đã chuyển sang các điểm kiểm tra như Pony Diffusion V6 XL và các bản tinh chỉnh dựa trên FLUX, những bản này về mặt cấu trúc không liên quan gì đến nhóm Unstable Diffusion. Trong suốt hướng dẫn này, chúng tôi sẽ chỉ rõ Unstable Diffusion nào được đề cập khi một con số, giá cả hoặc tên mô hình chỉ áp dụng cho một trong số chúng.

Khuếch tán không ổn định so với khuếch tán ổn định: Hai mô hình
Trước tiên, hãy cùng ôn lại một chút. Stable Diffusion là một mô hình chuyển đổi văn bản thành hình ảnh được phát hành mã nguồn mở vào tháng 8 năm 2022 bởi Stability AI, CompVis và Runway. Nó là một mô hình khuếch tán. Điều đó có nghĩa là nó bắt đầu với nhiễu ngẫu nhiên và từ từ khử nhiễu thành một hình ảnh thực, được hướng dẫn bởi lời nhắc văn bản của bạn. Phiên bản 1.4 chạy trên một GPU thông thường dành cho người tiêu dùng với 10 GB VRAM. Giấy phép khá tự do. Chính sự cởi mở đó là lý do tại sao mô hình này lan rộng nhanh chóng và tại sao mọi phiên bản phái sinh, bao gồm cả Unstable Diffusion, đều tồn tại.
Ngay từ khi xuất xưởng, Stable Diffusion đã được trang bị bộ lọc NSFW dựa trên CLIP và một tập dữ liệu huấn luyện mà theo thống kê của chính Stability AI, chỉ có khoảng 2,9% nội dung người lớn. Vì vậy, về mặt kỹ thuật, mô hình cơ bản có thể tạo ra hình ảnh khỏa thân. Tuy nhiên, khả năng nhận biết giải phẫu cơ thể người trong những ngữ cảnh đó của nó khá hạn chế, và bộ lọc thường gây cản trở.
Sau đó, Stable Diffusion 2.0 ra mắt vào ngày 24 tháng 11 năm 2022. Phiên bản này đã loại bỏ hoàn toàn nhiều khái niệm NSFW (không phù hợp với trẻ em) khỏi dữ liệu huấn luyện. Cộng đồng đã phản ứng dữ dội. Emad Mostaque, khi đó là CEO của Stability AI, đã cố gắng giải thích. Ông lập luận rằng không thể có trẻ em và nội dung NSFW trong cùng một mô hình mở, bởi vì sự kết hợp đó sẽ mở ra con đường dẫn đến CSAM (nội dung khiêu dâm trẻ em có thể bị lạm dụng). Cộng đồng chỉ hiểu đó là sự kiểm duyệt và không hiểu gì khác. Trong vòng vài tuần, internet đã tràn ngập các quy trình và điểm kiểm tra được tinh chỉnh nhằm khôi phục lại những gì Stability đã loại bỏ.
Unstable Diffusion là bằng chứng rõ ràng nhất cho sự phản kháng đó. Nhóm Discord tập trung vào việc thu thập các bộ dữ liệu NSFW do tình nguyện viên tuyển chọn và tinh chỉnh Stable Diffusion theo những hướng mà Stability AI sẽ không bao giờ động tới. Sản phẩm unstability.ai cũng tuân theo logic tương tự nhưng được gói gọn trong một ứng dụng web được lưu trữ với các gói trả phí. Dù bằng cách nào, về cơ bản, bạn vẫn nhận được cùng một kiến trúc khuếch tán tiềm ẩn. Điều thay đổi là bộ dữ liệu. Lớp bảo mật. Và mô hình kinh doanh được gắn thêm vào.
Nguồn gốc Discord, lệnh cấm Kickstarter và sự chuyển hướng sang Patreon
Cộng đồng Unstable Diffusion trên Reddit được thành lập vào tháng 8 năm 2022, chỉ vài tuần sau khi Stable Diffusion 1.4 được công khai mã nguồn. Hoạt động trên Discord gần như chỉ sau một đêm. Theo một bài viết trên TechCrunch ngày 17 tháng 11 năm 2022, máy chủ này đã đạt khoảng 50.000 thành viên. Sáu tuần sau, con số này đã vượt qua 97.000. Các công cụ theo dõi Discord của bên thứ ba vào năm 2025 đưa ra con số cao tới 344.000, nhưng những con số này đến từ các trang web liệt kê chứ không phải từ chính Discord, vì vậy con số này không chính xác hoàn toàn.
Một trang Patreon được ra mắt vào ngày 13 tháng 9 năm 2022. Nó đạt đỉnh điểm khoảng 2.500 đô la mỗi tháng vào cuối năm 2022. Sau đó, số tiền thu được gần như chững lại. Tính đến tháng 4 năm 2026, Graphtreon cho thấy trang này chỉ thu được khoảng 1.998 đô la mỗi tháng từ 149 người ủng hộ trả phí. Điều đó đưa nó lên vị trí thứ 336 trên bảng xếp hạng "Nội dung người lớn" của Graphtreon. Thấp hơn 20% so với mức đỉnh năm 2022, mặc dù thị trường nội dung người lớn do AI tạo ra đã tăng vọt lên ước tính 2,5 tỷ đô la trong một thị trường giải trí người lớn trực tuyến trị giá khoảng 73,6 tỷ đô la. Vì vậy, câu chuyện không còn là "người tiên phong áp đảo toàn bộ" nữa, mà là "người tiên phong, nhưng tăng trưởng chậm".
Câu chuyện về Kickstarter là câu chuyện mà mọi người đều nhớ đến. Chiến dịch được khởi động vào tháng 12 năm 2022 với mục tiêu 25.000 đô la. Nó đã vượt qua mục tiêu đó chỉ trong một ngày. Đến ngày 21 tháng 12 năm 2022, khi Kickstarter ngừng chiến dịch, 867 người ủng hộ đã cam kết đóng góp khoảng 56.000 đô la. Giám đốc điều hành của Kickstarter, Everette Taylor, đã viết một tuyên bố rằng "Kickstarter phải, và sẽ luôn luôn, đứng về phía các tác phẩm sáng tạo và những người đứng sau các tác phẩm đó." Mô hình "được ăn cả, mất tất cả" có nghĩa là mọi đô la đều được hoàn trả. Câu trả lời của Arman Chaudhry rất thẳng thắn: "Mặc dù việc Kickstarter nhượng bộ trước một nhóm nhỏ các nghệ sĩ ồn ào khiến chúng tôi thất vọng, nhưng chúng tôi và những người ủng hộ chúng tôi sẽ không lùi bước."
Nhóm đã chuyển hướng trở lại Patreon và thêm hình thức quyên góp trực tiếp qua Stripe. Tổng cộng, họ đã huy động được khoảng 26.000 đô la. Nhưng câu chuyện lớn hơn lại xuất hiện nhiều năm sau đó. Vào ngày 23 tháng 5 năm 2025, bộ xử lý thanh toán của Visa và Mastercard đã ngừng cung cấp dịch vụ cho CivitAI, trung tâm lớn nhất về các điểm kiểm tra AI có nội dung không phù hợp với trẻ em, và trang web này đã chuyển sang sử dụng các loại tiền điện tử như USDC và ETH. Cùng một mô hình mà Unstable Diffusion đã gặp phải vào năm 2022. Ba năm sau. Và ở quy mô lớn hơn nhiều lần.
Bảng dưới đây tóm tắt lịch sử huy động vốn của Unstable Diffusion.
| Ngày | Nguồn | Số lượng | Trạng thái |
|---|---|---|---|
| Ngày 13 tháng 9 năm 2022 | Ra mắt trên Patreon | có thể lên tới khoảng 2.500 đô la Mỹ/tháng vào cuối năm 2022. | Tích cực |
| Tháng 12 năm 2022 | Kickstarter | Đã quyên góp được 56.000 đô la từ 867 người ủng hộ (mục tiêu 25.000 đô la) | Tạm ngừng hoạt động ngày 21 tháng 12 năm 2022; đã được hoàn tiền. |
| 2023 | Quyên góp trực tiếp qua Stripe | Tổng cộng khoảng 26.000 đô la. | Tích cực |
| Tháng 4 năm 2026 | Ủng hộ chúng tôi ngay hôm nay! | Khoảng 1.998 đô la Mỹ/tháng từ 149 khách hàng | Đang hoạt động, xếp hạng #336 trong lĩnh vực Viết dành cho người lớn. |
| 2023-2026 | đăng ký unstability.ai | Không được tiết lộ | Các bậc tín dụng đang hoạt động |
Mô hình khuếch tán không ổn định tạo ra hình ảnh NSFW như thế nào?
Về cơ bản, cả hai phiên bản của Unstable Diffusion đều sử dụng cùng một quy trình khuếch tán tiềm ẩn như Stable Diffusion cơ bản. Người dùng nhập một lời nhắc. Văn bản này trở thành một embedding hướng dẫn mô hình đến một vùng trong không gian hình ảnh đã học được. Sau đó, mô hình sẽ khử nhiễu một hình ảnh tiềm ẩn ngẫu nhiên một cách lặp đi lặp lại, từng bước một, cho đến khi nó khớp với lời nhắc đủ gần để dừng lại. Để tạo ra hình ảnh cuối cùng thường cần từ 20 đến 50 bước khử nhiễu, tùy thuộc vào thiết lập ưu tiên tốc độ so với chất lượng được chọn.
Vậy nếu kiến trúc giống nhau, thì thực chất nó khác gì so với thuật toán Khuếch tán ổn định cơ bản? Có ba điểm khác biệt, theo thứ tự quan trọng như sau.
Đầu tiên là bộ dữ liệu. Stable AI được tinh chỉnh chủ yếu dựa trên nội dung phù hợp với môi trường làm việc và đã loại bỏ phần lớn hình ảnh người lớn khỏi kho dữ liệu huấn luyện của mình. Nhóm của Unstable Diffusion đã xây dựng và duy trì một bộ dữ liệu gồm hơn 30 triệu hình ảnh người lớn, được thu thập thông qua sự tuyển chọn của các tình nguyện viên. Điều này khắc phục được khoảng trống về giải phẫu và phạm vi thể loại mà Stable Diffusion phiên bản gốc còn yếu.
Thứ hai, bộ lọc. Các điểm kiểm tra Stable Diffusion từ Stability AI được tích hợp sẵn bộ phân loại an toàn dựa trên CLIP, mặc định sẽ gắn cờ và làm mờ các nội dung không an toàn. Các phiên bản phái sinh của Unstable Diffusion loại bỏ hoặc bỏ qua bộ phân loại đó. Trên unstability.ai, bộ lọc mặc định được thay thế bằng cổng xác minh độ tuổi, chỉ được kích hoạt khi người dùng yêu cầu nội dung dành cho người lớn một cách rõ ràng. Bất kỳ nội dung nào phù hợp với mọi lứa tuổi (SFW) đều được chạy bình thường.
Thứ ba, các rào cản bảo vệ. Ngay cả những nhánh phát triển dễ dãi nhất cũng cố gắng chặn nội dung rõ ràng là bất hợp pháp. Chính sách hiện hành: bất cứ thứ gì mô tả trẻ vị thành niên hoặc người không đồng ý đều bị từ chối ngay lập tức và một lần nữa thông qua quá trình kiểm duyệt sau khi đăng tải. Trên thực tế? Điều đó phụ thuộc vào nhà điều hành. Một số kiểm duyệt rất mạnh tay. Những người khác thì hầu như không.
Bên trong dàn mô hình: Merlin, Echo, Izanagi, Pan
Dòng sản phẩm mang thương hiệu này chủ yếu thuộc về unstability.ai, nhưng đây là bộ mặt sản phẩm được công khai rộng rãi nhất mà thương hiệu này đang sở hữu hiện nay. Thay vì các bản phát hành theo phiên bản như Stable Diffusion 1.5 hoặc SDXL 1.0, nền tảng này nhóm các điểm kiểm tra của mình theo ý đồ phong cách.
| Người mẫu | Được thiết kế cho | Ghi chú |
|---|---|---|
| Merlin | Thế hệ đa năng | Tùy chọn mặc định, cân bằng giữa tính hiện thực và phong cách. |
| Tiếng vọng | Ảnh chân dung và ảnh sản phẩm chân thực như thật. | Thích hợp nhất cho việc vẽ chân dung người và chi tiết da. |
| Izanagi | Nghệ thuật anime và manga | Được điều chỉnh dựa trên các tài liệu tham khảo minh họa và cách điệu. |
| Chảo | Nghệ thuật nhân hình và lông thú | Tuy hơi kén người dùng nhưng lại được cộng đồng yêu cầu rất nhiều. |
Ngoài ra còn có các tùy chọn tốc độ song song. Unstable Diffusion v2.6 là phiên bản mặc định được tinh chỉnh tốc độ, mất từ 6 đến 8 giây mỗi ảnh. Unstable Diffusion XL mất từ 12 đến 15 giây cho độ phân giải cao hơn. Unstable Diffusion Photoreal chuyên xử lý ảnh chân dung. Không có tùy chọn nào trong số này được kế thừa trực tiếp từ các tinh chỉnh ban đầu của cộng đồng Discord, mặc dù việc tiếp thị tập trung mạnh vào thương hiệu chung. Để đánh giá chất lượng đầu ra, cách kiểm tra rõ ràng nhất là so sánh trực tiếp với phiên bản SDXL cơ bản hoặc một phiên bản CivitAI phổ biến được tinh chỉnh tương tự.
Giá cả, tín dụng và quyền truy cập nền tảng dành cho người sáng tạo
Giá cả của nền tảng web unstability.ai tuân theo mô hình SaaS quen thuộc. Có gói miễn phí với số lượt sử dụng hàng ngày, các gói trả phí mở khóa số lượng thế hệ không giới hạn và sử dụng cho mục đích thương mại, và gói cao cấp nhất bổ sung lịch sử tạo thế hệ riêng tư. Tốc độ tạo thế hệ bị giới hạn bởi "tín dụng nhanh" được bổ sung hàng tháng.
| Cấp độ | Chi phí / tháng | Tín dụng hàng ngày | Tín dụng nhanh / tháng | Sử dụng cho mục đích thương mại |
|---|---|---|---|---|
| Miễn phí | $0 | Giới hạn số ngày được phép | Không có | KHÔNG |
| Nền tảng | 14,99 đô la | 150 | 1.000 | KHÔNG |
| Phần thưởng | 29,99 đô la | Không giới hạn | 3.000 | Đúng |
| Chuyên nghiệp | 59,99 đô la | Không giới hạn | 6.000 | Có (dữ liệu riêng tư) |
Việc truy cập Discord dành cho cộng đồng ban đầu là riêng biệt. Discord vẫn miễn phí tham gia nhưng hoạt động như một máy chủ trò chuyện, chứ không phải là một hệ thống tạo mô hình. Các mô hình được huấn luyện hoặc chia sẻ trong cộng đồng thường chạy cục bộ trên GPU của người dùng, thông qua các công cụ như Stable Diffusion WebUI của AUTOMATIC1111, ComfyUI hoặc InvokeAI, hoặc được tải lên các trung tâm lưu trữ như CivitAI để tải xuống. Không có phí truy cập tập trung nào ở phía cộng đồng.
Đối với hầu hết các nhà sáng tạo xem xét vấn đề này vào năm 2026, sự lựa chọn thực tế nằm giữa ba con đường. Trả phí thuê bao trên một nền tảng lưu trữ không bị kiểm duyệt. Chạy một điểm kiểm tra mở cục bộ trên GPU tiêu dùng 12 GB hoặc 16 GB. Hoặc sử dụng một trung tâm kiểu CivitAI, nơi tích hợp nhiều mô hình được tinh chỉnh với gói miễn phí hào phóng và hệ thống tín dụng bổ sung. Mỗi con đường đều có những đánh đổi về quyền riêng tư, tốc độ, sự đa dạng của mô hình và chính sách nội dung.
Tranh cãi về nội dung AI không bị kiểm duyệt: Đạo đức và CSAM (Nội dung khiêu dâm trẻ em có thể bị kiểm duyệt)
Thật lòng mà nói, không thể viết về Lý thuyết Khuếch tán Không ổn định mà bỏ qua khía cạnh đạo đức. Ba vấn đề cứ liên tục xuất hiện. Mỗi vấn đề đều gắn liền với một sự cố có thật.
Hãy xem xét trường hợp hình ảnh không được sự đồng ý trước tiên. Trường hợp điển hình là vụ bê bối Atrioc ngày 30 tháng 1 năm 2023. Streamer Brandon Ewing trên Twitch đã vô tình để lộ một tab trình duyệt trong buổi phát trực tiếp của mình. Tab đó là gì? Một trang web trả phí bán ảnh khiêu dâm deepfake của các đồng nghiệp của anh ta: Pokimane, QTCinderella, Maya Higa, Sweet Anita. Anh ta đã xin lỗi trước ống kính vào ngày hôm sau. Anh ta cũng được cho là đã chuyển 60.000 đô la để trang trải chi phí pháp lý gỡ bỏ nội dung cho các streamer bị ảnh hưởng. Twitch đã lặng lẽ cập nhật điều khoản của mình vào tháng 3 năm 2023 để cấm vĩnh viễn bất kỳ ai tạo ra nội dung deepfake. Một sự việc duy nhất đã đưa việc phổ biến nguồn mở vào tin tức chính thống nhiều hơn bất kỳ cuộc tranh luận chính sách kỹ thuật nào từng làm được.
Giờ đến vấn đề về tập dữ liệu. Vào tháng 12 năm 2023, Đài quan sát Internet Stanford đã chạy tập dữ liệu huấn luyện LAION-5B thông qua PhotoDNA. Họ đã gắn cờ 1.008 hình ảnh lạm dụng tình dục trẻ em đã được xác minh có trong đó. LAION-5B là cùng một tập dữ liệu mà Stable Diffusion 1.5 đã sử dụng để huấn luyện. LAION đã gỡ bỏ nó và phát hành phiên bản Re-LAION-5B đã được làm sạch vào tháng 8 năm 2024. Vấn đề là, mọi mô hình được huấn luyện trên phiên bản gốc đều nằm sau sự ô nhiễm đó. SD 1.5 cũng vậy. Và toàn bộ hệ sinh thái tinh chỉnh NSFW được xây dựng trên đó cũng vậy. Một số nhánh đã thực hiện việc huấn luyện lại hoặc làm sạch. Những nhánh khác chỉ tiếp tục phát hành. Nếu bạn là người mua, hãy tìm hiểu xem điểm kiểm tra cụ thể đó thực sự đã được huấn luyện trên tập dữ liệu nào. Đừng tin lời của người vận hành.
Vấn đề thứ ba là bóng dáng pháp lý. Mọi nhà xử lý thanh toán lớn vào năm 2026 đều coi hình ảnh người lớn do AI tạo ra là rủi ro cao. Nhà xử lý thẻ của CivitAI đã ngừng dịch vụ vào ngày 23 tháng 5 năm 2025 do bị lộ nội dung NSFW, và trang web đã chuyển sang sử dụng tiền điện tử ngay lập tức. Stability AI đã cập nhật Chính sách Sử dụng Chấp nhận được vào ngày 31 tháng 7 năm 2025 để cấm tạo nội dung khiêu dâm trên các mô hình hiện tại của họ. Tuy nhiên, chính sách mới không áp dụng hồi tố cho SD 1.5 hoặc SDXL, vốn vẫn là xương sống của cộng đồng NSFW. Đạo luật AI của EU và danh sách ngày càng tăng các luật tiểu bang của Hoa Kỳ hiện yêu cầu tiết lộ khi nội dung do AI tạo ra mô tả con người thực tế. Vì vậy, bất kỳ ai sử dụng AI không kiểm duyệt cho mục đích thương mại ngày nay đều đang hoạt động trong một khuôn khổ pháp lý không tồn tại khi Unstable Diffusion ra mắt.
Những điều này không giết chết công nghệ. Nó chỉ có nghĩa là những người xây dựng, lưu trữ và sử dụng nó giờ đây phải chịu trách nhiệm về sự đồng ý, tính toàn vẹn của dữ liệu và việc công khai thông tin, những vấn đề mà giai đoạn đầu hầu như đã bỏ qua.

Các giải pháp thay thế cho khuếch tán không ổn định vào năm 2026: FLUX, Pony, Kling
Lý thuyết Khuếch tán Không ổn định không còn là trọng tâm nữa. Mô hình và bản đồ nền tảng đã thay đổi đáng kể kể từ vụ bê bối Discord năm 2022. Những người đang thực hiện công việc AI nghiêm túc và không bị kiểm duyệt vào năm 2026 sẽ tìm kiếm những lựa chọn khác trước tiên. Các lựa chọn thay thế mạnh nhất được chia thành ba nhóm.
Loại thứ nhất: các điểm kiểm tra không bị kiểm duyệt, trọng lượng mở, bạn có thể chạy trên máy tính của mình. Pony Diffusion V6 XL ra mắt trên CivitAI vào tháng 1 năm 2024 và nhanh chóng trở thành bản tinh chỉnh SDXL NSFW mặc định. Nó được xây dựng và phân phối hoàn toàn bên ngoài quy trình Unstable Diffusion. Pony cùng với người anh em Illustrious mới hơn của nó hiện đang thống trị thể loại người lớn được cách điệu hóa. Các điểm kiểm tra được huấn luyện theo phong cách anime và nhiều bản tinh chỉnh SDXL khác nhau lấp đầy cùng một phân khúc với thẩm mỹ khác nhau. Để chạy bất kỳ bản nào trong số chúng một cách thoải mái, bạn cần một GPU cục bộ với ít nhất 12 GB VRAM.
Nhóm thứ hai: thế hệ mô hình cơ bản tiếp theo. FLUX.1 từ Black Forest Labs ra mắt vào tháng 8 năm 2024 và đã thiết lập lại tiêu chuẩn về độ chính xác và tính chân thực. Phiên bản FLUX.1-dev với dung lượng mở đã thu hút các nội dung NSFW LoRA từ cộng đồng chỉ trong vài tuần. Stability AI đã phát hành Stable Diffusion 3 vào tháng 2 năm 2024 và phiên bản lớn hơn Stable Diffusion 3.5 vào tháng 10 năm 2024. Các lỗi về giải phẫu được báo cáo rộng rãi của SD3 đã làm chậm quá trình chấp nhận trong cộng đồng không bị kiểm duyệt. Bản thân Stability AI cũng đã rút lui. Emad Mostaque đã từ chức vào ngày 23 tháng 3 năm 2024 trong bối cảnh khủng hoảng tài chính. Bản cập nhật chính sách tháng 7 năm 2025 hiện chính thức cấm tạo nội dung khiêu dâm trên các mô hình hiện tại của họ.
Nhóm thứ ba: video. Kỷ nguyên trí tuệ nhân tạo tạo sinh chỉ dựa trên hình ảnh đã phần nào lùi lại phía sau. Kling, Runway Gen-3 và Gen-4, Sora của OpenAI, Veo của Google. Tất cả đều đã mở rộng sang lĩnh vực video, và một số cho phép nội dung người lớn với xác minh độ tuổi trên các máy chủ bên thứ ba. Unstable Diffusion chưa bao giờ có bước nhảy vọt tương tự vào video. Đó là một phần lý do tại sao tầm ảnh hưởng văn hóa của nó đã âm thầm giảm sút kể từ năm 2023.
Bảng dưới đây so sánh các lựa chọn chính.
| Dụng cụ | Kiểu | Tại chỗ hoặc được lưu trữ | Có thể chứa nội dung NSFW | Tốt nhất cho |
|---|---|---|---|---|
| Sự khuếch tán không ổn định (Discord) | Cộng đồng + các điểm kiểm soát | Địa phương | Đúng | Miễn phí, tự làm |
| Unstability.ai | Nền tảng web | Được lưu trữ | Có (khu vực có cổng) | Dịch vụ lưu trữ dễ dàng, không bị kiểm duyệt |
| Pony Diffusion v6 + | Mở điểm kiểm soát | Địa phương | Đúng | Nghệ thuật người lớn cách điệu |
| FLUX.1-dev | Phiên bản cơ bản + tinh chỉnh | Tại chỗ hoặc được lưu trữ | Với khả năng tinh chỉnh | Chất lượng tốt nhất thời kỳ năm 2024 |
| Các điểm kiểm soát SDXL + CivitAI | Căn cứ + cộng đồng | Tại chỗ hoặc được lưu trữ | Với khả năng tinh chỉnh | Đa dạng kiểu dáng |
| Kling 2.0 | Trình tạo video | Được lưu trữ | Hạn chế, có cổng kiểm soát | Các đoạn phim ngắn không bị kiểm duyệt |
Sự lựa chọn đúng đắn phụ thuộc vào sức mạnh GPU bạn có, mức độ quan tâm của bạn đến việc sử dụng dịch vụ lưu trữ hay tự làm, và liệu bạn cần ảnh tĩnh hay video. Không có lựa chọn nào có thể thay thế hoàn toàn trải nghiệm Unstable Diffusion ban đầu. Thị trường đã phân mảnh, và thương hiệu này không còn thống trị như thời kỳ gây quỹ Kickstarter nữa.