AI การแพร่กระจายที่ไม่เสถียร: NSFW ไม่มีการเซ็นเซอร์ การแพร่กระจายที่เสถียร
หากคุณเคยค้นหาคำว่า "Unstable Diffusion AI" ในปีที่ผ่านมา คุณอาจพบกับข้อมูลที่ขัดแย้งกันมากมาย บางแหล่งข้อมูลอธิบายถึงชุมชน Discord ที่เติบโตอย่างรวดเร็วจากสมาชิก 50,000 คนในเดือนพฤศจิกายน 2022 เป็นประมาณ 97,000 คนในเดือนธันวาคม และจากนั้นก็เพิ่มขึ้นเป็นมากกว่า 300,000 คนในเว็บไซต์จัดอันดับบุคคลที่สามภายในปี 2025 ในขณะที่แหล่งข้อมูลอื่นๆ อธิบายถึงแอปพลิเคชันบนเว็บแบบเสียเงินที่มีเวอร์ชันฟรีและโมเดลสี่แบบ ส่วนที่ทำให้สับสนคือทั้งสองอย่างมีอยู่จริง ทั้งสองมีชื่อเดียวกัน และทั้งสองเริ่มต้นจากแนวคิดเดียวกัน นั่นคือ นำ Stable Diffusion มาลอกชั้นความปลอดภัยออก แล้วปล่อยให้อินเทอร์เน็ตสร้างอะไรก็ได้ตามต้องการ
คู่มือนี้จะอธิบายความแตกต่างระหว่างสองสิ่งนี้ เราจะกล่าวถึงว่า Unstable Diffusion AI คืออะไรกันแน่ในปี 2026 เกี่ยวข้องกับ Stable Diffusion จาก Stability AI อย่างไร เรื่องราวการถูกแบนจาก Kickstarter ในเดือนธันวาคม 2022 รุ่นต่างๆ ราคา คำถามด้านจริยธรรมที่ยังคงเปิดอยู่ และทางเลือกอื่นๆ ที่เหนือกว่ามันไปแล้ว เป้าหมายคือการอธิบายให้คนนอกที่สนใจสามารถอ่านครั้งเดียวแล้วเข้าใจได้ ไม่ใช่บทความที่เน้นการโฆษณาชวนเชื่อ
AI ที่มีการแพร่กระจายแบบไม่เสถียรนั้นคืออะไรกันแน่ในปี 2026
ชื่อ "Unstable Diffusion" ครอบคลุมหลายสิ่งหลายอย่างที่ซ้อนทับกัน และผู้คนมักสับสนกันอยู่ตลอด ต้นกำเนิดมาจากชุมชนที่เริ่มต้นจากกระทู้ใน Reddit ในเดือนสิงหาคม 2022 และย้ายไป Discord เกือบจะทันที ซึ่งกลายเป็นศูนย์กลางสำหรับผลลัพธ์ของ Stable Diffusion ที่ไม่ถูกเซ็นเซอร์และน้ำหนักที่ปรับแต่งอย่างละเอียด ผู้ที่ปรากฏตัวต่อสาธารณะในโครงการนี้คือ CEO Arman Chaudhry และผู้ดูแลระบบร่วม AshleyEvelyn ซึ่งทำงานภายใต้บริษัทแม่ Equilibrium AI
ชุมชน Discord ดังกล่าวได้แตกแขนงออกไปเป็นแพลตฟอร์มเว็บแบบเสียค่าใช้จ่ายที่ unstability.ai ซึ่งปัจจุบันจำหน่ายสิทธิ์การเข้าถึงแบบสมัครสมาชิกสำหรับการปรับแต่งภายในองค์กรสี่แบบ (Merlin, Echo, Izanagi, Pan) ที่ได้รับการฝึกฝนบนชุดข้อมูลภาพผู้ใหญ่ที่คัดสรรมาแล้วกว่า 30 ล้านภาพ นี่คือโครงการเดียวกัน ไม่ใช่การลอกเลียนแบบ ความสับสนเกิดจากร้านค้าออนไลน์ของ BasedLabs ที่แสดง unstability.ai ภายใต้แบรนด์ "Unstable Diffusion" ในหมวดหมู่เครื่องมือ ทำให้ทั้งสองชื่อปรากฏในผลการค้นหาเดียวกัน
ความหมายที่สามของชื่อนี้ค่อนข้างกว้างและใช้ในเชิงสื่อสารมวลชน: หมายถึงโปรแกรมโอเพนซอร์สที่แตกแขนงหรือปรับแต่งมาจาก Stable Diffusion ซึ่งสามารถสร้างเนื้อหาที่ไม่เหมาะสมได้ ไม่ว่าใครจะเป็นผู้สร้างก็ตาม ความหมายที่สามนี้เริ่มไม่ค่อยมีประโยชน์แล้ว เนื่องจากชุมชนผู้ใช้งานได้หันไปใช้โปรแกรมเวอร์ชันต่างๆ เช่น Pony Diffusion V6 XL และโปรแกรมที่ปรับแต่งโดยใช้ FLUX ซึ่งไม่มีความเกี่ยวข้องทางโครงสร้างกับทีม Unstable Diffusion เลย ในคู่มือนี้ เราจะระบุอย่างชัดเจนว่าหมายถึง Unstable Diffusion รุ่นใด เมื่อใดก็ตามที่ตัวเลข ราคา หรือชื่อรุ่นนั้นใช้ได้กับรุ่นใดรุ่นหนึ่งเท่านั้น

การแพร่แบบไม่เสถียรเทียบกับการแพร่แบบเสถียร: สองแบบจำลอง
ขอทบทวนกันก่อน Stable Diffusion เป็นโมเดลแปลงข้อความเป็นภาพที่เปิดให้ใช้งานแบบโอเพนซอร์สในเดือนสิงหาคม 2022 โดย Stability AI, CompVis และ Runway มันเป็นโมเดลแบบกระจายแสง นั่นหมายความว่ามันเริ่มต้นด้วยสัญญาณรบกวนแบบสุ่มและค่อยๆ ลดสัญญาณรบกวนจนกลายเป็นภาพจริง โดยมีข้อความที่คุณป้อนเป็นตัวนำทาง เวอร์ชัน 1.4 ทำงานบน GPU สำหรับผู้บริโภคทั่วไปที่มี VRAM 10 GB ใบอนุญาตนั้นค่อนข้างเปิดกว้าง ความเปิดกว้างนี้เองที่ทำให้โมเดลนี้แพร่กระจายอย่างรวดเร็ว และเป็นเหตุผลว่าทำไมจึงมีเวอร์ชันแยกย่อยมากมาย รวมถึง Unstable Diffusion ด้วย
โปรแกรม Stable Diffusion มาพร้อมกับตัวกรองเนื้อหาที่ไม่เหมาะสม (NSFW) ที่ใช้ CLIP และชุดข้อมูลฝึกฝนที่มีเนื้อหาสำหรับผู้ใหญ่เพียงประมาณ 2.9% เท่านั้น ตามที่ Stability AI ระบุเอง ดังนั้นโมเดลพื้นฐานจึงสามารถสร้างภาพเปลือยได้ในทางเทคนิค แต่ความเข้าใจเกี่ยวกับกายวิภาคของมนุษย์ในบริบทเหล่านั้นค่อนข้างอ่อน และตัวกรองมักจะขัดขวางการทำงานอยู่ดี
จากนั้น Stable Diffusion 2.0 ก็เปิดตัวเมื่อวันที่ 24 พฤศจิกายน 2022 การเปิดตัวครั้งนี้ได้ลบแนวคิดที่ไม่เหมาะสมหลายอย่างออกจากข้อมูลการฝึกอบรมทั้งหมด ทำให้ชุมชนเกิดความไม่พอใจอย่างมาก Emad Mostaque ซีอีโอของ Stability AI ในขณะนั้น พยายามอธิบายว่า คุณไม่สามารถมีเด็กและเนื้อหาที่ไม่เหมาะสมในโมเดลแบบเปิดเดียวกันได้ เพราะการรวมกันเช่นนั้นจะเปิดทางให้กับการล่วงละเมิดทางเพศเด็กได้ ชุมชนได้ยินแต่คำว่าการเซ็นเซอร์และไม่ได้ยินอะไรมากไปกว่านั้น ภายในไม่กี่สัปดาห์ อินเทอร์เน็ตก็เต็มไปด้วยไปป์ไลน์และจุดตรวจสอบที่ปรับแต่งอย่างละเอียดเพื่อนำสิ่งที่ Stability ได้ลบออกไปกลับมา
Unstable Diffusion คือส่วนที่เห็นได้ชัดที่สุดของการต่อต้านนั้น ทีมงาน Discord มุ่งเน้นไปที่การรวบรวมชุดข้อมูล NSFW ที่คัดสรรโดยอาสาสมัคร และปรับแต่ง Stable Diffusion ในทิศทางที่ Stability AI จะไม่มีวันแตะต้อง ผลิตภัณฑ์ unstability.ai ใช้ตรรกะเดียวกัน แต่ห่อหุ้มไว้ในแอปพลิเคชันบนเว็บที่มีบริการแบบเสียเงิน ไม่ว่าจะด้วยวิธีใดก็ตาม ภายใต้โครงสร้างพื้นฐาน คุณจะได้รับสถาปัตยกรรมของการแพร่กระจายแบบแฝงที่เหมือนกัน สิ่งที่เปลี่ยนไปคือชุดข้อมูล ชั้นความปลอดภัย และโมเดลธุรกิจที่เพิ่มเข้ามา
Discord Origins, การแบน Kickstarter และการเปลี่ยนไปใช้ Patreon
ชุมชน Unstable Diffusion บน Reddit เปิดตัวในเดือนสิงหาคม 2022 เพียงไม่กี่สัปดาห์หลังจากที่ Stable Diffusion 1.4 ถูกเปิดเผยเป็นโอเพนซอร์ส การเคลื่อนไหวก็ย้ายไปที่ Discord แทบจะในชั่วข้ามคืน จากรายงานของ TechCrunch เมื่อวันที่ 17 พฤศจิกายน 2022 เซิร์ฟเวอร์ดังกล่าวมีสมาชิกประมาณ 50,000 คน หกสัปดาห์ต่อมา จำนวนสมาชิกก็พุ่งทะลุ 97,000 คน เว็บไซต์ติดตามสมาชิก Discord จากภายนอกในปี 2025 อ้างว่ามีสมาชิกสูงถึง 344,000 คน แต่ตัวเลขเหล่านั้นมาจากเว็บไซต์ที่รวบรวมข้อมูล ไม่ใช่จาก Discord เอง ดังนั้นตัวเลขจึงไม่แน่นอน
หน้า Patreon เปิดตัวเมื่อวันที่ 13 กันยายน 2022 ทำรายได้สูงสุดประมาณ 2,500 ดอลลาร์ต่อเดือนในช่วงปลายปี 2022 จากนั้นก็คงที่ ณ เดือนเมษายน 2026 Graphtreon แสดงให้เห็นว่าหน้าเพจนี้มีรายได้ประมาณ 1,998 ดอลลาร์ต่อเดือนจากผู้สนับสนุนที่ชำระเงิน 149 ราย ทำให้ติดอันดับที่ 336 ในตารางอันดับ "งานเขียนสำหรับผู้ใหญ่" ของ Graphtreon ต่ำกว่าจุดสูงสุดในปี 2022 ถึง 20% แม้ว่าตลาดเนื้อหาสำหรับผู้ใหญ่ที่สร้างโดย AI จะเติบโตขึ้นอย่างมากจนมีมูลค่าประมาณ 2.5 พันล้านดอลลาร์ภายในตลาดบันเทิงสำหรับผู้ใหญ่ทางออนไลน์ที่มีมูลค่าประมาณ 73.6 พันล้านดอลลาร์ ดังนั้นเรื่องราวจึงไม่ใช่ "ผู้บุกเบิกชนะขาดลอย" อีกต่อไป แต่เป็น "ผู้บุกเบิก แต่ค่อยๆ ทรงตัว"
เรื่องราวของ Kickstarter เป็นเรื่องที่ทุกคนจำได้ดี แคมเปญเปิดตัวในเดือนธันวาคม 2022 โดยตั้งเป้าหมายไว้ที่ 25,000 ดอลลาร์ และบรรลุเป้าหมายภายในวันเดียว เมื่อถึงวันที่ 21 ธันวาคม 2022 เมื่อ Kickstarter ยุติโครงการ มีผู้สนับสนุน 867 คนร่วมบริจาคเงินประมาณ 56,000 ดอลลาร์ เอเวอเร็ตต์ เทย์เลอร์ ซีอีโอของ Kickstarter เขียนแถลงการณ์ว่า "Kickstarter ต้องและจะอยู่เคียงข้างงานสร้างสรรค์และผู้คนเบื้องหลังงานนั้นเสมอ" โมเดลแบบได้ทั้งหมดหรือไม่ได้เลยหมายความว่าเงินทุกดอลลาร์จะถูกคืน อาร์มาน ชอว์ดรี ตอบกลับอย่างตรงไปตรงมาว่า "แม้ว่าการยอมจำนนของ Kickstarter ต่อกลุ่มศิลปินเสียงดังบางกลุ่มจะทำให้เราผิดหวัง แต่เราและผู้สนับสนุนของเราจะไม่ยอมถอย"
ทีมงานหันกลับไปใช้ Patreon และเพิ่มการบริจาคโดยตรงผ่าน Stripe โดยรวมแล้วระดมทุนได้ประมาณ 26,000 ดอลลาร์ แต่เรื่องราวที่สำคัญกว่านั้นปรากฏขึ้นในอีกหลายปีต่อมา ในวันที่ 23 พฤษภาคม 2025 ผู้ให้บริการประมวลผลของ Visa และ Mastercard ได้ตัดบริการให้กับ CivitAI ซึ่งเป็นศูนย์กลางที่ใหญ่ที่สุดสำหรับจุดตรวจสอบ AI ที่ไม่เหมาะสม และเว็บไซต์ดังกล่าวได้ย้ายไปใช้สกุลเงินดิจิทัล เช่น USDC และ ETH รูปแบบเดียวกันนี้เคยเกิดขึ้นกับ Unstable Diffusion ในปี 2022 สามปีต่อมา ในขนาดที่ใหญ่กว่าหลายเท่า
ตารางด้านล่างนี้สรุปประวัติการได้รับเงินทุนของ Unstable Diffusion
| วันที่ | แหล่งที่มา | จำนวน | สถานะ |
|---|---|---|---|
| 13 กันยายน 2565 | เปิดตัว Patreon | รายได้สูงสุดถึงประมาณ 2,500 ดอลลาร์สหรัฐต่อเดือนภายในปลายปี 2022 | คล่องแคล่ว |
| ธันวาคม 2022 | คิกสตาร์เตอร์ | ได้รับเงินบริจาค 56,000 ดอลลาร์ จากผู้สนับสนุน 867 ราย (เป้าหมาย 25,000 ดอลลาร์) | ระงับเมื่อวันที่ 21 ธันวาคม 2022; คืนเงินแล้ว |
| 2023 | การบริจาคโดยตรงผ่าน Stripe | ยอดรวมประมาณ 26,000 ดอลลาร์สหรัฐ | คล่องแคล่ว |
| เมษายน 2569 | Patreon วันนี้ | รายได้ประมาณ 1,998 ดอลลาร์สหรัฐต่อเดือน จากผู้สนับสนุน 149 ราย | มีผลงานตีพิมพ์อย่างต่อเนื่อง ติดอันดับที่ 336 ในหมวดงานเขียนสำหรับผู้ใหญ่ |
| 2023-2026 | การสมัครสมาชิก unstability.ai | ไม่เปิดเผยข้อมูล | ระดับเครดิตที่ใช้งานอยู่ |
แบบจำลองการแพร่กระจายที่ไม่เสถียรสร้างภาพที่ไม่เหมาะสมได้อย่างไร
ภายใต้การทำงานเบื้องหลัง โมเดล Unstable Diffusion ทั้งสองเวอร์ชันใช้กระบวนการแพร่กระจายแฝงแบบเดียวกันกับ Stable Diffusion พื้นฐาน ผู้ใช้พิมพ์ข้อความ ข้อความนั้นจะกลายเป็นเวกเตอร์ฝังตัว (embedding) ที่ชี้ไปยังบริเวณหนึ่งในพื้นที่ภาพที่โมเดลเรียนรู้ จากนั้นโมเดลจะทำการลดสัญญาณรบกวนในภาพแฝงแบบสุ่มทีละขั้นตอน จนกว่าจะตรงกับข้อความที่ต้องการมากพอที่จะหยุด โดยทั่วไปแล้ว การสร้างภาพสุดท้ายจะใช้ขั้นตอนการลดสัญญาณรบกวน 20 ถึง 50 ขั้นตอน ขึ้นอยู่กับการตั้งค่าความเร็วเทียบกับคุณภาพที่เลือก
ดังนั้น หากโครงสร้างสถาปัตยกรรมเหมือนกัน แล้วอะไรที่แตกต่างจาก Stable Diffusion รุ่นพื้นฐาน? มีสามสิ่ง โดยเรียงลำดับความสำคัญคร่าวๆ ดังนี้
ประการแรกคือชุดข้อมูล Stability AI ปรับแต่งโดยเน้นเนื้อหาที่เหมาะสมสำหรับทุกวัย และตัดภาพอนาจารส่วนใหญ่ออกจากชุดข้อมูลฝึกฝน ในขณะที่ทีมงานของ Unstable Diffusion ได้สร้างและดูแลรักษาชุดข้อมูลภาพอนาจารมากกว่า 30 ล้านภาพ ซึ่งได้มาจากการคัดสรรโดยอาสาสมัคร สิ่งนี้ช่วยแก้ไขช่องว่างด้านกายวิภาคและการครอบคลุมประเภทภาพที่ Stable Diffusion เวอร์ชันดั้งเดิมทำได้ไม่ดีนัก
ประการที่สองคือตัวกรอง โปรแกรมตรวจสอบความปลอดภัยของ Stable Diffusion จาก Stability AI มาพร้อมกับตัวจำแนกความปลอดภัยแบบ CLIP ที่จะแจ้งเตือนและเบลอเอาต์พุตที่ไม่ปลอดภัยโดยค่าเริ่มต้น ในขณะที่โปรแกรมที่พัฒนาต่อยอดจาก Unstable Diffusion จะลบตัวจำแนกนั้นออกหรือปิดใช้งานไปเลย บนเว็บไซต์ unstability.ai ตัวกรองเริ่มต้นจะถูกแทนที่ด้วยระบบตรวจสอบอายุที่จะทำงานก็ต่อเมื่อผู้ใช้ร้องขอเนื้อหาสำหรับผู้ใหญ่โดยชัดเจนเท่านั้น เนื้อหาที่ปลอดภัยสำหรับทุกวัย (SFW) จะทำงานโดยอัตโนมัติ
ประการที่สาม คือ มาตรการควบคุม แม้แต่เว็บไซต์ที่อนุญาตมากที่สุดก็พยายามบล็อกเนื้อหาที่ผิดกฎหมายอย่างชัดเจน นโยบายที่กำหนดไว้คือ เนื้อหาใดๆ ที่แสดงภาพผู้เยาว์หรือบุคคลที่ไม่ยินยอมจะถูกปฏิเสธตั้งแต่ระดับการแจ้งเตือน และอีกครั้งผ่านการตรวจสอบหลังการสร้างเนื้อหา ในทางปฏิบัติ? ขึ้นอยู่กับผู้ให้บริการ บางรายตรวจสอบอย่างเข้มงวด ในขณะที่บางรายแทบไม่ตรวจสอบเลย
ภายในไลน์อัพโมเดล: เมอร์ลิน, เอคโค่, อิซานางิ, แพน
กลุ่มผลิตภัณฑ์ภายใต้แบรนด์นี้ส่วนใหญ่เป็นเรื่องของ unstability.ai แต่ก็เป็นผลิตภัณฑ์ที่เป็นที่รู้จักมากที่สุดของแบรนด์ในปัจจุบัน แทนที่จะออกเวอร์ชันแยกกัน เช่น Stable Diffusion 1.5 หรือ SDXL 1.0 แพลตฟอร์มนี้จะจัดกลุ่มจุดตรวจสอบตามเจตนารมณ์ด้านสไตล์
| แบบอย่าง | ออกแบบมาเพื่อ | หมายเหตุ |
|---|---|---|
| เมอร์ลิน | การผลิตอเนกประสงค์ | ตัวเลือกเริ่มต้น: ความสมดุลระหว่างความสมจริงและการจัดสไตล์ |
| เสียงสะท้อน | ภาพถ่ายบุคคลและภาพสินค้าที่สมจริงราวกับภาพถ่าย | เหมาะที่สุดสำหรับการวาดภาพเหมือนมนุษย์และรายละเอียดของผิวหนัง |
| อิซานางิ | ศิลปะอนิเมะและมังงะ | ปรับแต่งตามภาพประกอบและรูปแบบต่างๆ |
| กระทะ | ศิลปะที่มีลักษณะคล้ายมนุษย์และมีขน | เป็นสินค้าเฉพาะกลุ่ม แต่เป็นที่ต้องการอย่างมากจากชุมชน |
นอกจากนี้ยังมีชุดความเร็วในการประมวลผลภาพแบบขนานอีกด้วย Unstable Diffusion v2.6 เป็นค่าเริ่มต้นที่ปรับความเร็วไว้แล้ว โดยใช้เวลา 6 ถึง 8 วินาทีต่อภาพ Unstable Diffusion XL ใช้เวลา 12 ถึง 15 วินาทีสำหรับความละเอียดสูงขึ้น และ Unstable Diffusion Photoreal เหมาะสำหรับงานถ่ายภาพบุคคล ถึงแม้ว่าการตลาดจะเน้นย้ำถึงแบรนด์ที่ใช้ร่วมกัน แต่ก็ไม่มีการปรับแต่งใดที่สืบทอดมาจากชุมชน Discord โดยตรง วิธีทดสอบที่ดีที่สุดในการตัดสินคุณภาพของผลลัพธ์คือการเปรียบเทียบกับ SDXL รุ่นพื้นฐาน หรือ CivitAI checkpoint ที่ปรับแต่งในลักษณะเดียวกัน
ราคา เครดิต และการเข้าถึงแพลตฟอร์มสำหรับครีเอเตอร์
การกำหนดราคาของแพลตฟอร์มเว็บ unstability.ai เป็นไปตามรูปแบบ SaaS ที่คุ้นเคย มีแพ็กเกจฟรีพร้อมเครดิตรายวัน แพ็กเกจแบบชำระเงินที่ปลดล็อกการสร้างภาพแบบไม่จำกัดและการใช้งานเชิงพาณิชย์ และแพ็กเกจสูงสุดที่เพิ่มประวัติการสร้างภาพส่วนตัว ความเร็วในการสร้างภาพถูกจำกัดด้วย "เครดิตด่วน" ที่จะเติมเต็มทุกเดือน
| ชั้น | ค่าใช้จ่ายต่อเดือน | เครดิตรายวัน | เครดิตด่วน/เดือน | การใช้งานเชิงพาณิชย์ |
|---|---|---|---|---|
| ฟรี | 0 ดอลลาร์ | เบี้ยเลี้ยงรายวันจำกัด | ไม่มี | เลขที่ |
| พื้นฐาน | 14.99 เหรียญสหรัฐ | 150 | 1,000 | เลขที่ |
| พรีเมียม | 29.99 เหรียญสหรัฐ | ไม่จำกัด | 3,000 | ใช่ |
| โปร | 59.99 เหรียญสหรัฐ | ไม่จำกัด | 6,000 | ใช่ (ข้อมูลส่วนตัว) |
การเข้าถึง Discord สำหรับชุมชนดั้งเดิมนั้นแยกต่างหาก Discord ยังคงเข้าร่วมได้ฟรี แต่ทำหน้าที่เป็นเซิร์ฟเวอร์แชท ไม่ใช่ระบบสร้างโมเดลเบื้องหลัง โมเดลที่ฝึกฝนหรือแบ่งปันในชุมชนมักจะทำงานในเครื่องของผู้ใช้เองโดยใช้ GPU ผ่านเครื่องมือต่างๆ เช่น Stable Diffusion WebUI ของ AUTOMATIC1111, ComfyUI หรือ InvokeAI หรืออัปโหลดไปยังศูนย์กลางตรวจสอบเช่น CivitAI เพื่อให้ดาวน์โหลด ไม่มีระบบเก็บค่าบริการส่วนกลางในส่วนของชุมชน
สำหรับครีเอเตอร์ส่วนใหญ่ที่มองเรื่องนี้ในปี 2026 ทางเลือกที่เป็นไปได้ในทางปฏิบัติมีอยู่สามทาง คือ จ่ายค่าสมัครสมาชิกบนแพลตฟอร์มที่ไม่ถูกเซ็นเซอร์ ติดตั้งระบบตรวจสอบแบบเปิดบนการ์ดจอสำหรับผู้บริโภคขนาด 12 GB หรือ 16 GB หรือใช้ฮับแบบ CivitAI ที่รวบรวมโมเดลที่ปรับแต่งมาอย่างดีมากมาย พร้อมด้วยแพ็กเกจฟรีที่กว้างขวางและระบบเครดิตเพิ่มเติม แต่ละทางเลือกมีข้อดีข้อเสียในด้านความเป็นส่วนตัว ความเร็ว ความหลากหลายของโมเดล และนโยบายเกี่ยวกับเนื้อหา
ประเด็นถกเถียงเกี่ยวกับเนื้อหา AI ที่ไม่ผ่านการเซ็นเซอร์: จริยธรรมและ CSAM
คุณไม่สามารถเขียนเกี่ยวกับ Unstable Diffusion ได้โดยปราศจากประเด็นด้านจริยธรรม มีปัญหาหลักสามประการที่เกิดขึ้นซ้ำๆ และแต่ละปัญหาก็มีเหตุการณ์จริงที่เกี่ยวข้อง
เริ่มจากภาพที่ไม่ได้ยินยอมก่อน กรณีสำคัญคือเรื่องอื้อฉาวของ Atrioc เมื่อวันที่ 30 มกราคม 2023 Brandon Ewing สตรีมเมอร์บน Twitch เผลอเปิดเผยแท็บเบราว์เซอร์ระหว่างการถ่ายทอดสดของเขาเอง แท็บนั้นคือเว็บไซต์เสียเงินที่ขายภาพลามกอนาจารแบบ deepfake ของเพื่อนร่วมงานของเขา ได้แก่ Pokimane, QTCinderella, Maya Higa และ Sweet Anita เขาขอโทษต่อหน้ากล้องในวันรุ่งขึ้น และมีรายงานว่าเขาโอนเงิน 60,000 ดอลลาร์เพื่อจ่ายค่าใช้จ่ายทางกฎหมายในการลบเนื้อหาให้กับสตรีมเมอร์ที่ได้รับผลกระทบ Twitch ได้อัปเดตข้อกำหนดอย่างเงียบๆ ในเดือนมีนาคม 2023 เพื่อแบนผู้ที่สร้างเนื้อหา deepfake อย่างถาวร เหตุการณ์เดียวนี้กลับทำให้การเผยแพร่ซอฟต์แวร์โอเพนซอร์สเข้าสู่กระแสหลักมากกว่าการถกเถียงเรื่องนโยบายทางเทคนิคใดๆ ที่เคยมีมา
ทีนี้มาถึงปัญหาเรื่องชุดข้อมูล ในเดือนธันวาคม 2023 Stanford Internet Observatory ได้นำชุดข้อมูลฝึกฝน LAION-5B ไปตรวจสอบด้วย PhotoDNA และพบภาพล่วงละเมิดทางเพศเด็กที่ได้รับการยืนยันแล้วจำนวน 1,008 ภาพ ชุดข้อมูล LAION-5B เป็นชุดข้อมูลเดียวกับที่ใช้ฝึกฝน Stable Diffusion 1.5 LAION จึงได้ถอนชุดข้อมูลนี้ออกและปล่อยชุดข้อมูล Re-LAION-5B ที่แก้ไขแล้วในเดือนสิงหาคม 2024 ปัญหาคือ โมเดลทุกตัวที่ฝึกฝนด้วยชุดข้อมูลดั้งเดิมนั้นได้รับผลกระทบจากการปนเปื้อนนี้ รวมถึง SD 1.5 ด้วย และระบบการปรับแต่ง NSFW ทั้งหมดที่สร้างขึ้นบนชุดข้อมูลนี้ก็ได้รับผลกระทบเช่นกัน บางเวอร์ชันได้ทำการฝึกฝนใหม่หรือตรวจสอบความถูกต้องแล้ว แต่บางเวอร์ชันก็ยังคงปล่อยเวอร์ชันเดิมออกมา หากคุณเป็นผู้ซื้อ โปรดตรวจสอบว่าชุดข้อมูลใดที่ใช้ฝึกฝนโมเดลในแต่ละเวอร์ชัน อย่าเชื่อคำพูดของผู้ให้บริการเพียงอย่างเดียว
ประเด็นที่สามคือเงาของกฎระเบียบ ผู้ให้บริการประมวลผลการชำระเงินรายใหญ่ทุกรายในปี 2026 ถือว่าภาพผู้ใหญ่ที่สร้างโดย AI เป็นความเสี่ยงสูง ผู้ให้บริการประมวลผลบัตรของ CivitAI ได้ระงับบริการเมื่อวันที่ 23 พฤษภาคม 2025 เนื่องจากมีการเปิดเผยภาพที่ไม่เหมาะสม และเว็บไซต์ก็เปลี่ยนไปใช้ระบบคริปโตเคอร์เรนซีในชั่วข้ามคืน Stability AI ได้อัปเดตนโยบายการใช้งานที่ยอมรับได้เมื่อวันที่ 31 กรกฎาคม 2025 เพื่อห้ามการสร้างภาพที่โจ่งแจ้งในโมเดลปัจจุบัน นโยบายใหม่นี้ไม่ได้ครอบคลุม SD 1.5 หรือ SDXL ย้อนหลัง ซึ่งยังคงเป็นแกนหลักของชุมชน NSFW กฎหมาย AI ของสหภาพยุโรปและกฎหมายของรัฐต่างๆ ในสหรัฐอเมริกาจำนวนมากในปัจจุบันกำหนดให้ต้องเปิดเผยข้อมูลเมื่อเนื้อหาที่สร้างโดย AI แสดงภาพมนุษย์ที่สมจริง ดังนั้นใครก็ตามที่ใช้ AI ที่ไม่ถูกเซ็นเซอร์ในเชิงพาณิชย์ในปัจจุบันจึงดำเนินการอยู่ภายในกรอบกฎหมายที่ไม่มีอยู่เมื่อ Unstable Diffusion เปิดตัว
เรื่องพวกนี้ไม่ได้ทำให้เทคโนโลยีนี้ล้มเหลว เพียงแต่หมายความว่าคนที่สร้าง โฮสต์ และใช้งานเทคโนโลยีนี้ในปัจจุบันจะต้องรับผิดชอบเรื่องการขอความยินยอม ความถูกต้องของชุดข้อมูล และการเปิดเผยข้อมูล ซึ่งในระยะแรกๆ นั้นไม่ค่อยมีใครให้ความสำคัญเท่าไหร่

ทางเลือกอื่นนอกเหนือจาก Unstable Diffusion ในปี 2026: FLUX, Pony, Kling
การแพร่กระจายที่ไม่เสถียร (Unstable Diffusion) ไม่ใช่จุดศูนย์กลางอีกต่อไปแล้ว รูปแบบและแผนที่แพลตฟอร์มได้เปลี่ยนแปลงไปอย่างมากนับตั้งแต่เกิดเรื่องอื้อฉาวของ Discord ในปี 2022 ผู้ที่ทำงานด้าน AI ที่จริงจังและปราศจากการเซ็นเซอร์ในปี 2026 ต่างมองหาทางเลือกอื่นก่อน ทางเลือกที่แข็งแกร่งที่สุดแบ่งออกเป็นสามกลุ่ม
กลุ่มแรก: ไฟล์ตรวจสอบความถูกต้องแบบเปิดน้ำหนักที่ไม่มีการเซ็นเซอร์ ซึ่งคุณสามารถรันบนเครื่องของคุณเองได้ Pony Diffusion V6 XL เปิดตัวใน CivitAI ในเดือนมกราคม 2024 และกลายเป็นไฟล์ปรับแต่ง SDXL สำหรับเนื้อหา NSFW ที่เป็นมาตรฐานอย่างรวดเร็ว มันถูกสร้างและเผยแพร่ทั้งหมดนอกเหนือจากกระบวนการ Unstable Diffusion Pony และ Illustrious รุ่นใหม่กว่านั้นครองตลาดไฟล์ภาพสำหรับผู้ใหญ่ที่มีสไตล์ ไฟล์ตรวจสอบความถูกต้องที่ฝึกฝนมาสำหรับอนิเมะและไฟล์ปรับแต่ง SDXL ต่างๆ เติมเต็มช่องว่างเดียวกันด้วยสุนทรียภาพที่แตกต่างกัน เพื่อให้สามารถใช้งานได้อย่างราบรื่น คุณต้องมี GPU ในเครื่องที่มี VRAM อย่างน้อย 12 GB
กลุ่มที่สอง: โมเดลพื้นฐานรุ่นต่อไป FLUX.1 จาก Black Forest Labs เปิดตัวในเดือนสิงหาคม 2024 และยกระดับมาตรฐานด้านความรวดเร็วในการตอบสนองและความสมจริงของภาพ FLUX.1-dev ซึ่งเป็นรุ่นที่มีน้ำหนักเบาและรองรับการแสดงผลหลายรูปแบบ ได้รับความนิยมอย่างมากจากชุมชนภายในไม่กี่สัปดาห์ Stability AI ได้เปิดตัว Stable Diffusion 3 ในเดือนกุมภาพันธ์ 2024 และ Stable Diffusion 3.5 เวอร์ชันที่ใหญ่กว่าในเดือนตุลาคม 2024 แต่บั๊กด้านกายวิภาคที่พบได้ทั่วไปใน SD3 ทำให้การใช้งานในกลุ่มผู้ใช้ที่ไม่เซ็นเซอร์ลดลง Stability AI เองก็ถอยออกไป Emad Mostaque ลาออกเมื่อวันที่ 23 มีนาคม 2024 ท่ามกลางวิกฤตทางการเงิน การอัปเดตนโยบายในเดือนกรกฎาคม 2025 ห้ามการสร้างภาพอนาจารบนโมเดลปัจจุบันอย่างเป็นทางการ
กลุ่มที่สาม: วิดีโอ ยุคของ AI สร้างภาพแบบภาพนิ่งอย่างเดียวเริ่มจางหายไปบ้างแล้ว Kling, Runway Gen-3 และ Gen-4, Sora ของ OpenAI, Veo ของ Google ต่างก็ผลักดันขอบเขตไปสู่การสร้างวิดีโอ และหลายๆ ตัวอนุญาตให้แสดงเนื้อหาสำหรับผู้ใหญ่ได้โดยมีการตรวจสอบอายุบนโฮสต์ของบุคคลที่สาม Unstable Diffusion ไม่เคยพัฒนาไปสู่วิดีโอในระดับที่เทียบเท่าได้เลย นี่เป็นส่วนหนึ่งที่ทำให้ความสำคัญทางวัฒนธรรมของมันลดลงอย่างเงียบๆ ตั้งแต่ปี 2023
ตารางด้านล่างนี้เปรียบเทียบตัวเลือกหลักต่างๆ
| เครื่องมือ | พิมพ์ | ในพื้นที่หรือบนเซิร์ฟเวอร์ | มีความสามารถ NSFW | เหมาะที่สุดสำหรับ |
|---|---|---|---|---|
| การแพร่กระจายที่ไม่เสถียร (ดิสคอร์ด) | ชุมชน + จุดตรวจ | ท้องถิ่น | ใช่ | ฟรี ทำเองได้ |
| ความไม่เสถียร.ai | แพลตฟอร์มเว็บ | โฮสต์ | ใช่ (มีรั้วกั้น) | บริการโฮสติ้งที่ใช้งานง่ายและไม่มีการเซ็นเซอร์ |
| Pony Diffusion v6 + | จุดตรวจเปิด | ท้องถิ่น | ใช่ | งานศิลปะสำหรับผู้ใหญ่ในรูปแบบเฉพาะ |
| ฟลักซ์.1-เดฟ | รุ่นพื้นฐาน + การปรับแต่งเพิ่มเติม | ในพื้นที่หรือบนเซิร์ฟเวอร์ | ด้วยการปรับแต่งอย่างละเอียด | คุณภาพดีที่สุดในยุคปี 2024 |
| SDXL + จุดตรวจสอบ CivitAI | ฐาน + ชุมชน | ในพื้นที่หรือบนเซิร์ฟเวอร์ | ด้วยการปรับแต่งอย่างละเอียด | หลากหลายสไตล์ |
| คลิง 2.0 | เครื่องกำเนิดวิดีโอ | โฮสต์ | จำกัด, มีรั้วกั้น | คลิปสั้นแบบไม่เซ็นเซอร์ |
การเลือกที่เหมาะสมนั้นขึ้นอยู่กับว่าคุณมี GPU มากแค่ไหน คุณให้ความสำคัญกับการโฮสต์หรือการจัดการเองมากแค่ไหน และคุณต้องการภาพนิ่งหรือวิดีโอ ไม่มีสิ่งใดทดแทนประสบการณ์ดั้งเดิมของ Unstable Diffusion ได้อย่างสมบูรณ์แบบ ตลาดได้แตกแขนงออกไป และแบรนด์นี้ไม่ได้ครองตลาดเหมือนเมื่อก่อนอีกแล้วเหมือนในช่วงปีที่ระดมทุนผ่าน Kickstarter