ما هو برنامج Viggle AI؟ أداة صنع الميمات والرسوم المتحركة التي انتشرت بشكل واسع
قام أحدهم بإضافة شخصية من صورة جاهزة إلى رقصة في لعبة فورتنايت، وبدا الأمر... رائعًا. ليس رائعًا بمعنى "جيد للذكاء الاصطناعي"، بل رائعًا حقًا. حركة سلسة، وفيزياء منطقية. تغير وزن الشخصية بشكل طبيعي أثناء دورانها، وتحركت ملابسها كقماش حقيقي، واستغرق الأمر دقيقتين فقط لإنجازه. انتشر هذا الفيديو على تويتر في أوائل عام ٢٠٢٤، وفي غضون أسبوع، أصبح الجميع يتحدث عن تقنية Viggle AI.
شاهدتُ المقطع، وظننتُ أنه محتوى تسويقي مُنتقى بعناية، فقررتُ تجربته بنفسي. حمّلتُ صورة، واخترتُ قالب حركة رقص، وانتظرتُ حوالي تسعين ثانية. كانت النتيجة غير مثالية، لكنها مُبهرة حقًا. الشخصية من صورتي كانت ترقص. بتقنية ثلاثية الأبعاد. مع مراعاة قوانين الفيزياء. مجانًا. على بوت ديسكورد. في تلك اللحظة أدركتُ أن هذه الأداة مُختلفة عن الضجة الإعلامية المُعتادة لفيديوهات الذكاء الاصطناعي.
انطلقت منصة Viggle من الصفر إلى 1.6 مليون عضو على منصة Discord في أقل من عام. وأصبحت المحرك الرئيسي لنصف محتوى الميمات المُنتجة بالذكاء الاصطناعي على وسائل التواصل الاجتماعي في عام 2024. وتُمثل التقنية التي تقف وراءها، وهي نموذج يُسمى JST-1، والذي يفهم فيزياء الأبعاد الثلاثية بدلاً من مجرد مطابقة أنماط البكسلات ثنائية الأبعاد، نقلة نوعية في مجال فيديوهات الذكاء الاصطناعي. تتناول هذه المقالة ماهية Viggle، وكيفية عمل JST-1، وكيفية استخدام الأداة خطوة بخطوة، ومقارنتها بالشركات الرائدة في مجال إنتاج فيديوهات الذكاء الاصطناعي.

ما هو برنامج Viggle AI ولماذا هو مهم؟
Viggle AI هي منصة لتحريك الشخصيات، حيث تقوم بتحويل صورة ثابتة لشخص أو شخصية إلى صورة متحركة. ليس بالطريقة التقليدية التي تعتمدها معظم أدوات الذكاء الاصطناعي، والتي تعتمد على تكبير وتصغير الصورة وتحريكها. بل تُولّد Viggle حركة ثلاثية الأبعاد حقيقية. تدور الشخصية، وتمشي، وترقص، وتقفز، وتراعي حركتها قوانين الفيزياء: الجاذبية، وانتقال الوزن، وحركة القماش، والزخم.
تأسست الشركة على يد فريق متخصص في مجال رؤية الحاسوب والنمذجة ثلاثية الأبعاد. وقد قاموا بتطوير JST-1، اختصارًا لـ Joint Space-Time (الزمكان المشترك)، ويصفونه بأنه "أول نموذج أساسي ثلاثي الأبعاد للفيديو يستند إلى فهم حقيقي للفيزياء". هذا الادعاء جدير بالتوضيح لأنه ما يميز Viggle عن غيرها من الشركات في فئتها.
تعتمد معظم أدوات الفيديو المدعومة بالذكاء الاصطناعي (مثل Runway Gen-3 وPika وKling) على التنبؤ بشكل الإطار التالي بناءً على الإطار السابق، وذلك في فضاء ثنائي الأبعاد (بكسل). يبدو الناتج جيدًا إلى أن يحتاج أحد الشخصيات إلى الالتفاف جانبًا، أو التفاعل مع جسم ما، أو التحرك بطريقة لم تغطها بيانات التدريب. حينها تبدأ الأمور بالغرابة: تتداخل الأطراف مع الأجسام، وتتغير النسب، ويتوقف تأثير الجاذبية.
يتبع برنامج JST-1 نهجًا مختلفًا. فهو يعيد بناء تمثيل ثلاثي الأبعاد للشخصية من الصورة المدخلة، ويفهم هيكلها العظمي، ثم يحرك هذا النموذج ثلاثي الأبعاد وفقًا لقوانين الفيزياء قبل عرض الفيديو النهائي ثنائي الأبعاد. تتمتع الشخصية بحجم ووزن ومفاصل. فعندما ترقص، تدفع قدميها الأرض بالقوة المناسبة. وعندما تستدير، يتغير المنظور بشكل صحيح لأن النموذج يدرك أن للشخصية ظهرًا، وليس مجرد مقدمة.
هل الناتج مثالي؟ لا. لا تزال المشاهد المعقدة تُنتج بعض التشوهات. التفاعلات بين عدة شخصيات غير موثوقة. ويعمل النموذج بشكل أفضل مع شخصيات الرسوم المتحركة والأنمي مقارنةً بالبشر الواقعيين. لكن بالنسبة لتحريك شخصية واحدة من صورة ثابتة، يُنتج Viggle نتائج لم أرَ مثيلًا لها في أي أداة أخرى متاحة للمستخدمين بهذا السعر. وهو مجاني.
كيفية استخدام Viggle AI: دليل خطوة بخطوة
يعمل تطبيق Viggle من خلال منصتين: تطبيق ويب وبوت ديسكورد. كان بوت ديسكورد هو المنصة الأساسية التي ظهرت أولاً، ولا يزال الواجهة الرئيسية للتواصل مع المستخدمين. إليك شرحًا لكيفية عمل كل ميزة من الميزات الأساسية.
ميكس: الحدث الرئيسي
خاصية المزج هي ما جعل تطبيق Viggle ينتشر بسرعة. كل ما عليك فعله هو إدخال عنصرين: صورة شخصية وفيديو متحرك. يقوم Viggle باستخراج الشخصية من الصورة، وربطها بالحركة من الفيديو، ثم يعرض النتيجة.
خطوة بخطوة: افتح تطبيق Viggle على الويب أو Discord. استخدم الأمر /mix. حمّل صورة واضحة لشخصية (شخص واحد، جسم ظاهر، إضاءة جيدة). حمّل مقطع فيديو قصيرًا بالحركة التي تريدها (رقصة، مشية، إيماءة). اختر خلفيتك: شاشة خضراء، بيضاء، أو الخلفية الأصلية. اضغط على "إنشاء". انتظر من 60 إلى 120 ثانية. ستحصل على فيديو لشخصيتك وهي تؤدي الحركة من المقطع المرجعي.
تعتمد النتائج بشكل كبير على مدخلاتك. تُعطي صور الشخصيات الواضحة ذات الأطراف الظاهرة أفضل النتائج. أما الخلفيات غير الواضحة، أو أجزاء الجسم المخفية، أو الزوايا الحادة، فتُربك النموذج. تُعطي مقاطع الفيديو المتحركة أفضل النتائج عندما تُظهر شخصًا واحدًا يقوم بحركات واضحة ومميزة. الإيماءات الدقيقة أصعب من الرقصات الكبيرة.
تحريك: تحريك مع الحفاظ على الخلفية
يشبه Move خاصية Mix ولكنه يحتفظ بخلفية الشخصية الأصلية. ما عليك سوى تحميل صورة للشخصية، أو تحميل فيديو متحرك، وسيقوم النظام بتحريك الشخصية مع الحفاظ على المشهد الذي تقف فيه. يُفيد هذا عند الرغبة في إضافة سياق: شخص على مكتبه يبدأ فجأة بالرقص، أو شخصية في حديقة عامة تلوّح بيدها.
ابتكر وصمم
يُنشئ برنامج Ideate أفكارًا للفيديوهات من خلال نصوص مُحددة. صف ما تُريده، وسيقوم البرنامج بإنتاج الفيديو. أما برنامج Stylize فيُتيح لك تغيير النمط المرئي لشخصية أو رسم متحرك موجود. كلا البرنامجين أكثر تجريبية من برنامجي Mix وMove، ونتائجهما أقل قابلية للتنبؤ.
الأمر /character
يتيح لك هذا إنشاء شخصية ثابتة يمكنك إعادة استخدامها في العديد من الرسوم المتحركة. ما عليك سوى تحميل الصورة مرة واحدة، وحفظها كشخصية، والرجوع إليها في عمليات المزج اللاحقة دون الحاجة إلى إعادة تحميلها في كل مرة. بالنسبة لمنشئي المحتوى الذين يصممون شخصية متكررة (تميمة، أو صورة رمزية، أو رمز علامة تجارية)، يوفر هذا وقتًا ثمينًا.
تسعير Viggle: ما هو مجاني وما هو مدفوع
يستخدم تطبيق Viggle نموذجًا مجانيًا مع خيارات مدفوعة، والمستوى المجاني سخي بشكل مدهش مقارنة بمعظم أدوات الفيديو التي تعمل بالذكاء الاصطناعي.
| ميزة | حر | غالي |
|---|---|---|
| أجيال في اليوم | محدود (يختلف) | حدود أعلى |
| أولوية قائمة الانتظار | قياسي (قد يكون بطيئًا) | معالجة ذات أولوية |
| مدة الفيديو | حتى 30 ثانية | حتى 30 ثانية |
| دقة | معيار | جودة أعلى |
| العلامة المائية | نعم | تمت إزالته |
| الحقوق التجارية | نعم (بدون حقوق ملكية) | نعم (بدون حقوق ملكية) |
| شخصيات متعددة | قوالب فقط | خيارات إضافية |
يُعدّ بند الحقوق التجارية جديرًا بالملاحظة. تُصرّح Viggle بأنّ المحتوى المُنشأ "خالٍ تمامًا من حقوق الملكية" مع "حقوق استخدام تجارية كاملة لكل فيديو تقوم بإنشائه". وهذا أمرٌ غير معتاد. فمعظم منصات الفيديو المدعومة بالذكاء الاصطناعي إما تُقيّد الاستخدام التجاري في المستويات المجانية أو تفرض رسومًا على تراخيص المؤسسات. بينما تُتيح لك Viggle استخدام المُخرجات لأغراض التسويق، أو وسائل التواصل الاجتماعي، أو أي غرض تجاري آخر دون أي رسوم إضافية.
تغيرت أسعار الاشتراك المميز بمرور الوقت وتختلف باختلاف المنطقة. يُرجى مراجعة موقع viggle.ai مباشرةً للاطلاع على الأسعار الحالية. عند آخر مراجعة لي، كان سعر الاشتراك المدفوع أقل من 20 دولارًا شهريًا، وكان يشمل بشكل أساسي إزالة العلامات المائية، وتعزيز أولوية قائمة الانتظار، وزيادة حدود الإنتاج اليومية.
فيجل ضد رانوي ضد بيكا ضد كلينج: أين يندرج؟
لقد ازدحم مجال توليد الفيديو بالذكاء الاصطناعي بسرعة. إليك موقع Viggle مقارنةً بالأدوات التي يقارنها بها معظم الناس.
| أداة | الأفضل في | الفيزياء/ثلاثية الأبعاد | التسعير | تحريك الشخصيات |
|---|---|---|---|---|
| فيغل للذكاء الاصطناعي | حركة شخصية واحدة، ميمات | JST-1 (فيزياء ثلاثية الأبعاد) | مجاني + مدفوع | ممتاز |
| المدرج من الجيل الثالث | إنتاج الفيديو السينمائي | التنبؤ بالبكسل ثنائي الأبعاد | 12-76 دولارًا شهريًا | معتدل |
| بيكا | مقاطع فيديو سريعة وأنيقة | التنبؤ بالبكسل ثنائي الأبعاد | مجاني + 8-58 دولارًا شهريًا | أساسي |
| كلينج إيه آي | فيديو أطول، مزامنة الشفاه | ثنائي الأبعاد مع بعض الأبعاد الثلاثية | مجاني + مدفوع | جيد |
| برنامج Animate Anyone (مفتوح المصدر) | نقل الوضعيات بجودة بحثية | الانتشار ثنائي الأبعاد | مجاني (مُستضاف ذاتيًا) | جيد لكنه تقني |
لا تسعى Viggle لمنافسة Runway من حيث الجودة السينمائية، ولا تحاول استبدال Pika في مقاطع الفيديو القصيرة على وسائل التواصل الاجتماعي. تخصصها هو تحريك الشخصيات تحديدًا: تحويل صورة ثابتة لشخص أو شخصية إلى حركة واقعية. في هذا المجال تحديدًا، يمنحها فهم JST-1 للفيزياء ميزة لا تستطيع الأدوات القائمة على البكسل مجاراتها.
نقاط ضعف Viggle: لا يمكنه إنشاء فيديو من الصفر كما تفعل Runway أو Pika. أنت بحاجة إلى صورة إدخال ومرجع للحركة. إنه تحريك، وليس إنشاء. مدة الفيديو الناتج محدودة بـ 30 ثانية. ويعمل حاليًا بشكل أفضل مع الشخصيات المرسومة أو الكرتونية. أحيانًا تصل الشخصيات البشرية الواقعية إلى منطقة "الوادي الغريب" حيث يُحدث إعادة البناء ثلاثي الأبعاد تشوهات طفيفة في ملامح الوجه وملمس البشرة.
ما يميز Viggle: جودة الحركة فيه لا تُضاهى في هذه الفئة السعرية. فاستخدام Viggle مجانًا مع إدخال بيانات جيد يُنتج حركة أكثر واقعية من تلك التي يُنتجها اشتراك Runway الذي يكلف 76 دولارًا شهريًا لتحريك الشخصيات. والسبب هو أن نموذج Viggle يفهم الفضاء ثلاثي الأبعاد، بينما تعتمد النماذج الأخرى على التخمين من خلال أنماط ثنائية الأبعاد.

استخدامات Viggle الفعلية: حالات الاستخدام الحقيقية
إن استخدام الميمات هو ما أوصل Viggle إلى 1.6 مليون عضو في Discord، ولكن هناك تطبيقات عملية أكثر.
يستخدم صناع المحتوى هذه التقنية لتحريك شخصياتهم أو صورهم الرمزية على مواقع التواصل الاجتماعي. فبإمكان مستخدم يوتيوب الذي يستخدم شخصية كرتونية أن يجعل تلك الشخصية ترقص أو تلوّح أو تتفاعل في مقاطع الفيديو دون الحاجة إلى الاستعانة بمصمم رسوم متحركة. كما يقوم مستخدمو تيك توك بتحويل صورهم إلى شخصيات تؤدي رقصات رائجة. وبفضل سرعة إنجاز الفيديو، التي تقل عن دقيقتين لكل مقطع، أصبح من الممكن إنتاج محتوى رسوم متحركة يوميًا.
تستخدمه الشركات الصغيرة والمسوقون لإنشاء رسوم متحركة ترويجية سريعة. يمكن لمطعم التقاط صورة لشعاره وجعله يرقص في إعلان على وسائل التواصل الاجتماعي. كما يمكن لعلامة تجارية للتجارة الإلكترونية تحريك شخصية منتج لتسليط الضوء على قصة مميزة. وبفضل تكلفته المجانية وترخيصه التجاري، أصبح في متناول الشركات التي لا تستطيع تحمل تكاليف استوديوهات تصميم الرسوم المتحركة.
يستخدم مطورو الألعاب المستقلون وفنانو القصص المصورة هذه التقنية لإنشاء نماذج أولية. قبل الاستثمار في الرسوم المتحركة الكاملة، يمكنهم اختبار مظهر الشخصية أثناء الحركة. هل الوضعية مناسبة؟ هل تعكس الحركة المشاعر؟ تقدم Viggle إجابة سريعة وتقريبية.
التعليم مثالٌ لم أتوقعه، لكنه منطقي. يستخدم المعلمون ومصممو المناهج شخصيات كرتونية متحركة في فيديوهات الشرح، ما يجعلها أكثر جاذبية من الصور الثابتة في العروض التقديمية. فمثلاً، شخصية تُشير أثناء شرح عملية التمثيل الضوئي تجذب انتباه طفل في الثانية عشرة من عمره لفترة أطول من النصوص والأسهم. رأيتُ مُدرّسي لغات على تيك توك يستخدمون تطبيق Viggle لإنشاء شخصيات متحركة تُوضّح التحيات في ثقافات مختلفة. إنه تطبيق إبداعي، سهل الاستخدام، وفعّال.
القيود والأمور التي يجب الانتباه إليها
برنامج Viggle مثير للإعجاب، لكن له حدود حقيقية.
يدعم البرنامج صور البشر، لكن من الواضح أن النموذج مُحسَّن للشخصيات المرسومة. نتائج الواقعية الفوتوغرافية متفاوتة، فالوجوه أحيانًا تبدو غريبة وغير واقعية. أما الأيدي، فهي تتحسن، لكنها لا تزال نقطة ضعف جميع أدوات الذكاء الاصطناعي للفيديو.
يعني الحد الأقصى للمدة وهو 30 ثانية أنه لا يمكنك إنشاء محتوى طويل. لأي شيء يتجاوز مقطعًا قصيرًا، ستحتاج إلى دمج عدة مقاطع فيديو معًا.
الخصوصية مصدر قلق مشروع. أنت تقوم بتحميل صور وفيديوهات إلى خدمة سحابية. وقد ناقش منتدى الخصوصية على موقع Reddit ممارسات Viggle المتعلقة بالبيانات، ورغم أن الشركة قد طبقت نظامًا لمراقبة المحتوى ووضع علامات C2PA على البيانات الوصفية لضمان التتبع، إلا أنه ينبغي عليك التفكير مليًا قبل تحميل صور شخصية حساسة، وخاصةً صور الآخرين دون موافقتهم. فاحتمالية التزييف العميق واضحة، والمسؤولية الأخلاقية تقع على عاتق المستخدم.
عدم وجود واجهة برمجة تطبيقات (API) يعني عدم وجود سير عمل آلي. إذا كنت ترغب في دمج Viggle في منتج أو إنشاء مئات الرسوم المتحركة برمجيًا، فلن تتمكن من ذلك حاليًا. كل شيء يتم يدويًا عبر تطبيق الويب أو Discord.
لا يوجد حتى الآن تطبيق جوال يُحاكي جميع الميزات. يوجد تطبيق لنظام iOS، لكنه نسخة مُبسطة تُركز على قوالب الميمات بدلاً من سير عمل Mix/Move الكامل. كما أن الاعتماد على Discord، رغم كونه جزءًا من بناء المجتمع، يُسبب صعوبة للمستخدمين الذين لا يستخدمون Discord. فالاضطرار إلى الانضمام إلى خادم، وتعلم أوامر الشرطة المائلة، والانتظار في قائمة انتظار عامة، ليس تجربة استخدام طبيعية. يُساعد تطبيق الويب، لكنه لا يزال قيد التطوير ويفتقر إلى بعض الميزات.