Τι είναι το Viggle AI; Το εργαλείο δημιουργίας meme και animation που έγινε viral
Κάποιος έριξε έναν χαρακτήρα από μια φωτογραφία αρχείου σε έναν χορό Fortnite και φαινόταν... καλό. Όχι "καλό για την Τεχνητή Νοημοσύνη". Στην πραγματικότητα καλό. Ομαλή κίνηση. Φυσική που είχε νόημα. Το βάρος του χαρακτήρα μετατοπιζόταν φυσικά όταν περιστρέφονταν, τα ρούχα τους κινούνταν σαν αληθινό ύφασμα και όλο αυτό χρειάστηκε περίπου δύο λεπτά για να γίνει. Αυτό το βίντεο κυκλοφόρησε στο Twitter στις αρχές του 2024 και μέσα σε μια εβδομάδα όλοι μιλούσαν για την Τεχνητή Νοημοσύνη του Viggle.
Είδα το κλιπ, υπέθεσα ότι ήταν επιλεγμένο περιεχόμενο μάρκετινγκ και πήγα να το δοκιμάσω κι εγώ. Ανέβασα μια φωτογραφία, διάλεξα ένα πρότυπο κίνησης χορού, περίμενα περίπου ενενήντα δευτερόλεπτα. Το αποτέλεσμα ήταν ατελές αλλά πραγματικά εντυπωσιακό. Ο χαρακτήρας από τη φωτογραφία μου χόρευε. Σε 3D. Με φυσική. Δωρεάν. Σε ένα bot Discord. Αυτή ήταν η στιγμή που συνειδητοποίησα ότι αυτό το εργαλείο ήταν διαφορετικό από τη συνηθισμένη διαφημιστική εκστρατεία για βίντεο με τεχνητή νοημοσύνη.
Το Viggle έφτασε από μηδέν σε 1,6 εκατομμύρια μέλη στο Discord σε λιγότερο από ένα χρόνο. Έγινε η μηχανή πίσω από το μισό περιεχόμενο meme με τεχνητή νοημοσύνη στα μέσα κοινωνικής δικτύωσης το 2024. Και η τεχνολογία πίσω από αυτό, ένα μοντέλο που ονομάζεται JST-1 που κατανοεί στην πραγματικότητα τη φυσική 3D και όχι απλώς την αντιστοίχιση μοτίβων 2D pixel, αντιπροσωπεύει κάτι πραγματικά νέο στον χώρο του βίντεο με τεχνητή νοημοσύνη. Αυτό το άρθρο καλύπτει τι είναι το Viggle, πώς λειτουργεί το JST-1, πώς να χρησιμοποιήσετε το εργαλείο βήμα προς βήμα και πώς συγκρίνεται με τα μεγαλύτερα ονόματα στην παραγωγή βίντεο με τεχνητή νοημοσύνη.

Τι είναι η Τεχνητή Νοημοσύνη του Viggle και γιατί έχει σημασία
Το Viggle AI είναι μια πλατφόρμα animation χαρακτήρων που λαμβάνει μια στατική εικόνα ενός ατόμου ή χαρακτήρα και την κάνει να κινείται. Όχι με τον άκομψο τρόπο "ζουμ και μετατόπιση σε μια φωτογραφία" που κάνουν τα περισσότερα εργαλεία AI. Το Viggle δημιουργεί πραγματική τρισδιάστατη κίνηση. Ο χαρακτήρας γυρίζει, περπατάει, χορεύει, πηδάει και η κίνηση σέβεται τους φυσικούς κανόνες: βαρύτητα, μεταφορά βάρους, ράψιμο υφάσματος, ορμή.
Η εταιρεία ιδρύθηκε από μια ομάδα με υπόβαθρο στην υπολογιστική όραση και την τρισδιάστατη μοντελοποίηση. Κατασκεύασαν το JST-1, που σημαίνει Joint Space-Time (Κοινός Χωροχρόνος), και το περιγράφουν ως «το πρώτο μοντέλο βάσης βίντεο-3D που συνοδεύεται από πραγματική κατανόηση της φυσικής». Αυτός ο ισχυρισμός αξίζει να αναλυθεί, επειδή είναι αυτό που διαφοροποιεί το Viggle από οτιδήποτε άλλο στην κατηγορία του.
Τα περισσότερα εργαλεία βίντεο AI (Runway Gen-3, Pika, Kling) δημιουργούν βίντεο προβλέποντας πώς θα πρέπει να μοιάζει το επόμενο καρέ με βάση το προηγούμενο. Δουλεύουν σε δισδιάστατο χώρο εικονοστοιχείων. Η έξοδος φαίνεται καλή μέχρι που ένας χαρακτήρας χρειάζεται να γυρίσει στο πλάι, να αλληλεπιδράσει με ένα αντικείμενο ή να κινηθεί με τρόπο που δεν καλύπτουν τα δεδομένα εκπαίδευσης. Τότε τα πράγματα γίνονται περίεργα: τα άκρα περνούν από τα σώματα, οι αναλογίες αλλάζουν, η βαρύτητα σταματά να λειτουργεί.
Το JST-1 υιοθετεί μια διαφορετική προσέγγιση. Ανακατασκευάζει μια τρισδιάστατη αναπαράσταση του χαρακτήρα από την εικόνα εισόδου, κατανοεί τη σκελετική δομή του χαρακτήρα και στη συνέχεια ζωντανεύει αυτό το τρισδιάστατο μοντέλο σύμφωνα με τους κανόνες της φυσικής πριν από την απόδοση της τελικής εξόδου βίντεο 2D. Ο χαρακτήρας έχει όγκο, βάρος και αρθρώσεις. Όταν χορεύει, τα πόδια του σπρώχνονται από το έδαφος με τη σωστή δύναμη. Όταν γυρίζει, η προοπτική μετατοπίζεται σωστά επειδή το μοντέλο γνωρίζει ότι ο χαρακτήρας έχει πλάτη, όχι μόνο μπροστινό μέρος.
Είναι η απόδοση τέλεια; Όχι. Οι σύνθετες σκηνές εξακολουθούν να παράγουν αντικείμενα. Οι αλληλεπιδράσεις πολλαπλών χαρακτήρων είναι αναξιόπιστες. Και το μοντέλο λειτουργεί καλύτερα με χαρακτήρες κινουμένων σχεδίων και anime παρά με φωτορεαλιστικούς ανθρώπους. Αλλά για την κίνηση ενός χαρακτήρα από μια στατική εικόνα, το Viggle παράγει αποτελέσματα που δεν έχω δει να συγκρίνονται με κανένα άλλο εργαλείο καταναλωτών σε αυτήν την τιμή. Το οποίο είναι δωρεάν.
Πώς να χρησιμοποιήσετε το Viggle AI: οδηγός βήμα προς βήμα
Το Viggle λειτουργεί σε δύο μέρη: ως εφαρμογή ιστού και ως bot του Discord. Το bot του Discord εμφανίστηκε πρώτο και εξακολουθεί να είναι η κύρια διεπαφή για την κοινότητα. Δείτε πώς λειτουργεί κάθε βασική λειτουργία.
Μίξη: το κύριο γεγονός
Η μίξη ήταν αυτό που έκανε το Viggle να γίνει viral. Δίνετε δύο εισόδους: μια εικόνα χαρακτήρα και ένα βίντεο κίνησης. Το Viggle εξάγει τον χαρακτήρα από την εικόνα σας, τον αντιστοιχίζει στην κίνηση από το βίντεο και αποδίδει το αποτέλεσμα.
Βήμα προς βήμα: ανοίξτε την εφαρμογή web Viggle ή το Discord. Χρησιμοποιήστε την εντολή /mix. Ανεβάστε μια καθαρή εικόνα ενός χαρακτήρα (ένα άτομο, ορατό σώμα, καλός φωτισμός). Ανεβάστε ένα σύντομο βίντεο με την κίνηση που θέλετε (έναν χορό, μια βόλτα, μια χειρονομία). Επιλέξτε το φόντο σας: πράσινη οθόνη, λευκό ή πρωτότυπο. Πατήστε "Δημιουργία". Περιμένετε 60-120 δευτερόλεπτα. Θα λάβετε ένα βίντεο του χαρακτήρα σας να εκτελεί την κίνηση από το κλιπ αναφοράς.
Τα αποτελέσματα εξαρτώνται σε μεγάλο βαθμό από τα πληκτρολόγιά σας. Οι καθαρές εικόνες χαρακτήρων με ορατά άκρα λειτουργούν καλύτερα. Τα ακατάστατα φόντα, τα σκοτεινά μέρη του σώματος ή οι ακραίες γωνίες μπερδεύουν το μοντέλο. Τα βίντεο κίνησης λειτουργούν καλύτερα όταν δείχνουν ένα μόνο άτομο να κάνει σαφείς, διακριτές κινήσεις. Οι ανεπαίσθητες χειρονομίες είναι πιο δύσκολες από τους μεγάλους χορούς.
Μετακίνηση: δημιουργία κίνησης με διατηρημένο φόντο
Η λειτουργία Move (Κίνηση) είναι παρόμοια με την Mix (Μίξη), αλλά διατηρεί το αρχικό φόντο του χαρακτήρα. Ανεβάστε μια εικόνα χαρακτήρα, ανεβάστε ένα βίντεο κίνησης και το σύστημα ζωντανεύει τον χαρακτήρα διατηρώντας παράλληλα όποια σκηνή κι αν βρίσκεται. Χρήσιμο όταν θέλετε το περιεχόμενο: ένα άτομο στο γραφείο του που ξαφνικά ξεκινάει έναν χορό, ένας χαρακτήρας σε ένα πάρκο που κάνει ένα κύμα.
Δημιουργήστε ιδέες και στυλ
Το Ideate δημιουργεί έννοιες βίντεο από κείμενα. Περιγράψτε τι θέλετε και το μοντέλο παράγει ένα βίντεο. Το Stylize σάς επιτρέπει να αλλάξετε το οπτικό στυλ ενός υπάρχοντος χαρακτήρα ή κινούμενης εικόνας. Και τα δύο είναι πιο πειραματικά από το Mix και το Move, και τα αποτελέσματα είναι λιγότερο προβλέψιμα.
Η εντολή /character
Αυτό σας επιτρέπει να δημιουργήσετε έναν μόνιμο χαρακτήρα που μπορείτε να επαναχρησιμοποιήσετε σε πολλαπλές κινούμενες εικόνες. Ανεβάστε μια εικόνα μία φορά, αποθηκεύστε την ως χαρακτήρα και αναφέρετέ την σε μελλοντικά μείγματα χωρίς να την ανεβάζετε ξανά κάθε φορά. Για τους δημιουργούς περιεχομένου που δημιουργούν έναν επαναλαμβανόμενο χαρακτήρα (μια μασκότ, ένα avatar, μια φιγούρα επωνυμίας), αυτό εξοικονομεί σημαντικό χρόνο.
Τιμολόγηση Viggle: τι είναι δωρεάν και τι κοστίζει χρήματα
Το Viggle χρησιμοποιεί ένα μοντέλο freemium και η δωρεάν βαθμίδα είναι εκπληκτικά γενναιόδωρη σε σύγκριση με τα περισσότερα εργαλεία βίντεο AI.
| Χαρακτηριστικό | Δωρεάν | Ασφάλιστρο |
|---|---|---|
| Γενιές ανά ημέρα | Περιορισμένο (ποικίλλει) | Υψηλότερα όρια |
| Προτεραιότητα ουράς | Τυπικό (μπορεί να είναι αργό) | Προτεραιότητα στην επεξεργασία |
| Διάρκεια βίντεο | Έως 30 δευτερόλεπτα | Έως 30 δευτερόλεπτα |
| Ψήφισμα | Πρότυπο | Υψηλότερη ποιότητα |
| Αφανής σφραγίδα χάρτου | Ναί | Αφαιρέθηκε |
| Εμπορικά δικαιώματα | Ναι (χωρίς δικαιώματα εκμετάλλευσης) | Ναι (χωρίς δικαιώματα εκμετάλλευσης) |
| Πολλαπλοί χαρακτήρες | Μόνο πρότυπα | Περισσότερες επιλογές |
Το κομμάτι που αφορά τα εμπορικά δικαιώματα είναι αξιοσημείωτο. Το Viggle δηλώνει ότι το παραγόμενο περιεχόμενο είναι «εντελώς χωρίς δικαιώματα» με «πλήρη δικαιώματα εμπορικής χρήσης για κάθε βίντεο που δημιουργείτε». Αυτό είναι ασυνήθιστο. Οι περισσότερες πλατφόρμες βίντεο με τεχνητή νοημοσύνη είτε περιορίζουν την εμπορική χρήση σε δωρεάν επίπεδα είτε χρεώνουν εταιρική αδειοδότηση. Το Viggle σάς επιτρέπει να χρησιμοποιείτε το αποτέλεσμα για μάρκετινγκ, μέσα κοινωνικής δικτύωσης ή οποιονδήποτε εμπορικό σκοπό χωρίς πρόσθετες χρεώσεις.
Η premium τιμολόγηση έχει αλλάξει με την πάροδο του χρόνου και ποικίλλει ανάλογα με την περιοχή. Ελέγξτε απευθείας το viggle.ai για τις τρέχουσες τιμές. Την τελευταία φορά που έψαξα, η πληρωμένη βαθμίδα ήταν κάτω από 20 $/μήνα και κυρίως αφαίρεσε τα υδατογραφήματα, αύξησε την προτεραιότητα ουράς και αύξησε τα ημερήσια όρια δημιουργίας.
Viggle εναντίον Runway εναντίον Pika εναντίον Kling: πού ταιριάζει
Ο χώρος δημιουργίας βίντεο με τεχνητή νοημοσύνη έχει γεμίσει γρήγορα κόσμο. Εδώ βρίσκεται το Viggle σε σχέση με τα εργαλεία με τα οποία το συγκρίνουν οι περισσότεροι.
| Εργαλείο | Καλύτερος στο | Φυσική/3D | Τιμολόγηση | Κινούμενη εικόνα χαρακτήρων |
|---|---|---|---|---|
| Viggle AI | Κίνηση ενός χαρακτήρα, μιμίδια | JST-1 (τρισδιάστατη φυσική) | Δωρεάν + επί πληρωμή | Εξοχος |
| Διάδρομος Γενιάς 3 | Δημιουργία κινηματογραφικού βίντεο | Πρόβλεψη 2D pixel | 12-76 $/μήνα | Μέτριος |
| Πίκα | Γρήγορα, στυλιζαρισμένα κλιπ | Πρόβλεψη 2D pixel | Δωρεάν + 8-58 $/μήνα | Βασικός |
| Κλινγκ Αϊ | Μεγαλύτερο βίντεο, συγχρονισμός χειλιών | 2D με λίγο 3D | Δωρεάν + επί πληρωμή | Καλός |
| Κίνηση σε οποιονδήποτε (ανοιχτού κώδικα) | Μεταφορά πόζας ερευνητικού επιπέδου | δισδιάστατη διάχυση | Δωρεάν (αυτοφιλοξενείται) | Καλό αλλά τεχνικό |
Το Viggle δεν προσπαθεί να ανταγωνιστεί το Runway σε κινηματογραφική ποιότητα. Δεν προσπαθεί να αντικαταστήσει τον Pika με γρήγορα κλιπ στα μέσα κοινωνικής δικτύωσης. Η λωρίδα του είναι συγκεκριμένα η κίνηση χαρακτήρων: λήψη μιας στατικής εικόνας ενός ατόμου ή χαρακτήρα και η πειστική του κίνηση. Σε αυτήν τη συγκεκριμένη λωρίδα, η κατανόηση της φυσικής του JST-1 του δίνει ένα πλεονέκτημα που τα εργαλεία που βασίζονται σε pixel δεν μπορούν να φτάσουν.
Εκεί που χάνει το Viggle: δεν μπορεί να δημιουργήσει βίντεο από την αρχή με τον τρόπο που μπορούν το Runway ή το Pika. Χρειάζεστε μια εικόνα εισόδου και μια αναφορά κίνησης. Είναι κινούμενη εικόνα, όχι δημιουργία. Η διάρκεια εξόδου περιορίζεται στα 30 δευτερόλεπτα. Και προς το παρόν λειτουργεί καλύτερα με εικονογραφημένους χαρακτήρες ή χαρακτήρες κινουμένων σχεδίων. Οι φωτορεαλιστικοί άνθρωποι μερικές φορές φτάνουν σε παράξενα εδάφη όπου η τρισδιάστατη ανακατασκευή δημιουργεί ανεπαίσθητες ανωμαλίες στα χαρακτηριστικά του προσώπου και την υφή του δέρματος.
Όπου κερδίζει το Viggle: η ποιότητα κίνησης είναι απαράμιλλη σε αυτό το εύρος τιμών. Μια δωρεάν γενιά Viggle με καλή εισαγωγή παράγει πιο πειστική κίνηση από ό,τι μια συνδρομή Runway αξίας 76 δολαρίων/μήνα για animation χαρακτήρων. Αυτό συμβαίνει επειδή το μοντέλο του Viggle κατανοεί στην πραγματικότητα τον τρισδιάστατο χώρο και τα άλλα το μαντεύουν από δισδιάστατα μοτίβα.

Σε τι να χρησιμοποιήσετε πραγματικά το Viggle: πραγματικές περιπτώσεις χρήσης
Η χρήση των meme είναι αυτή που έφερε το Viggle σε 1,6 εκατομμύρια μέλη στο Discord, αλλά υπάρχουν και πιο πρακτικές εφαρμογές.
Οι δημιουργοί περιεχομένου το χρησιμοποιούν για να ζωντανέψουν το avatar ή την περσόνα τους για τα μέσα κοινωνικής δικτύωσης. Ένας YouTuber με ένα avatar χαρακτήρα κινουμένων σχεδίων μπορεί να κάνει αυτόν τον χαρακτήρα να χορεύει, να χαιρετά ή να αντιδρά σε βίντεο χωρίς να προσλάβει animator. Οι δημιουργοί του TikTok κάνουν χαρακτήρες από φωτογραφίες να κάνουν χορούς που είναι δημοφιλείς. Ο χρόνος ολοκλήρωσης, κάτω από δύο λεπτά ανά κλιπ, καθιστά εφικτή την καθημερινή παραγωγή κινούμενου περιεχομένου.
Οι μικρές επιχειρήσεις και οι επαγγελματίες του μάρκετινγκ το χρησιμοποιούν για γρήγορες προωθητικές κινήσεις. Ένα εστιατόριο μπορεί να τραβήξει μια φωτογραφία της μασκότ του και να την κάνει να χορέψει σε μια διαφήμιση στα μέσα κοινωνικής δικτύωσης. Μια μάρκα ηλεκτρονικού εμπορίου μπορεί να ζωντανέψει έναν χαρακτήρα προϊόντος για ένα highlight ιστορίας. Το μηδενικό κόστος και η εμπορική αδειοδότηση το καθιστούν προσβάσιμο σε επιχειρήσεις που δεν έχουν την οικονομική δυνατότητα να αγοράσουν στούντιο σχεδιασμού κίνησης.
Οι ανεξάρτητοι προγραμματιστές παιχνιδιών και οι καλλιτέχνες storyboard το χρησιμοποιούν για τη δημιουργία πρωτοτύπων. Πριν επενδύσουν σε πλήρη κινούμενα σχέδια, μπορούν να δοκιμάσουν πώς φαίνεται ένας χαρακτήρας σε κίνηση. Λειτουργεί η πόζα; Πουλάει η κίνηση το συναίσθημα; Ο Viggle δίνει μια πρόχειρη αλλά γρήγορη απάντηση.
Η εκπαίδευση είναι μια περίπτωση χρήσης που δεν περίμενα να δω, αλλά βγάζει νόημα. Οι εκπαιδευτικοί και οι δημιουργοί μαθημάτων παίρνουν μια μασκότ χαρακτήρα και την ζωντανεύουν για επεξηγηματικά βίντεο. Πολύ πιο ελκυστικό από μια στατική εικόνα σε μια πλατφόρμα διαφανειών. Ένας χαρακτήρας που χειρονομεί ενώ εξηγεί τη φωτοσύνθεση κρατά την προσοχή ενός 12χρονου για περισσότερο χρόνο από το κείμενο και τα βέλη. Έχω δει καθηγητές ξένων γλωσσών στο TikTok να χρησιμοποιούν το Viggle για να κάνουν κινούμενους χαρακτήρες να επιδεικνύουν χαιρετισμούς σε διαφορετικούς πολιτισμούς. Δημιουργικό, με μικρή προσπάθεια και λειτουργεί.
Περιορισμοί και πράγματα που πρέπει να προσέξετε
Το Viggle είναι εντυπωσιακό αλλά έχει πραγματικά όρια.
Υποστηρίζονται ανθρώπινες εικόνες, αλλά το μοντέλο έχει σαφώς βελτιστοποιηθεί για εικονογραφημένους χαρακτήρες. Τα φωτορεαλιστικά αποτελέσματα είναι είτε επιτυχημένα είτε όχι. Τα πρόσωπα μερικές φορές παρασύρονται σε παράξενες περιοχές. Τα χέρια... βελτιώνονται, αλλά εξακολουθούν να αποτελούν το αδύναμο σημείο κάθε εργαλείου βίντεο τεχνητής νοημοσύνης που υπάρχει.
Το όριο των 30 δευτερολέπτων σημαίνει ότι δεν μπορείτε να δημιουργήσετε περιεχόμενο μεγάλης διάρκειας. Για οτιδήποτε πέρα από ένα γρήγορο κλιπ, θα χρειαστεί να επεξεργαστείτε πολλές γενιές μαζί.
Το απόρρητο αποτελεί εύλογη ανησυχία. Ανεβάζετε εικόνες και βίντεο σε μια υπηρεσία cloud. Το subreddit απορρήτου είχε ένα νήμα σχετικά με τις πρακτικές δεδομένων της Viggle και, ενώ η εταιρεία έχει εφαρμόσει εποπτεία περιεχομένου και ετικέτες μεταδεδομένων C2PA για ιχνηλασιμότητα, θα πρέπει να το σκεφτείτε πριν ανεβάσετε ευαίσθητες προσωπικές φωτογραφίες. Ειδικά φωτογραφίες άλλων ατόμων χωρίς τη συγκατάθεσή τους. Η πιθανότητα deepfake είναι προφανής και η ηθική ευθύνη βαρύνει τον χρήστη.
Χωρίς API δεν υπάρχουν αυτοματοποιημένες ροές εργασίας. Αν θέλετε να ενσωματώσετε το Viggle σε ένα προϊόν ή να δημιουργήσετε εκατοντάδες κινούμενα σχέδια μέσω προγραμματισμού, προς το παρόν δεν έχετε τύχη. Όλα περνούν χειροκίνητα μέσω της εφαρμογής web ή του Discord.
Δεν υπάρχει επίσης καμία εφαρμογή για κινητά που να αναπαράγει ακόμη το πλήρες σύνολο λειτουργιών. Η εφαρμογή iOS υπάρχει, αλλά είναι μια απλοποιημένη έκδοση που επικεντρώνεται σε πρότυπα meme και όχι στην πλήρη ροή εργασίας Mix/Move. Και η εξάρτηση από το Discord, ενώ αποτελεί μέρος της δημιουργίας της κοινότητας, δημιουργεί τριβές για τους χρήστες που δεν χρησιμοποιούν το Discord. Η συμμετοχή σε έναν διακομιστή, η εκμάθηση εντολών slash και η αναμονή σε μια δημόσια ουρά δεν είναι μια συνηθισμένη εμπειρία λογισμικού. Η εφαρμογή web βοηθάει, αλλά βρίσκεται ακόμα σε ανάπτυξη και της λείπουν ορισμένες λειτουργίες.