Viggle AIとは?話題沸騰のミーム作成・アニメーションツール

Viggle AIとは?話題沸騰のミーム作成・アニメーションツール

誰かがストックフォトからキャラクターを抜き出してフォートナイトのダンスに合成してみたところ、なかなか良い出来だった。「AIとしては良い」というレベルではなく、本当に良い出来だったのだ。滑らかな動き。理にかなった物理法則。キャラクターが回転すると体重が自然に変化し、服は本物の布のように揺れ、しかも制作時間はわずか2分ほどだった。この動画が2024年初頭にTwitterに投稿されると、1週間も経たないうちに誰もがViggle AIについて語り始めた。

その動画を見て、マーケティング用の都合の良い部分だけを切り取ったものだと思い、自分で試してみることにしました。写真をアップロードし、ダンスモーションのテンプレートを選び、約90秒待ちました。結果は完璧ではありませんでしたが、本当に印象的でした。写真のキャラクターが踊っていたのです。3Dで。物理演算付きで。無料で。Discordボット上で。このツールが、よくあるAI動画の宣伝文句とは違うことに気づいたのは、まさにこの瞬間でした。

Viggleは、わずか1年足らずでDiscordメンバー数が160万人にまで急増しました。2024年には、ソーシャルメディア上のAIミームコンテンツの半分をViggleが生成するようになりました。そして、その背後にある技術、つまり2Dピクセルのパターンマッチングではなく3D物理法則を理解するJST-1と呼ばれるモデルは、AIビデオ分野において真に新しいものと言えるでしょう。この記事では、Viggleとは何か、JST-1の仕組み、ツールの具体的な使用方法、そしてAIビデオ生成における大手企業との比較について解説します。

ヴィグル

Viggle AIとは何か、そしてなぜそれが重要なのか

Viggle AIは、人物やキャラクターの静止画像をアニメーション化するプラットフォームです。多くのAIツールが行うような、ぎこちない「写真のズームとパン」ではなく、Viggleは真の3Dモーションを生成します。キャラクターは回転し、歩き、踊り、ジャンプし、その動きは重力、重量移動、布のたるみ、慣性といった物理法則に従います。

同社は、コンピュータビジョンと3Dモデリングのバックグラウンドを持つチームによって設立されました。彼らはJST-1(Joint Space-Timeの略)を開発し、それを「実際の物理学の理解に基づいた初のビデオ3D基盤モデル」と説明しています。この主張は、Viggleを同カテゴリーの他の製品と差別化する要素であるため、詳しく見ていく価値があります。

ほとんどのAIビデオツール(Runway Gen-3、Pika、Klingなど)は、前のフレームに基づいて次のフレームがどのように見えるかを予測することでビデオを生成します。これらは2Dピクセル空間で動作します。キャラクターが横を向いたり、オブジェクトとインタラクトしたり、トレーニングデータでカバーされていない方法で動いたりするまでは、出力は良好に見えます。しかし、その後は奇妙な現象が発生します。手足が体をすり抜けたり、プロポーションが変わったり、重力が効かなくなったりします。

JST-1は異なるアプローチを採用しています。入力画像からキャラクターの3Dモデルを再構築し、キャラクターの骨格構造を理解した上で、物理法則に従ってその3Dモデルをアニメーション化し、最終的な2Dビデオ出力をレンダリングします。キャラクターには体積、重量、関節があります。踊るときは、足が地面を適切な力で蹴り上げます。キャラクターが回転するときも、モデルはキャラクターに前面だけでなく背面もあることを認識しているため、視点が正しく変化します。

出力は完璧か?いいえ。複雑なシーンでは依然としてアーティファクトが発生します。複数キャラクターのインタラクションは不安定です。また、このモデルはフォトリアルな人間よりも、漫画やアニメのキャラクターに最適です。しかし、静止画から単一キャラクターのアニメーションを作成する場合、Viggleは、この価格帯のどのコンシューマー向けツールにも匹敵しない結果を生み出します。しかも無料です。

Viggle AIの使い方:ステップバイステップガイド

Viggleは、ウェブアプリとDiscordボットの2つのプラットフォームで動作します。Discordボットが先に登場し、現在もコミュニティの主要なインターフェースとなっています。各主要機能の仕組みは以下のとおりです。

ミックス:メインイベント

Viggleが爆発的に人気になったのは、その「Mix」機能のおかげです。入力としてキャラクター画像と動画の2つを与えると、Viggleは画像からキャラクターを抽出し、動画の動きに合わせてマッピングし、結果をレンダリングします。

手順:ViggleウェブアプリまたはDiscordを開きます。/mixコマンドを使用します。キャラクターの鮮明な画像(人物1人、全身が写っていて、照明が適切)をアップロードします。目的の動き(ダンス、歩行、ジェスチャーなど)を収めた短い動画をアップロードします。背景(グリーンスクリーン、白、オリジナル)を選択します。生成ボタンを押します。60~120秒待ちます。参照クリップの動きをキャラクターが実行する動画が生成されます。

結果は入力データに大きく左右されます。手足がはっきりと見える、鮮明な人物画像が最適です。背景がごちゃごちゃしていたり、体の部位が隠れていたり、極端な角度の画像はモデルを混乱させます。動画は、一人の人物が明確で特徴的な動きをしているものが最適に機能します。繊細なジェスチャーは、激しいダンスよりも認識が難しいです。

移動:背景を保持したままアニメーションする

MoveはMixに似ていますが、キャラクターの元の背景を保持します。キャラクター画像とモーションビデオをアップロードすると、システムがキャラクターをアニメーション化し、キャラクターが立っているシーンを維持します。デスクに座っている人が突然踊り出す、公園でキャラクターが手を振るなど、文脈が必要な場面で便利です。

アイデアを出し、スタイルを定める

Ideateはテキストプロンプトから動画コンセプトを生成します。希望する内容を説明すると、モデルが動画を作成します。Stylizeは既存のキャラクターやアニメーションのビジュアルスタイルを変更できます。どちらもMixやMoveよりも実験的な機能が多く、結果は予測しにくいです。

/character コマンド

これにより、複数のアニメーションで再利用できる永続的なキャラクターを作成できます。画像を一度アップロードしてキャラクターとして保存すれば、毎回再アップロードすることなく、今後のミックスで参照できます。繰り返し登場するキャラクター(マスコット、アバター、ブランドキャラクターなど)を作成するコンテンツクリエイターにとって、これは大幅な時間短縮になります。

Viggleの料金体系:無料と有料

Viggleはフリーミアムモデルを採用しており、無料プランはほとんどのAIビデオツールと比べて驚くほど充実している。

特徴無料プレミアム
1日あたりの世代数限定的(変動あり)上限値
キューの優先順位標準(動作が遅い場合があります)優先処理
動画の長さ最大30秒最大30秒
解決標準より高品質
透かしはい削除済み
商権はい(著作権フリー)はい(著作権フリー)
複数の文字テンプレートのみその他のオプション

商用利用権に関する規定は注目に値する。Viggleは、生成されたコンテンツは「完全にロイヤリティフリー」であり、「生成したすべての動画に対する完全な商用利用権」を有すると明言している。これは異例のことだ。ほとんどのAI動画プラットフォームは、無料プランでは商用利用を制限しているか、企業向けライセンス料を課している。Viggleでは、マーケティング、ソーシャルメディア、その他あらゆる商用目的で、追加料金なしで出力コンテンツを利用することができる。

プレミアムプランの料金は時間とともに変化しており、地域によっても異なります。最新の料金については、viggle.ai のウェブサイトで直接ご確認ください。私が最後に確認した時点では、有料プランは月額20ドル未満で、主にウォーターマークの削除、キューの優先順位の向上、1日あたりの生成制限の引き上げといった機能を提供していました。

Viggle vs Runway vs Pika vs Kling:それぞれの位置づけ

AIによる動画生成分野は急速に競争が激化しています。ここでは、Viggleが多くの人が比較対象とするツールの中でどのような位置づけにあるのかを見ていきましょう。

道具最高物理学/3D価格設定キャラクターアニメーション
ヴィグルAI単一キャラクターの動き、ミームJST-1(3D物理)無料+有料素晴らしい
滑走路 Gen3映画のようなビデオ生成2Dピクセル予測月額12~76ドル適度
ピカ短くスタイリッシュなクリップ2Dピクセル予測無料+月額8~58ドル基本
クリングAI長めの動画、口パク2Dと一部3D無料+有料良い
Animate Anyone(オープンソース)研究グレードの姿勢転送2次元拡散無料(セルフホスティング)良いが技術的

Viggleは、映画のようなクオリティでRunwayと競合しようとしているわけではありません。ソーシャルメディア向けの短い動画制作ツールであるPikaに取って代わろうとしているわけでもありません。Viggleの得意分野は、キャラクターアニメーション、つまり人物やキャラクターの静止画を、説得力のある動きで表現することです。この特定の分野において、JST-1の物理法則への理解は、ピクセルベースのツールでは到底真似できない優位性をもたらします。

Viggleの弱点は、RunwayやPikaのようにゼロから動画を生成できないことです。入力画像とモーションリファレンスが必要で、アニメーションであって生成ではありません。出力の長さは30秒に制限されています。また、現状ではイラストや漫画のキャラクターに最適です。フォトリアルな人間の場合、3D再構築によって顔の特徴や肌の質感に微妙な違和感が生じ、不気味の谷現象に陥ることがあります。

Viggleの強みは、この価格帯では他に類を見ないモーション品質です。適切な入力データを用いた無料のViggle生成は、月額76ドルのRunwayサブスクリプションでキャラクターアニメーションを作成するよりも、はるかに物理的に説得力のある動きを生み出します。これは、Viggleのモデルが実際に3D空間を理解しているのに対し、他のモデルは2Dパターンから推測しているに過ぎないからです。

ヴィグル

Viggleを実際に何に使うべきか:実際の使用例

ミームの活用事例がViggleを160万人のDiscordメンバーにまで押し上げたが、それ以外にも実用的な用途はたくさんある。

コンテンツクリエイターは、ソーシャルメディア用のアバターやキャラクターをアニメーション化するためにこれを使用します。漫画キャラクターのアバターを持つYouTuberは、アニメーターを雇うことなく、そのキャラクターを動画の中で踊らせたり、手を振らせたり、反応させたりすることができます。TikTokクリエイターは、写真からキャラクターを作り、流行のダンスを踊らせます。1クリップあたり2分以内という制作時間のおかげで、アニメーションコンテンツを毎日制作することが可能です。

中小企業やマーケティング担当者は、手軽なプロモーション用アニメーションを作成するためにこれを利用しています。レストランはマスコットキャラクターの写真を撮り、ソーシャルメディア広告で踊らせることができます。eコマースブランドは、商品キャラクターをアニメーション化してストーリーのハイライトに活用できます。費用がかからず商用ライセンスも取得できるため、モーションデザインスタジオに依頼する余裕のない企業でも利用可能です。

インディーゲーム開発者やストーリーボードアーティストは、プロトタイプ作成にこれを使用します。本格的なアニメーション制作に投資する前に、キャラクターが動いている様子をテストできます。ポーズは適切か?動きは感情をうまく表現できているか?Viggleは、大まかながらも迅速な回答を提供します。

教育分野での活用は予想外でしたが、理にかなっています。教師やコース作成者は、キャラクターのマスコットを使って説明動画をアニメーション化します。スライドデッキの静止画像よりもはるかに魅力的です。光合成を説明する際にジェスチャーをするキャラクターは、テキストと矢印よりも12歳の子どもの注意を長く引きつけます。TikTokでは、語学講師がViggleを使ってアニメーションキャラクターに様々な文化圏での挨拶を実演させているのを見たことがあります。創造的で手間もかからず、効果も抜群です。

制限事項と注意点

Viggleは素晴らしいが、明確な限界もある。

人物画像もサポートされていますが、このモデルは明らかにイラストキャラクター向けに最適化されています。フォトリアリスティックな結果はまちまちです。顔は時折、不気味の谷現象に陥ります。手は…改善されつつありますが、依然としてあらゆるAIビデオツールの弱点です。

30秒という制限があるため、長尺コンテンツを作成することはできません。短いクリップ以上のものを作成するには、複数の世代の動画を編集してつなぎ合わせる必要があります。

プライバシーは正当な懸念事項です。クラウドサービスに画像や動画をアップロードするのですから。プライバシーに関するサブレディットには、Viggleのデータ処理に関するスレッドがありましたが、同社はコンテンツモデレーションや追跡可能性のためのC2PAメタデータタグ付けを実施しているものの、機密性の高い個人写真をアップロードする前にはよく考えるべきです。特に、他人の同意なしに撮影した写真は絶対にアップロードしてはいけません。ディープフェイクの可能性は明らかであり、倫理的な責任はユーザーにあります。

APIがないということは、自動化されたワークフローが利用できないということです。Viggleを製品に組み込んだり、プログラムで数百ものアニメーションを生成したりしたい場合、今のところは不可能です。すべてWebアプリまたはDiscord経由で手動で行う必要があります。

現時点では、フル機能を備えたモバイルアプリは存在しません。iOSアプリはありますが、Mix/Moveのワークフロー全体ではなく、ミームテンプレートに特化した簡略版です。また、Discordへの依存はコミュニティ構築の一因ではありますが、Discordを使用しないユーザーにとっては不便です。サーバーに参加し、スラッシュコマンドを覚え、公開キューで待つのは、通常のソフトウェア体験とは言えません。ウェブアプリは役立ちますが、まだ開発中で、一部の機能が欠けています。

質問は?

用途に応じて最適なツールを選びましょう。Runwayはテキストや画像プロンプトからフルビデオを生成し、映画のようなクオリティを実現します。一方、Viggleは物理演算に基づいた3Dモーションでキャラクターをアニメーション化します。キャラクターを踊らせたり、手を振らせたり、歩かせたりするには、Viggleの方がよりリアルな動きを表現できます。カメラワークを伴う映画品質の風景を生成するには、Runwayの方が適しています。

はい。Viggleは、無料コンテンツと有料コンテンツを問わず、生成されたすべてのコンテンツについて完全な商用利用権を付与します。追加のライセンスは不要です。これには、ソーシャルメディア、マーケティング、製品プロモーション、その他あらゆる商用利用が含まれます。

このプラットフォームは、コンテンツモデレーションフィルター、コンテンツの発信元追跡のためのC2PAメタデータ、およびテキスト/画像分類器を使用して不適切なコンテンツをブロックします。ただし、プライバシーに関する懸念は確かに存在します。クラウドサービスに画像をアップロードするからです。他人の画像を本人の同意なしにアップロードすることは避け、機密性の高いコンテンツに使用する前にプライバシーポリシーを確認してください。

キャラクター画像とモーションリファレンス動画をアップロードすると、ViggleのJST-1モデルがキャラクターを3Dで再構築し、モーションをキャラクターの骨格構造にマッピングし、物理シミュレーション(重力、運動量、布地)を適用して、結果を2D動画としてレンダリングします。このプロセス全体は60~120秒で完了します。

ミーム作成は、利用量という点では最大の用途です。しかし、コンテンツ制作者はアニメーションアバターに、マーケティング担当者は短いプロモーションクリップに、ゲーム開発者はモーションプロトタイプに、教育者はアニメーション解説キャラクターに利用しています。最も効果的なのは、静止画から単一キャラクターのアニメーションを作成することです。

はい。主要機能(ミックス、移動、アイデア出し)は、1日あたりの生成制限付きで無料でご利用いただけます。無料版の出力にはウォーターマークが含まれます。有料プランでは、ウォーターマークが削除され、処理速度が向上し、1日あたりの制限が緩和されます。生成されたコンテンツはすべて、プランの種類に関わらず、ロイヤリティフリーで商用利用が可能です。

Ready to Get Started?

Create an account and start accepting payments – no contracts or KYC required. Or, contact us to design a custom package for your business.

Make first step

Always know what you pay

Integrated per-transaction pricing with no hidden fees

Start your integration

Set up Plisio swiftly in just 10 minutes.