Viggle AIとは?話題沸騰のミーム作成・アニメーションツール
誰かがストックフォトからキャラクターを抜き出してフォートナイトのダンスに合成してみたところ、なかなか良い出来だった。「AIとしては良い」というレベルではなく、本当に良い出来だったのだ。滑らかな動き。理にかなった物理法則。キャラクターが回転すると体重が自然に変化し、服は本物の布のように揺れ、しかも制作時間はわずか2分ほどだった。この動画が2024年初頭にTwitterに投稿されると、1週間も経たないうちに誰もがViggle AIについて語り始めた。
その動画を見て、マーケティング用の都合の良い部分だけを切り取ったものだと思い、自分で試してみることにしました。写真をアップロードし、ダンスモーションのテンプレートを選び、約90秒待ちました。結果は完璧ではありませんでしたが、本当に印象的でした。写真のキャラクターが踊っていたのです。3Dで。物理演算付きで。無料で。Discordボット上で。このツールが、よくあるAI動画の宣伝文句とは違うことに気づいたのは、まさにこの瞬間でした。
Viggleは、わずか1年足らずでDiscordメンバー数が160万人にまで急増しました。2024年には、ソーシャルメディア上のAIミームコンテンツの半分をViggleが生成するようになりました。そして、その背後にある技術、つまり2Dピクセルのパターンマッチングではなく3D物理法則を理解するJST-1と呼ばれるモデルは、AIビデオ分野において真に新しいものと言えるでしょう。この記事では、Viggleとは何か、JST-1の仕組み、ツールの具体的な使用方法、そしてAIビデオ生成における大手企業との比較について解説します。

Viggle AIとは何か、そしてなぜそれが重要なのか
Viggle AIは、人物やキャラクターの静止画像をアニメーション化するプラットフォームです。多くのAIツールが行うような、ぎこちない「写真のズームとパン」ではなく、Viggleは真の3Dモーションを生成します。キャラクターは回転し、歩き、踊り、ジャンプし、その動きは重力、重量移動、布のたるみ、慣性といった物理法則に従います。
同社は、コンピュータビジョンと3Dモデリングのバックグラウンドを持つチームによって設立されました。彼らはJST-1(Joint Space-Timeの略)を開発し、それを「実際の物理学の理解に基づいた初のビデオ3D基盤モデル」と説明しています。この主張は、Viggleを同カテゴリーの他の製品と差別化する要素であるため、詳しく見ていく価値があります。
ほとんどのAIビデオツール(Runway Gen-3、Pika、Klingなど)は、前のフレームに基づいて次のフレームがどのように見えるかを予測することでビデオを生成します。これらは2Dピクセル空間で動作します。キャラクターが横を向いたり、オブジェクトとインタラクトしたり、トレーニングデータでカバーされていない方法で動いたりするまでは、出力は良好に見えます。しかし、その後は奇妙な現象が発生します。手足が体をすり抜けたり、プロポーションが変わったり、重力が効かなくなったりします。
JST-1は異なるアプローチを採用しています。入力画像からキャラクターの3Dモデルを再構築し、キャラクターの骨格構造を理解した上で、物理法則に従ってその3Dモデルをアニメーション化し、最終的な2Dビデオ出力をレンダリングします。キャラクターには体積、重量、関節があります。踊るときは、足が地面を適切な力で蹴り上げます。キャラクターが回転するときも、モデルはキャラクターに前面だけでなく背面もあることを認識しているため、視点が正しく変化します。
出力は完璧か?いいえ。複雑なシーンでは依然としてアーティファクトが発生します。複数キャラクターのインタラクションは不安定です。また、このモデルはフォトリアルな人間よりも、漫画やアニメのキャラクターに最適です。しかし、静止画から単一キャラクターのアニメーションを作成する場合、Viggleは、この価格帯のどのコンシューマー向けツールにも匹敵しない結果を生み出します。しかも無料です。
Viggle AIの使い方:ステップバイステップガイド
Viggleは、ウェブアプリとDiscordボットの2つのプラットフォームで動作します。Discordボットが先に登場し、現在もコミュニティの主要なインターフェースとなっています。各主要機能の仕組みは以下のとおりです。
ミックス:メインイベント
Viggleが爆発的に人気になったのは、その「Mix」機能のおかげです。入力としてキャラクター画像と動画の2つを与えると、Viggleは画像からキャラクターを抽出し、動画の動きに合わせてマッピングし、結果をレンダリングします。
手順:ViggleウェブアプリまたはDiscordを開きます。/mixコマンドを使用します。キャラクターの鮮明な画像(人物1人、全身が写っていて、照明が適切)をアップロードします。目的の動き(ダンス、歩行、ジェスチャーなど)を収めた短い動画をアップロードします。背景(グリーンスクリーン、白、オリジナル)を選択します。生成ボタンを押します。60~120秒待ちます。参照クリップの動きをキャラクターが実行する動画が生成されます。
結果は入力データに大きく左右されます。手足がはっきりと見える、鮮明な人物画像が最適です。背景がごちゃごちゃしていたり、体の部位が隠れていたり、極端な角度の画像はモデルを混乱させます。動画は、一人の人物が明確で特徴的な動きをしているものが最適に機能します。繊細なジェスチャーは、激しいダンスよりも認識が難しいです。
移動:背景を保持したままアニメーションする
MoveはMixに似ていますが、キャラクターの元の背景を保持します。キャラクター画像とモーションビデオをアップロードすると、システムがキャラクターをアニメーション化し、キャラクターが立っているシーンを維持します。デスクに座っている人が突然踊り出す、公園でキャラクターが手を振るなど、文脈が必要な場面で便利です。
アイデアを出し、スタイルを定める
Ideateはテキストプロンプトから動画コンセプトを生成します。希望する内容を説明すると、モデルが動画を作成します。Stylizeは既存のキャラクターやアニメーションのビジュアルスタイルを変更できます。どちらもMixやMoveよりも実験的な機能が多く、結果は予測しにくいです。
/character コマンド
これにより、複数のアニメーションで再利用できる永続的なキャラクターを作成できます。画像を一度アップロードしてキャラクターとして保存すれば、毎回再アップロードすることなく、今後のミックスで参照できます。繰り返し登場するキャラクター(マスコット、アバター、ブランドキャラクターなど)を作成するコンテンツクリエイターにとって、これは大幅な時間短縮になります。
Viggleの料金体系:無料と有料
Viggleはフリーミアムモデルを採用しており、無料プランはほとんどのAIビデオツールと比べて驚くほど充実している。
| 特徴 | 無料 | プレミアム |
|---|---|---|
| 1日あたりの世代数 | 限定的(変動あり) | 上限値 |
| キューの優先順位 | 標準(動作が遅い場合があります) | 優先処理 |
| 動画の長さ | 最大30秒 | 最大30秒 |
| 解決 | 標準 | より高品質 |
| 透かし | はい | 削除済み |
| 商権 | はい(著作権フリー) | はい(著作権フリー) |
| 複数の文字 | テンプレートのみ | その他のオプション |
商用利用権に関する規定は注目に値する。Viggleは、生成されたコンテンツは「完全にロイヤリティフリー」であり、「生成したすべての動画に対する完全な商用利用権」を有すると明言している。これは異例のことだ。ほとんどのAI動画プラットフォームは、無料プランでは商用利用を制限しているか、企業向けライセンス料を課している。Viggleでは、マーケティング、ソーシャルメディア、その他あらゆる商用目的で、追加料金なしで出力コンテンツを利用することができる。
プレミアムプランの料金は時間とともに変化しており、地域によっても異なります。最新の料金については、viggle.ai のウェブサイトで直接ご確認ください。私が最後に確認した時点では、有料プランは月額20ドル未満で、主にウォーターマークの削除、キューの優先順位の向上、1日あたりの生成制限の引き上げといった機能を提供していました。
Viggle vs Runway vs Pika vs Kling:それぞれの位置づけ
AIによる動画生成分野は急速に競争が激化しています。ここでは、Viggleが多くの人が比較対象とするツールの中でどのような位置づけにあるのかを見ていきましょう。
| 道具 | 最高 | 物理学/3D | 価格設定 | キャラクターアニメーション |
|---|---|---|---|---|
| ヴィグルAI | 単一キャラクターの動き、ミーム | JST-1(3D物理) | 無料+有料 | 素晴らしい |
| 滑走路 Gen3 | 映画のようなビデオ生成 | 2Dピクセル予測 | 月額12~76ドル | 適度 |
| ピカ | 短くスタイリッシュなクリップ | 2Dピクセル予測 | 無料+月額8~58ドル | 基本 |
| クリングAI | 長めの動画、口パク | 2Dと一部3D | 無料+有料 | 良い |
| Animate Anyone(オープンソース) | 研究グレードの姿勢転送 | 2次元拡散 | 無料(セルフホスティング) | 良いが技術的 |
Viggleは、映画のようなクオリティでRunwayと競合しようとしているわけではありません。ソーシャルメディア向けの短い動画制作ツールであるPikaに取って代わろうとしているわけでもありません。Viggleの得意分野は、キャラクターアニメーション、つまり人物やキャラクターの静止画を、説得力のある動きで表現することです。この特定の分野において、JST-1の物理法則への理解は、ピクセルベースのツールでは到底真似できない優位性をもたらします。
Viggleの弱点は、RunwayやPikaのようにゼロから動画を生成できないことです。入力画像とモーションリファレンスが必要で、アニメーションであって生成ではありません。出力の長さは30秒に制限されています。また、現状ではイラストや漫画のキャラクターに最適です。フォトリアルな人間の場合、3D再構築によって顔の特徴や肌の質感に微妙な違和感が生じ、不気味の谷現象に陥ることがあります。
Viggleの強みは、この価格帯では他に類を見ないモーション品質です。適切な入力データを用いた無料のViggle生成は、月額76ドルのRunwayサブスクリプションでキャラクターアニメーションを作成するよりも、はるかに物理的に説得力のある動きを生み出します。これは、Viggleのモデルが実際に3D空間を理解しているのに対し、他のモデルは2Dパターンから推測しているに過ぎないからです。

Viggleを実際に何に使うべきか:実際の使用例
ミームの活用事例がViggleを160万人のDiscordメンバーにまで押し上げたが、それ以外にも実用的な用途はたくさんある。
コンテンツクリエイターは、ソーシャルメディア用のアバターやキャラクターをアニメーション化するためにこれを使用します。漫画キャラクターのアバターを持つYouTuberは、アニメーターを雇うことなく、そのキャラクターを動画の中で踊らせたり、手を振らせたり、反応させたりすることができます。TikTokクリエイターは、写真からキャラクターを作り、流行のダンスを踊らせます。1クリップあたり2分以内という制作時間のおかげで、アニメーションコンテンツを毎日制作することが可能です。
中小企業やマーケティング担当者は、手軽なプロモーション用アニメーションを作成するためにこれを利用しています。レストランはマスコットキャラクターの写真を撮り、ソーシャルメディア広告で踊らせることができます。eコマースブランドは、商品キャラクターをアニメーション化してストーリーのハイライトに活用できます。費用がかからず商用ライセンスも取得できるため、モーションデザインスタジオに依頼する余裕のない企業でも利用可能です。
インディーゲーム開発者やストーリーボードアーティストは、プロトタイプ作成にこれを使用します。本格的なアニメーション制作に投資する前に、キャラクターが動いている様子をテストできます。ポーズは適切か?動きは感情をうまく表現できているか?Viggleは、大まかながらも迅速な回答を提供します。
教育分野での活用は予想外でしたが、理にかなっています。教師やコース作成者は、キャラクターのマスコットを使って説明動画をアニメーション化します。スライドデッキの静止画像よりもはるかに魅力的です。光合成を説明する際にジェスチャーをするキャラクターは、テキストと矢印よりも12歳の子どもの注意を長く引きつけます。TikTokでは、語学講師がViggleを使ってアニメーションキャラクターに様々な文化圏での挨拶を実演させているのを見たことがあります。創造的で手間もかからず、効果も抜群です。
制限事項と注意点
Viggleは素晴らしいが、明確な限界もある。
人物画像もサポートされていますが、このモデルは明らかにイラストキャラクター向けに最適化されています。フォトリアリスティックな結果はまちまちです。顔は時折、不気味の谷現象に陥ります。手は…改善されつつありますが、依然としてあらゆるAIビデオツールの弱点です。
30秒という制限があるため、長尺コンテンツを作成することはできません。短いクリップ以上のものを作成するには、複数の世代の動画を編集してつなぎ合わせる必要があります。
プライバシーは正当な懸念事項です。クラウドサービスに画像や動画をアップロードするのですから。プライバシーに関するサブレディットには、Viggleのデータ処理に関するスレッドがありましたが、同社はコンテンツモデレーションや追跡可能性のためのC2PAメタデータタグ付けを実施しているものの、機密性の高い個人写真をアップロードする前にはよく考えるべきです。特に、他人の同意なしに撮影した写真は絶対にアップロードしてはいけません。ディープフェイクの可能性は明らかであり、倫理的な責任はユーザーにあります。
APIがないということは、自動化されたワークフローが利用できないということです。Viggleを製品に組み込んだり、プログラムで数百ものアニメーションを生成したりしたい場合、今のところは不可能です。すべてWebアプリまたはDiscord経由で手動で行う必要があります。
現時点では、フル機能を備えたモバイルアプリは存在しません。iOSアプリはありますが、Mix/Moveのワークフロー全体ではなく、ミームテンプレートに特化した簡略版です。また、Discordへの依存はコミュニティ構築の一因ではありますが、Discordを使用しないユーザーにとっては不便です。サーバーに参加し、スラッシュコマンドを覚え、公開キューで待つのは、通常のソフトウェア体験とは言えません。ウェブアプリは役立ちますが、まだ開発中で、一部の機能が欠けています。