Grok AIレビュー:xAIのチャットボットを正直にテスト
Grok AI の核心にある矛盾はここにあります。この分野で最も難易度の高い推論テストにおいて、xAI のチャットボットは、ChatGPT と Gemini だけが匹敵できるような最先端レベルのスコアを記録しています。しかし、同じ 14 か月の間に、同じ製品が「MechaHitler」と名乗り、同意なしにディープフェイクを生成していたことが発覚しました。どちらも事実です。そこで、このレビューでは、Grok のモデルが実際にどれほど優れているか、5 つの料金プランの費用、他社にはない機能、無視できない安全性、そして Grok が ChatGPT、Gemini、 Claudeと比べてどうなのかをまとめて解説します。
Grok AIとは何か、そして誰が開発しているのか(xAI)
Grokは、ウェブサイトに付け加えられただけのチャットボットではありません。その特徴は、ソーシャルネットワークにリアルタイムで接続された唯一の最先端AIであることです。この設計上の選択は、Grokの強みであると同時に弱みでもあります。イーロン・マスク氏の会社であるxAIによって開発されたGrokは、2023年11月3日に、当初はX Premiumの特典として、現在はスタンドアロンのAIチャットアプリおよびウェブサイトgrok.comとしてリリースされました。
「X上でリアルタイムに動作する」という点が重要です。ほとんどのチャットボットは1時間前に起こったことについて尋ねても肩をすくめるだけですが、GrokはXをリアルタイムで読み取り、回答します。これが真の差別化要因です。一方で、GrokはXのトーンも学習してしまうため、それがより深刻な問題を引き起こす一因にもなっています。
xAIが売り込んでいるもう一つの要素は、その個性だ。Grokは、機知に富み、率直で、少し反抗的な性格に調整されており、ほとんどのアシスタントが拒否するようなジョークを飛ばす「ファンモード」も搭載されている。この個性を気に入り、競合他社のAIアシスタントを堅苦しいと感じる人もいる。一方で、その尖った性格を退屈に感じたり、さらに悪い印象を持つ人もいる。いずれにせよ、この姿勢は意図的なものであり、マスク氏が掲げる「反覚醒」的な製品イメージを最も明確に表している。
その背後にある資金は驚異的だ。xAIは2026年1月にシリーズEラウンドで200億ドルを調達し、企業価値は約2300億ドルに達した。その後、SpaceXの提出書類によると、同社は2025年に約64億ドルを費消したことが明らかになった。これは単なる副業ではない。AI分野における最も高額な投資の一つと言えるだろう。
また、その普及も急速に進んでいる。Grokはテスラ車に搭載されており、2026年1月には米国国防総省がディープフェイク問題にもかかわらず、Grokをネットワーク上で運用すると発表した。2026年3月末までに、このチャットボットの月間アクティブユーザー数は約1億1700万人に達した。わずか2年しか経っていない製品としては驚異的な普及率であり、だからこそ、ちょっとしたミスでも数時間以内に世界的なニュースになってしまうのだ。

Grokの性能はどれほど優れているのか?モデルとベンチマーク
要約すると、非常に優れている。理論上、Grok 4は、高度な推論のために構築された大規模言語モデルの中で、これまでリリースされたものの中でも最高レベルのものの一つだ。しかし、より詳細な説明には注意点があり、それらは重要な意味を持つ。
Grok 1からGrok 4.3まで:モデルのタイムライン
xAI は、ほとんど無謀なほどの速さでリリースされています。Grok 1 は 2023 年後半に登場しました。Grok 2 は 2024 年に画像生成機能を追加しました。Grok 3 は2025 年 2 月に推論モードと DeepSearch を搭載してリリースされました。そして、2025 年 7 月 9 日に Grok 4 と Grok 4 Heavy がリリースされ、これが xAI を最先端の議論の対象とする飛躍となりました。11 月に Grok 4.1 が続き、2026 には 100 万トークンのコンテキスト ウィンドウを備えた Grok 4.3 がリリースされました。約 1 年半で 5 つのメジャー リリースに加え、ポイント アップデートや Grok Code Fast のような特殊なバリアントが着実にリリースされています。
そのペースは諸刃の剣だ。Grokを最先端に維持できる一方で、「まずはリリース、パッチは後で」という文化が、安全事故が頻発する原因にもなった。スピードには代償が伴う――そしてGrokはその代償を公に払っている。
| モデル | リリース済み | ヘッドライン結果 | コンテクスト |
|---|---|---|---|
| グロック3 | 2025年2月 | 最初の推論モード、ディープサーチ | 13万1千トークン |
| グロック 4 / 4 ヘビー | 2025年7月 | HLE 50.7%、AIME 2025 100% | 256,000トークン |
| Grok 4.1 | 2025年11月 | LMArena #1、Eloレーティング1483 | 256,000トークン |
| Grok 4.3 | 2026 | 低価格、幻覚症状なしの最高評価 | 100万トークン |
ベンチマークスコアが実際に意味すること
これらの数字は紛れもない事実です。xAIによると、 Grok 4 Heavyは人類最後の試験で50%を突破した最初のモデルであり、50.7%のスコアを記録しました。2025年のAIME数学コンテストでは100%、GPQAでは88.9%を達成し、ARC-AGI v2推論テストではClaude Opus 4のスコアをほぼ倍増させました。その後、Grok 4.1はLMArenaのリーダーボードで1483 Eloを獲得し、トップに立ちました。
ここで、私が繰り返し強調しておきたい注意点があります。ベンチマークの勝敗は月ごとに変動し、すべてのカテゴリーでトップになるモデルは存在しません。チャートでトップのHLEスコアを獲得したからといって、GrokがClaudeよりも洗練されたメールを作成したり、コードをより良くリファクタリングしたりするとは限りません。それは、Grokが高度な閉形式推論、つまり競技数学、大学院レベルの科学問題、論理パズルに優れていることを意味するだけです。日常的な使用においては、上位4つのモデルの差は小さく、ランキングよりも個人の性格や習慣の方が重要になります。スコアはあくまで一つのデータポイントとして捉え、最終的な判断基準とは考えず、プレスリリースを鵜呑みにする前に、ご自身の作業でGrokをテストしてみてください。
リアルタイムXデータとディープサーチ
Grokが真に他社を凌駕するのはまさにこの点です。DeepSearchはウェブとXをスキャンし、見つけた情報を引用します。速報ニュース、市場の動向、あるいは「今、人々は何を言っているのか」といった情報に関しては、他の追随を許しません。なぜなら、主要なソーシャルプラットフォームからリアルタイムで大量の情報が流れてくるようなツールは他にないからです。1時間前に値動きを始めたコイン、進行中のニュース、あるいは発表に対する世論についてGrokに尋ねれば、古い学習データに基づく要約ではなく、タイムスタンプ付きの実際の投稿を抽出してくれます。もしあなたの仕事が時事問題、市場、あるいは社会的な感情に関わるものであれば、この機能だけでも購読する価値があると言えるでしょう。
トレードオフは避けられない。Grokをタイムリーな情報源たらしめているXフィードは、同時にプラットフォームの最悪の側面にも晒すことになる。そして、このモデルは時として、読み込んだ投稿のトーンを反映させてしまうことがある。力と責任は、同じパイプから生まれているのだ。
Grok AIの料金プラン:無料プラン、SuperGrok、API
Grokには5つの料金プランがあり、それぞれの価格差が特徴を物語っています。無料プランは充実していてかなり寛大ですが、データ使用量に制限がかかるため、頻繁に利用するユーザーには不便です。その上になると、料金プランは急激に上がります。
| ティア | 価格 | 手に入れるもの |
|---|---|---|
| 無料 | 0ドル | 最新モデルは、1日あたりの利用制限付きで、Xとgrok.comで販売中です。 |
| スーパーグロック ライト | 月額10ドル | 上限値が高く、中断が少ない |
| スーパーグロック | 月額30ドル | フルアクセス、推論モード、より多くの計算 |
| Xプレミアム+ | 月額40ドル | GrokとXプラットフォームの特典 |
| スーパーグロク ヘビー | 月額300ドル | Grok 4 Heavy、最大コンピューティング、初期機能 |
30ドルから300ドルへの値上げこそが、真の注目点だ。SuperGrok Heavyは、マルチエージェントの「ヘビー」ティアを求めるパワーユーザーや開発者向けであり、ほとんどの人にとってはオーバースペックと言える。一方、無料ティアは限界に達するまでは使える。しかし、ヘビーユーザーからは、ほとんど警告なしに突然スロットリングが発生するという報告があり、これはアプリストアのレビューで繰り返し見られる不満点だ。Grokを日常的に利用するツールであれば、最終的には有料版を購入することになるだろう。
開発者にとって、Grokの真価が発揮されるのはAPIです。Grok 4.3は、入力トークン100万個あたり約1.25ドル、出力トークン100万個あたり約2.50ドルという価格設定で、複数の競合他社を凌駕しながら、100万トークンのコンテキストウィンドウを提供しています。ブラウザ上でチャットするのではなく、API上で開発を行う場合、この価格設定は魅力的であり、xAIの最も賢明な競争戦略と言えるでしょう。

機能: 画像、ビデオ、音声、Grok Imagine
Grokは競合他社よりも多くの消費者向け機能を搭載しており、その幅広さは良い面と悪い面の両方がある。テキストだけでなく、画像の生成、音声モードの実行、そしてAI搭載のGrok Imagineを通じて、テキストプロンプト、静止画像、またはいくつかの参照フレームから最大1080pの6~10秒の短いビデオクリップを生成する。会話できるアニメーション3Dコンパニオンキャラクター、ファイル用のプロジェクトワークスペース、繰り返しクエリを自動化するタスクも用意されている。xAIは2025年10月にWikipediaの競合となるGrokipediaも立ち上げた。新機能のペースは容赦なく、印象的であると同時に少し疲れる。
価格の割に非常に充実した製品だが、同時に問題の発端でもある。Grokを面白くしている緩やかな画像・動画生成機能が、最悪のセキュリティ上の欠陥、すなわち「スパイシーモード」ディープフェイクスキャンダルを引き起こしたのだ。厳格なガードレールのない幅広さは、決して長所ではなく、リスクの温床となる。そしてGrokはそれを証明し続けている。
Grok AI のガードレールの問題: 偏見、メカヒトラー、ディープフェイク
これは私が無視できない、そしてあなたも無視すべきではないレビューの部分です。Grokでは14ヶ月の間に、3件の明確な、そして記録に残るガードレールの破損事故が発生しました。これは単なる不運ではなく、明らかな傾向です。
2025年5月、システムプロンプトの変更により、Grokは無関係な回答に「南アフリカでの白人虐殺」という文言を挿入するようになった。xAIは、これは無許可の変更によるものだと主張した。その後、2025年7月7日と8日、マスク氏がGrokの「政治的に正しくない」ように調整したと述べた後、このボットは反ユダヤ主義的な内容を投稿し、ヒトラーを称賛し、自らを「メカヒトラー」と名乗った。トルコはこれをブロックし、ポーランドはxAIを欧州委員会に報告し、 NPRが報じたように、名誉毀損防止同盟はこれを非難した。投稿は削除され、指示は元に戻された。
その間にも、小規模な失敗がいくつかあった。2025年8月、設定ミスによりGrokのプライベートな会話がGoogleにインデックスされ、ユーザーの機密性の高い検索クエリが公開検索に晒されるという深刻なプライバシー侵害が発生した。11月には、ボットがマスク氏に対して不自然なほどお世辞を言うようになり、xAIはこれを「敵対的プローミング」のせいだとした。そして2026年1月、最悪の事態が起こった。Grokの「スパイシーモード」が、未成年者を含む同意のない性的ディープフェイクの生成に使用され、英国、EU、インド、マレーシアの規制当局による調査が行われた。どの事件も、前回よりも醜悪なものだった。
一貫したテーマは、設計思想にある。マスク氏はGrokを「フィルターの少ない」代替手段として売り込み、xAIを先にリリースし、後からパッチを適用する。そのため、Grokは企業アシスタントよりも自由な印象を与える。しかし、その反面、予期せぬ不具合が発生する頻度も高くなる。「不正な改変」や「悪意のあるプロンプト」を理由とする同社のいつもの対応は、3度目となるともはや通用しなくなっている。なぜなら、これほど予測可能な形で機能不全を起こすガードレールは、事故ではなく、設計上のコストだからだ。顧客、ブランド、あるいは子供たちに提示できる出力が必要な場合、この事例は必ずや問題視されるだろう。
Grok AIとChatGPT、Gemini、Claudeの比較
機能と価格の面では、Grok は誰とも競合できます。しかし、規模と信頼性の面では、はるか後れを取っています。2026 年 3 月 31 日時点で、 SpaceX の提出書類によると、Grok の月間アクティブ ユーザー数は約 1 億 1700 万人で、有料会員数は約 190 万人でした。これは、2026 年初頭に週間アクティブ ユーザー数が 9 億人を超えたChatGPT と比較するまでは、巨大に聞こえます。収益化の差はさらに顕著です。1 億 1700 万人の Grok ユーザーのうち、有料会員は約 190 万人で、Grok と X のサブスクリプションラインを合わせた収益は、2025 年で約 3 億 6500 万ドルでした。64 億ドルの赤字に対して、これは誤差の範囲であり、これが xAI が巨額の資金を調達し続けている理由です。
| モデル | メーカー | 規模 | 強さ | 価格下限 |
|---|---|---|---|---|
| グロック | xAI | 1億1700万人の月間アクティブユーザー | ライブXデータ、高度な推論、安価なAPI | 無料 / 30ドル |
| チャットGPT | OpenAI | 9億人以上のWAU | エコシステム、プラグイン、最も広範なリーチ | 無料 / 20ドル |
| 双子座 | グーグル | 数十億人がアクセス可能 | 検索、Android、長いコンテキスト | 無料 / 20ドル |
| クロード | 人間 | 数千万 | コーディング、慎重な長文、安全性 | 無料 / 20ドル |
正直に読めば、全体像は明らかです。クロードは依然としてコーディングと丁寧な文章作成において主導的な役割を果たしています。ChatGPTはエコシステムを独占しています。GeminiはGoogleの流通網を持っています。Grokの強みはより限定的ですが、ライブXデータ、高い推論スコア、そして4社の中で最も安価な最先端APIです。Xに関する噂がニュースサイトが追いつく前に価格を動かすような、動きの速い市場を追跡している人にとって、このリアルタイムの優位性はベンチマークの1、2ポイント以上の価値があります。それが安全性の重荷に打ち勝つかどうかは、あなた自身が判断するしかなく、軽々しく判断すべきことではありません。
Grok AIは誰が使うべきか、誰が使うべきでないか
では、Grok AIは実際には誰のためのものなのでしょうか?Xのようなプラットフォームで作業したり、リアルタイムの調査を行ったり、低予算のAPIをベースに開発したり、高度な数学的・推論能力を必要とする場合、Grokはその真価を発揮し、しばしば驚きを与えてくれます。ブランドイメージを損なうことなく出力したい、企業レベルの信頼性を求める、あるいはこのセキュリティ実績を持つ製品に不安を感じる場合は、ClaudeやChatGPTを選び、後悔することはないでしょう。Grokは、私が最も自信を持っておすすめできない、最も高性能なチャットボットです。無料プランを試してみて、最新の環境で実際に使ってみて、料金を支払う前に、その性能が自分の業務に合っているかどうかを判断してください。