検出不可能なAI:ChatGPTヒューマナイザーとAI検出ツールの比較
教師が生徒のエッセイをTurnitinに貼り付ける。結果はAIによる生成が92%。生徒は自分が書いたと断言する。どちらも正しいかもしれないし、どちらも間違っているかもしれない。2026年、オンライン上の文章を実際に書いたのは誰なのかを巡る、数十億ドル規模の熾烈な軍拡競争へようこそ。
「検出不可能なAI」というキーワードが、この争いの中心にあります。これは、AIヒューマナイザーと呼ばれる、小規模ながら急速に成長している製品カテゴリーを指します。これらのツールは、ChatGPTやGeminiの出力を受け取り、書き換えます。その目的は、Turnitin、GPTZero、Originality.aiなどの検出ツールが、機械が書いたものとしてフラグを立てないようにすることです。この分野では20社以上が事業を展開しています。最大のブランドであるUndetectable.aiは、34人のチームで1100万人のユーザーを抱えていると主張しています。一方、検出ツール側は年間数億件の提出物を処理しています。2025年のFTCの和解が示したように、両陣営とも自社ソフトウェアの実際の機能を過大に宣伝する傾向があります。このガイドでは、あらゆる側面を解説します。検出不可能なAIツールとは何か。検出ツールの仕組み。現在の市場状況。回避の試みが成功するものと失敗するものがある理由。裁判所や大学が検出に懐疑的になっている誤検出スキャンダル。そして、簡単に越えてしまう倫理的な一線。
検出不可能なAIとは何か?ヒューマナイザーのカテゴリーを解説します。
「検出不可能なAI」とは、AIが生成したコンテンツを書き換えるソフトウェアの略称です。その目的は、検出ツールでAIとして検出されないようにすることです。これらの製品にはいくつかの名称があります。AIヒューマナイザー、AIバイパスツール、アンチ検出リライターなどです。ほとんどの製品は、学術論文やSEOライティングのバイパスツールとして販売されています。これらは、ユーザーとAIチェッカーの間に位置します。ChatGPTからテキストをツールに貼り付けると、ヒューマナイザーがそれを言い換えます。新しいバージョンは、Turnitin、GPTZero、Copyleaks、ZeroGPTなどのAI検出ツールを通過できるはずです。ベンダーはこれを「AIによる検出を回避するワークフロー」と呼んでいます。
2023年、ChatGPTの登場によりAIによる文章作成が極めて容易になり、AI検出モデルも容易に入手できるようになったことで、この分野は爆発的に成長した。1年以内に、数十ものヒューマナイザー製品が登場した。そのほとんどは、オープンソースの言語モデルをベースに構築された、薄い言い換えレイヤーである。優れた製品は、人間のテキストと特定の検出器の失敗パターンに基づいて、検出不可能なAIヒューマナイザーを学習させる。一方、質の低い製品は、同義語をシャッフルしたり、文を分割したりするだけだ。
宣伝されているユースケースは多岐にわたる。コンテンツクリエイターやマーケターは、AIが生成したブログの下書きを人間味のある文章にすることで、検索エンジンからのSEOトラフィックを抑えつつ、文章スタイルがロボットのように聞こえないようにしている。英語を母国語としないライターは、下書きを無料のAIヒューマナイザーに通して、より自然な文章に仕上げている。学術ユーザー(物議を醸しているグループ)は、AIの不正使用を隠蔽するためにこれを使用しており、時には盗作に近い行為に及ぶこともある。カスタマーサポートチームは、AIの出力をより人間らしく会話的なものにするためにこれを使用することがあり、まるで人が実際に話すような表現にしている。正当な編集と学術的な不正行為の境界線こそが、政策論争のほとんどが起こっている場所であり、どちらの文脈においても検出不可能なAIがどのように使用されるかが論争の中心となっている。ベンダーは検出不可能なAIツールの機能を退屈な生産性向上ツールとして売り込んでいるが、批評家はそれを不正行為のインフラと見なしている。
| 一般的な用語 | それはどういう意味か |
|---|---|
| AIヒューマナイザー | AIのテキストを人間の声に書き換えるツール |
| AIバイパスツール/検出器バイパスツール | 同じ製品だが、検出器を背景に並べている。 |
| 検出回避リライター | 同じ商品だが、SEO対策のためにフレーム化されている。 |
| AI検出器 | AIが生成したテキストを検出するツール |
| 透かし | AI出力に埋め込まれた統計的シグナル |
| 出所/コンテンツの信頼性 | コンテンツの出所を示す暗号化記録(C2PA) |
AI検出器がChatGPTテキストをどのようにフラグ付けして書き換えるか
検出器を回避するには、検出器が何を探しているのかを知る必要があります。最新のAI検出器は、機械による筆跡と人間の筆跡を区別するのに役立つ、ごく少数の信号に依存しています。
最もよく引用される指標は「パープレキシティ」です。2023年初頭に発売された消費者向け検出ツールGPTZeroは、パープレキシティを「驚き度」と呼んでいます。言語モデルは、次に続く可能性が最も高い単語を選択します。予測可能でパープレキシティの低いテキストは、機械が生成した文章のように見えます。人間は、特に文の途中で退屈したりイライラしたりすると、奇妙な単語を選んでしまい、パープレキシティが上昇します。
次に、文の長さのばらつきがあります。人間の文章は、段落全体を通して文の長さや複雑さが大きく変化する傾向があります。短い文の断片、3つの節からなる長く回りくどい文、そして4語の簡潔な文。一方、LLMの出力はより均一で、文は14~22語程度にまとまり、その範囲に留まります。検出器はこのばらつきを測定します。
次にNグラムの出現頻度が注目されます。「delve into」「vibrant tapestry」「in today's rapidly evolving landscape」といった特定のフレーズは、2023年以降、それ以前よりもはるかに頻繁に出現するようになりました。検出器はこれらのAIの特徴をパターンライブラリに蓄積しており、より大規模なライブラリは常に更新されています。
そして最後に、微調整されたニューラル分類器。ほとんどの最新のコンテンツ検出ツールは、統計の上にBERTまたはRoBERTaクラスモデルを重ねています。これらの機械学習アルゴリズムは、AIが書いた文章と人間が書いた文章を識別するように設計されています。ラベル付けされた人間とAIのテキストでトレーニングされています。出力は、AIによって生成されたコンテンツの確率スコアです。GPTZeroは現在、7つの個別のコンポーネントをバンドルしています。スタイルメトリックプロファイル。ライブWeb検索。文構造分析。長さと複雑さのパターンはすべてスコアに反映されます。
検出器の中には透かしを探すものもあります。Google の SynthID は、Gemini テキストに統計信号を埋め込んでいます。OpenAI は ChatGPT 用の透かしを内部的に検証しましたが (ウォール ストリート ジャーナル、2024 年 8 月)、まだ出荷していません。OpenAI のユーザー調査によると、ChatGPT ユーザーの約 30% が、出力に透かしが入ると製品の使用頻度が減ると回答しています。画像透かしはさらに進んでおり、OpenAI は 2024 年 5 月に C2PA に参加し、現在ではデフォルトで DALL-E 3 出力にコンテンツ クレデンシャルを添付しています。

検知不可能なAIの仕組みとは?
ヒューマナイザーは、検出器が注目する信号と同じ信号を逆の方向から攻撃します。それぞれのツールは、検出器が検出した信号を無効にするように設計されています。マーケティングの売り文句は常に「検出不可能なAIとは、AIを自然な文章に変換する高度な書き換えツールである」といったものです。ベンダーは、軍拡競争のどちらの側に立つかによって、自社製品が最も正確なAI書き換えツールであるか、あるいは最も正確なAI検出ツールであるかを競い合います。
典型的なパイプラインは単純なところから始まります。入力をオンラインのAI言い換えツールに通します。モデルは人間の文章に合わせて微調整されています。予期しない単語を挿入することで、テキストを人間らしくし、パープレキシティを高めます。文の構造を変化させて、単調さを打破します。フラグが立てられたn-gramを、あまり一般的でないフレーズに置き換えます。ベンダーは、自社のツールがAIの出力をより人間らしく聞こえるように変換できると主張しています。AI検出器によるチェックをすり抜け、元の意味を維持できると主張しています。実際に高品質のコンテンツを提供できるのでしょうか?それは製品によって大きく異なります。ツールによっては、ワンクリックでテキストを検出不可能にできると宣伝しているものもあります。マーケティングコピーや、テキストを検出不可能にできるという主張は、実際の出力では必ずしも満たされません。
メリーランド大学は2023年にこの分野で最も有力な理論論文を発表した。研究チームを率いたのはソヘイル・フェイジ氏だ。彼らのプレプリント「AI生成テキストは確実に検出できるか?」(arXiv:2303.11156)は、ある大きな主張をしていた。言語モデルの上に軽量なニューラルパラフレーザーを配置すれば、あらゆる検出方法を打ち破ることができるというのだ。電子透かし、ニューラル分類器、ゼロショット検出、すべてだ。メリーランド大学のニュースリリースにおけるフェイジ氏の言葉は率直だった。「文書がAIによって書かれたものか、人間によって書かれたものかを確実に判別することはできないという事実に慣れるしかないだろう。」
より優れたヒューマナイザーはさらに進化しています。特定の検出器を相手に学習するのです。製品チームはChatGPTからAIテキストのデータセットを取得し、TurnitinやGPTZeroで処理し、検出器が生成するスコアを最小限に抑えるようにパラフレーザーを学習させます。目標は、AIテキストを分類器をすり抜け、AI検出を通過できるほど人間らしく聞こえるようにすることです。これは基本的に、逆方向の敵対的学習です。ユーザーは、特定の相手に勝つように最適化された多数のAIライティングツールのうちの1つを入手し、それぞれのマーケティングでは「検出不可能なAIがあなたの原稿をAIチェッカーに検出されないものに書き換えます」といった趣旨の宣伝文句が使われます。ベンダーは、書き換えによってコンテンツが検出不可能になると主張し、結果が常にAI検出を通過すると宣伝することがよくあります。これが、同じヒューマナイザーの出力に対して、検出器によってバイパス率が大きく異なる理由でもあります。実際には、検出不可能なAIはスコアを下げるのに役立ちますが、ゼロにすることはめったにありません。ツールがAIテキストを自然な人間の文章に変換するというマーケティング上の主張は、通常、一貫性を誇張しています。
トレードオフは品質です。DitchNetやRedditのr/WritingWithAIのユーザーレビューでは、同じ不満が何度も指摘されています。ヒューマナイザーは「私は思う」「私の経験から言うと」といった、本来は不適切な表現を挿入する傾向があります。文のつながりが途切れたり、ブランドボイスが平坦化されたりすることもあります。あるレビュアーは、無料版の出力を「一般向けコンテンツとしては10点満点中5点程度」と評価しました。ヒューマナイザーは検出スコアを99%から50%に下げることもありますが、文章が不自然に読めてしまうと、得られるメリットは学術的なものに過ぎません。
市場:Undetectable.ai、BypassGPT、QuillBotなど
市場リーダーは Undetectable.ai です。ここでは、AI は単なるサービスではなくツールです。このプラットフォームは、検出不可能な AI ヒューマナイザー、無料の検出器、および Chrome 拡張機能を組み合わせています。同社は 2023 年 1 月に設立されました。創設者は Christian Perry、Devan Leos、および Bars Juhasz です。Ben Miller は後に COO として加わりました。法務上の本社はワイオミング州シェリダンの Coffeen Avenue 1309 にあります。プレスリリースには、アイダホ州ボイシにも拠点があると記載されています。Undetectable.ai は自己資金で運営されています。ベンチャー ファンドの情報は公開されていません。PR Newswire によると、同社は 2024 年 11 月までに 1,100 万人のユーザーを獲得しました。これは、サービス開始から 18 か月後です。GetLatka は、2025 年 9 月に Undetectable.ai の ARR を 370 万ドルと推定しました。従業員は約 34 人です。Tracxn は、2025 年 4 月に未確認の M&A オファーを報じました。
競合製品は幅広く、価格帯も細かく分かれている。
| 道具 | 創業者/親 | エントリープラン | トッププラン | 注目すべき |
|---|---|---|---|---|
| 検出不可能なAI | クリスチャン・ペリー | 月額9.99ドル | 無制限 | 1100万人のユーザー(2024年11月時点) |
| StealthGPT | ヨゼフ・ゲルマン | 月額14.99ドル | 月額29.99ドル+追加料金4.99ドル | 売上高220万ドル(2023年12月時点) |
| BypassGPT | HIX.AI | 月額6.99ドル | 月額29.99ドル | 無料枠には限りがあります |
| HIXバイパス | HIX.AI | 無料クレジット20個 | 月額49.99ドルで無制限 | プレミアムな位置付け |
| クイルボット・ヒューマナイザー | Learneo(Course Heroの親会社) | 月額4.17ドル(年間契約) | — | QuillBotスイート全体で5000万人以上のユーザー |
| フレーズリー | 独立した | 無料(550語) | 月額12.99ドルで無制限 | 年間請求 |
| ウォルターがAIについて書く | 独立した | 月額約13ドル(年間契約) | 月額約25ドル | プレミアムな位置付け |
Undetectable.aiは、検出と人間化の両方を同じダッシュボードで提供するワンストップショップとして位置づけられています。同社の検出器は99%の精度を誇り、「査読済みの研究では100%の検出率」を達成しています。人間化機能はマルチ検出器スコアリングを採用しており、結果を返す前に8つ程度の検出器モデルに対して出力を同時にテストします。Chrome拡張機能と50言語対応は、他社との大きな差別化要因となっています。
AIコンテンツ作成分野のリーダーは、Learneo(Course Heroと同じ親会社)が所有するQuillBotです。QuillBotの幅広いライティングスイートは5,000万人以上のユーザーに利用されており、AIヒューマナイザーはその数十の機能の一つです。QuillBotに搭載されているAI検出機能は、1回のスキャンで最大1,200語、1日6回まで無料で利用できます。どちらの製品も学生に人気が高く、まさにそれが大学がQuillBotの利用状況を特に監視するようになった理由です。
市場規模は、その認知度に比べて小さい。生成型AI全体は、2025年には590億ドルのカテゴリーだった(Statista調べ)。AI検出器市場だけを見ると、さらに小さい。MarketsandMarketsによると、2025年には約5億8000万ドル。2030年までに20億6000万ドルに達すると予測されている。人間化の分野はさらに小さく、より細分化されている。集計された数値は存在しない。追跡対象となっている30のツールの公開された収益に基づくボトムアップ推定では、この分野全体の年間経常収益は5000万ドルから1億5000万ドルとされている。
AIヒューマナイザーは実際に検知器を回避できるのか?
簡潔に答えると、場合によっては、一部の検出器に対しては、画質に大きな犠牲を払うことになる。
より詳しい回答は、独立したテストから得られます。検出器ベンダーであるOriginality.aiは、Undetectable.aiのヒューマナイザーで制御実験を実施しました。オリジナルのChatGPTテキストとヒューマナイズされたバージョンはどちらも、Originality.aiで100%のAIスコアを獲得し、信頼度も同等でした。Writer.comはほとんど変化が見られませんでした(6%から3%)。GPTZeroは100%から91%に低下しました。バイパス効果は、最も強力な検出器でもせいぜいわずかなものでした。
Aithor社が2026年に実施したより詳細なレビューでは、Undetectable.aiの出力を4つの検出器に通した結果、以下の表が作成されました。
| 検出器 | オリジナルのAIスコア | ヒューマナイザーの後 | 結果 |
|---|---|---|---|
| GPTゼロ | 97% | 72% | 部分的にバイパス |
| オリジナリティai | 99% | 81% | バイパスされていません |
| コピーリークス | フラグが立てられた | フラグが立てられた | バイパスされていません |
| ZeroGPT | 94% | 61% | 部分的にバイパス |
レビュー全体を通して、この傾向は一貫しています。ZeroGPTとGPTZeroは削除されやすい一方、Originality.aiとCopyleaksは維持される傾向があります。これは偶然ではありません。Originality.aiは敵対的な言い換えテキストのために特別に構築されており、その内部ベンチマーク(Pangramが2026年1月にJAITで発表した論文に掲載)では、QuillBotで言い換えられたサンプルに対して約97%の検出率を示しています。
ベンダーによる精度に関する主張は、独立したテストに耐えうるものはほとんどない。
| 検出器 | ベンダーの主張 | 独立したテスト |
|---|---|---|
| Turnitin | 精度98%、偽陽性率1%未満 | 約85%の再現率(Turnitinの製品責任者自身が認めている)。AIが生成した事例が過大であると指摘されている。 |
| オリジナリティai | 「業界のリーダー」 | 生のAIには強いが、敵対的AIには弱い |
| コピーリークス | 99.12% | QuillBotによる言い換えテキストでは約50% |
| GPTゼロ | 「多層7成分」 | AI導入前のエッセイでは、1~2%の偽陽性率が見られた。 |
| ウィンストンAI | 99.98% | 変動要因:ブログ記事100%、電子書籍サンプル3% |
| OpenAI Classifier | 該当なし | 2023年7月に閉鎖された時点でのリコール率は26%だった。 |
これらの条件すべてにおいて完璧な検出器は存在しません。そうでないと主張するベンダーは、制御された条件下でAIが生成した検出不可能なコンテンツに対する限定的なベンチマークの結果を発表する傾向があります。
OpenAI自身のAI Classifierは、最も決定的な事例と言えるだろう。同社は2023年1月にこのAI Classifierをリリースしたが、同年7月20日にひっそりとサービスを停止した。その理由は、正答率がわずか26%だったこと。OpenAI自身も、このモデルが「信頼できない」と認めている。代替モデルはまだリリースされていない。ウォール・ストリート・ジャーナル紙の報道によると、社内で99.9%の精度と検証された同社の電子透かし技術の研究成果は、2年半経った今も未発表のままだ。
誤検出:AI検出器が人間の筆跡と誤認する場合
2024年から2026年にかけてより重要な問題は、AI検出器が逆方向においても深刻な失敗を犯すということだ。
スタンフォード大学のジェームズ・ゾウ氏とそのチームは、「GPT検出器は英語を母語としない書き手に対して偏りがある」という論文をPatterns誌(2023年7月、arXiv:2304.02819)に発表した。彼らは英語を母語としない学生が書いたTOEFLのエッセイを7つの主要な検出器で分析した。その結果、これらの検出器はエッセイの61.22%をAI生成と判定した。一方、米国生まれの8年生が書いたエッセイでは、同じ検出器がAI生成と判定した割合はほぼゼロだった。この偏りには単純な技術的理由がある。第二言語としての英語は語彙の多様性が低く、構文も単純であるため、パープレキシティに基づくスコアラーには「AIのように見える」のだ。その弊害は明白で、まさにこれらのツールを導入している教育機関の留学生が最も大きな影響を受ける。
Common Sense Mediaが2024年に発表したAI検出による弊害に関する報告書は、その実態をより明確に示している。10代の若者全体の約10%が、AIを使用したとして誤って告発されたと報告している。この割合は黒人の10代では20%に上昇し、白人の7%、ラテン系の10%を大きく上回っている。こうした格差は、AIの基盤となる言語モデルにおける既知のバイアスに加え、ツールが学生を問題視した際に教師がどのように対応するかという点にも起因している。
最も世間の注目を集めた初期の失敗例は、2023年5月にテキサスA&M大学コマース校で起きた。農業科のジャレッド・マム博士は、学生のエッセイをChatGPTに貼り付け、それが自分の書いたものかどうかを尋ねた。ChatGPTはすべてのエッセイに「はい」と答えた(いつものように、とても役に立った)。その後、マム博士は学生の半数を落第させた。大学は数日後に方針を転換した。学生たちはGoogleドキュメントのバージョン履歴を使って、自分たちがエッセイを書いたことを証明した。ワシントン・ポスト、NBCニュース、ローリング・ストーン、インサイド・ハイアー・エドなどがこの出来事を取り上げた。
規模の大きな教育機関は、TurnitinのAI検出機能を全面的に無効化し始めた。UCLA、UCサンディエゴ、カリフォルニア州立大学ロサンゼルス校、ヴァンダービルト大学はいずれもこの機能を停止した。彼らは誤検出や留学生への不均衡な影響を理由に挙げた。カリフォルニア州立大学システムだけでも、2024~2025年度にAI検出ソフトウェアに110万ドルを費やした。カリフォルニア州の公立大学システム全体の支出額は1500万ドルを超えた。
そして2025年8月、FTC(連邦取引委員会)が厳しい措置を講じた。Workadoは、Content at Scaleの「AIコンテンツ検出ツール」を所有していた企業で、社名変更後の名称である。同社は98%の精度を謳っていたが、FTCの調査官は、一般的なコンテンツにおける実際の精度は53%に過ぎないことを突き止めた。このモデルは学術的な文章のみで学習されており、それ以外のコンテンツでは精度が著しく低下していた。2025年8月28日の同意命令により、Workadoは根拠のない主張を中止するよう命じられた。また、この命令では、FTCが作成した通知を既存顧客に送付することも義務付けられた。これは、虚偽広告を理由にAI検出ベンダーに対してFTCが行った初の執行措置となった。

倫理的な境界線:AIテキストを人間化することが危険になるのはいつなのか
AIによる人間化技術の利用のほとんどは合法です。また、ほとんどは不正行為でもありません。状況によります。
正当な使用例は以下のとおりです。中小企業の経営者が、ChatGPTで作成したブログ記事をヒューマナイザーに通します。企業的なトーンを和らげたいからです。その後、公開前に編集します。英語を母国語としないライターが、文法チェッカーを使うようにヒューマナイザーを使用します。目的は、意味を変えずに表現を洗練することです。マーケティングチームが社内製品コピーを言い換えます。これらのいずれも、ポリシーや契約に違反するものではありません。また、実際の作業内容を偽る行為でもありません。
危険な使用法は学術的なものです。ほとんどの大学は、授業におけるAIの無許可使用を禁止しています。最近では、AIによる人間化処理を特に禁止する大学が増えています。Turnitinは2025年8月のアップデートで、最も一般的な人間化処理パターンを標的とした回避機能を追加しました。オリジナルの作品が求められる課題に、人間化されたAIテキストを提出することは学術不正です。これはほとんどの大学の方針で認められています。検出されるかどうかに関わらず、不正行為は変わりません。不正とは、著者を偽ることであり、回避策は単なる手段に過ぎません。
商業出版は、より曖昧な中間層に位置する。ニューヨーク・タイムズは2026年1月にフリーランス評論家のアレックス・プレストンとの関係を断った。調査の結果、彼の書評にガーディアン紙の記事を言い換えたAI生成の段落が含まれていることが判明した。ワシントン・ポストも2025年12月に同様の事件を起こしている。社内のAIポッドキャスト機能が捏造された引用を配信したのだ。このスクープはセマフォーの調査によって明らかになった。どちらの報道機関もAIの使用を完全に禁止しているわけではない。両社とも、読者が人間が書いたものだと合理的に期待するような、非公開のAI使用を禁止している。
より安全な倫理的デフォルトは次のようになります。テキストがAIによって作成されたことを読者が気にする可能性がある場合は、それを開示します。課題でAIの使用が禁止されている場合は、事実を隠すために出力をヒューマナイザーに通してはいけません。完全に検出不可能なAIツールは、この倫理的問題を回避するのに役立ちません。検出不可能なAIが表現の修正に役立つ場合でも同様です。ヒューマナイザーを使用して企業的な印象を和らげたり、自分の原稿の第二言語の表現を修正したりする場合は、学術的および専門的な文脈では編集に近い行為となります。ほとんどのポリシーでは、これについてはあまり言及していません。
政策の方向性は、検出よりも出所確認へとシフトしている。C2PAは、コンテンツの出所と真正性に関する連合(Coalition for Content Provenance and Authenticity)の略で、暗号化されたコンテンツ認証情報を画像や動画に埋め込む。OpenAIは2024年5月に運営委員会に加わった。同社は現在、DALL-E 3の出力にデフォルトで認証情報を付加している。Adobe、Microsoft、Google、BBC、NYT、Sonyもメンバーである。C2PAの仕様はISO標準として迅速に策定されている。テキストに関しては、同等の透かし規格は大規模には未解決のままだ。それらが実用化されるまでは、回避と検出の軍拡競争が続く。