无法检测的人工智能:ChatGPT Humanizer 与人工智能检测工具的对比
一位老师把学生的作文粘贴到Turnitin网站。结果显示:92%是AI生成的。学生坚称作文是自己写的。双方可能都对,也可能都错。欢迎来到这场混乱不堪、耗资数十亿美元的“网络写作鉴定”竞赛,看看2026年究竟是谁在网上写的东西。
“无法检测的人工智能”是这场争论的核心。它指的是一种名为“人工智能人性化工具”的、规模虽小但增长迅速的产品类别。这些工具会获取 ChatGPT 或 Gemini 的输出结果并进行改写。其目标是让 Turnitin、GPTZero 和 Originality.ai 等检测器不再将其标记为机器编写。目前有二十多家公司涉足这一领域。其中最大的品牌 Undetectable.ai 声称,其 34 人的团队仅靠自筹资金就拥有 1100 万用户。而另一方的检测器每年要处理数亿份提交内容。正如 2025 年美国联邦贸易委员会 (FTC) 的一项和解协议所揭示的那样,双方都习惯于夸大其软件的实际功能。本指南将逐层解读:什么是无法检测的人工智能工具;检测器的工作原理;当前的市场状况;为什么有些绕过检测的尝试能够成功,而有些则失败;导致法院和大学对检测产生怀疑的误报丑闻;以及容易被逾越的道德底线。
什么是无法检测的人工智能?人性化人工智能类别详解
“无法检测的AI”是指一种能够重写AI生成内容的软件。其目标是:避免被检测工具判定为AI生成的内容。这类产品有多种名称,例如AI人性化工具、AI绕过工具和反检测重写工具。大多数产品都以学术写作和SEO写作的绕过工具为卖点。它们位于用户和AI检测器之间。用户只需将ChatGPT生成的文本粘贴到工具中,人性化工具就会对其进行改写。新版本据称能够绕过Turnitin、GPTZero、Copyleaks或ZeroGPT等AI检测工具。供应商将这种工作流程称为“AI检测绕过”。
2023年,随着ChatGPT的发布,人工智能生成文本变得异常简单,人工智能检测模型也变得唾手可得,人工智能人性化产品市场迎来爆发式增长。短短一年内,数十款人性化产品涌现。它们大多基于开源语言模型构建,只是简单的释义层。优秀的人性化产品会利用人类文本和特定检测器的失效模式,训练出难以被检测到的人工智能人性化器。而劣质的产品则只会随意打乱同义词顺序,甚至破坏句子结构。
人们宣传的应用场景十分广泛。内容创作者和营销人员会使用人工智能生成的博客草稿,使其更人性化,从而在不显得生硬机械的情况下,吸引搜索引擎的流量。非英语母语人士会使用免费的人工智能人性化工具来润色草稿,使其措辞更加自然流畅。学术用户(一个备受争议的群体)则利用这些工具来掩盖未经授权的人工智能使用,有时甚至游走在抄袭的边缘。客户支持团队有时也会使用它们,将人工智能的输出转化为更人性化、更自然的对话,就像真人会说的话一样。合法编辑和学术作弊之间的界限正是大多数政策争论的焦点,而如何让无法被检测到的人工智能在这两种情况下都能被使用,正是争议的核心所在。供应商将这些无法被检测到的人工智能工具的功能宣传为提升效率的实用工具,而批评者则认为它们是作弊的工具。
| 常用词 | 它的含义 |
|---|---|
| AI人性化 | 这款工具可以将人工智能生成的文本改写得更像人类的语言。 |
| AI绕过器/检测器绕过工具 | 同一产品,针对探测器进行装裱 |
| 反检测重写器 | 同一产品,针对搜索引擎优化进行了优化。 |
| AI检测器 | 标记人工智能生成文本的工具 |
| 水印 | 人工智能输出中嵌入的统计信号 |
| 出处/内容凭证 | 内容来源的加密记录(C2PA) |
AI检测器如何标记和重写ChatGPT文本
要绕过检测器,你必须知道它检测的是什么。现代人工智能检测器依赖于少数几个信号来区分机器写作和人类写作。
困惑度是被引用最多的指标。面向消费者的语言检测器 GPTZero 于 2023 年初发布,它将困惑度称为其“惊喜度指标”。语言模型会选择最有可能出现的下一个词。可预测的、困惑度低的文本读起来像是机器生成的。而人类,尤其是在句子进行到一半感到无聊或沮丧时,会选择一些奇怪的词语,从而增加困惑度。
然后是突发性。人类写作中,句子的长度和复杂程度往往在段落内变化很大。可能是一个简短的片段,然后是一个冗长曲折、包含三个从句的句子,接着又是一个简洁有力的四字句。LLM 的输出则更为统一:句子长度集中在 14 到 22 个单词左右,并且保持在这个范围内。检测器会测量这种差异。
接下来是N元语法频率。特定短语(例如“深入研究”、“绚丽多彩的图景”、“在当今快速发展的格局中”)在2023年之后出现的频率远高于之前。检测器会维护这些人工智能提示的模式库,而更大的模式库会不断更新。
最后,还有一个经过微调的神经网络分类器。大多数现代内容检测工具都会在统计数据之上叠加一个 BERT 或 RoBERTa 类模型。这些机器学习算法旨在识别 AI 撰写的段落与人类撰写的段落。它们使用已标注的人类文本和 AI 文本进行训练。输出结果是 AI 生成内容的概率得分。GPTZero 现在整合了七个独立的组件:文体特征分析、实时网络搜索、句子结构分析。长度和复杂度模式都会影响最终得分。
一些检测器还会检测水印。谷歌的 SynthID 在 Gemini 文本中嵌入了一个统计信号。OpenAI 已在内部验证了 ChatGPT 的水印(《华尔街日报》,2024 年 8 月),但尚未发布。根据 OpenAI 的用户调查,约 30% 的 ChatGPT 用户表示,如果输出结果带有水印,他们会减少使用该产品。图像水印技术发展更为成熟:OpenAI 于 2024 年 5 月加入 C2PA,现在默认将内容凭证附加到 DALL-E 3 输出结果中。

难以察觉的人工智能是如何运作的?
人性化工具攻击的信号与检测器所关注的信号相同,但方向相反。每种工具的设计目的都是为了消除检测器标记的信号。其营销宣传总是类似这样:“无法检测的人工智能是一种高级重写工具,可以将人工智能生成的文本转换为自然流畅的文字。” 供应商竞相宣称自己是最精准的人工智能重写工具或最精准的人工智能检测工具,这取决于他们在这场军备竞赛中站在哪一边。
典型的流程始于一个简单的步骤:将输入文本输入在线AI改写器。该模型基于人类写作进行微调,通过注入意想不到的词语来增加文本的复杂性,使其更人性化。它还会改变句子结构,打破突兀感的统一性,并将标记的n-gram替换为不常用的短语。供应商声称他们的工具可以将AI输出转换为更接近人类写作的文本,并声称它能够绕过AI检测器的检测,同时保持原文含义。但它真的能提供高质量的内容吗?这在不同产品之间差异巨大。有些产品宣称只需点击一下即可让文本变得无法被检测到。然而,营销文案和“无法被检测到”的说法并不总是与实际输出相符。
马里兰大学于2023年发表了一篇关于此主题的最有力理论论文。该团队由Soheil Feizi领导。他们的预印本论文《人工智能生成的文本能否被可靠地检测?》(arXiv:2303.11156)提出了一个重要论断:在语言模型之上构建一个轻量级的神经释义器,就能破解所有检测方法,包括水印技术、神经分类器和零样本检测。Feizi在马里兰大学新闻稿中直言不讳地表示:“我们应该接受这样一个事实:我们将无法可靠地判断一份文档是由人工智能撰写还是由人类撰写。”
更优秀的拟人化工具功能更强大。它们会针对特定的检测器进行训练。产品团队会从 ChatGPT 获取 AI 文本数据集,将其输入 Turnitin 或 GPTZero 进行检测,然后训练拟人化工具,使其尽可能降低检测器给出的分数。目标是让 AI 文本听起来足够自然,从而绕过分类器,通过 AI 检测。这本质上是反向的对抗训练。用户会得到许多 AI 写作工具中的一种,这些工具都针对特定的对手进行了优化,而每种工具的营销宣传都是“无法检测的 AI 会将您的草稿改写成 AI 检查器无法检测到的内容”。供应商声称,这种改写可以使内容无法被检测到,并且经常宣传其结果能够始终如一地通过 AI 检测。这也是为什么对于同一份拟人化输出,不同检测器的绕过率差异如此之大的原因。实际上,无法检测的 AI 有助于降低分数,但很少能将其降至零。营销宣传中声称该工具可以将 AI 文本转换为听起来自然的人类写作,通常夸大了其一致性。
权衡之下,质量成了代价。DitchNet 和 Reddit 的 r/WritingWithAI 版块上的用户评论反复提到同样的问题:人性化工具往往会添加一些冗余的词语,比如“我认为”、“根据我的经验”等等。这些词语被生硬地塞进不合适的地方,导致句子衔接不畅,甚至有些修改会使品牌声音变得扁平化。一位评论者给免费版的“面向公众的内容”打出了“大约 5 分(满分 10 分)”的评价。人性化工具可能会将检测得分从 99% 降到 50%。但如果修改后的文章读起来很别扭,那么这种提升也只是理论上的。
市场上的产品包括:Undetectable.ai、BypassGPT、QuillBot 等。
市场领导者是 Undetectable.ai。在这里,人工智能不仅仅是一项服务,更是一种工具。该平台整合了无法被察觉的人工智能人形化工具、免费检测器和 Chrome 浏览器扩展程序。公司成立于 2023 年 1 月,创始人为 Christian Perry、Devan Leos 和 Bars Juhasz。Ben Miller 后来加入担任首席运营官。公司总部位于怀俄明州谢里丹市 Coffeen 大道 1309 号。新闻稿还提到,公司在爱达荷州博伊西市设有办事处。Undetectable.ai 完全依靠自有资金发展,未披露任何风险投资。据 PR Newswire 报道,该公司在 2024 年 11 月用户数量达到 1100 万,距离上线仅 18 个月。GetLatka 预测 Undetectable.ai 在 2025 年 9 月的年度经常性收入 (ARR) 为 370 万美元,员工约 34 人。Tracxn 于 2025 年 4 月报道了一项未经证实的并购要约。
竞争格局广泛且价格细分:
| 工具 | 创始人/家长 | 入口计划 | 最高计划 | 值得注意 |
|---|---|---|---|---|
| 无法检测。 | 克里斯蒂安·佩里 | 每月 9.99 美元 | 无限 | 1100万用户(2024年11月) |
| StealthGPT | 约瑟夫·格尔曼 | 每月 14.99 美元 | 每月 29.99 美元 + 4.99 美元附加费 | 2023年12月营收220万美元 |
| 绕过GPT | HIX.AI | 每月 6.99 美元 | 每月 29.99 美元 | 免费档位有限 |
| HIX旁路 | HIX.AI | 免费获得 20 个积分 | 每月 49.99 美元,无限流量 | 优质定位 |
| QuillBot 人形机器人 | Learneo(Course Hero 的母公司) | 每月 4.17 美元(年费) | — | QuillBot 套件拥有超过 5000 万用户 |
| 弗拉斯利 | 独立的 | 免费550字 | 每月 12.99 美元,无限流量 | 年度账单 |
| 沃尔特撰写人工智能 | 独立的 | 约13美元/月(年费) | 每月约 25 美元 | 优质定位 |
Undetectable.ai 将自身定位为一站式服务平台,在同一控制面板中集成了人格检测和人性化功能。其检测器声称准确率高达 99%,并在同行评审的研究中实现了 100% 的检测率。其人性化功能则采用多检测器评分,这意味着它会同时使用大约八个检测器模型对输出结果进行测试,然后再返回最终结果。Chrome 扩展程序和 50 种语言的支持是其真正的优势所在。
在人工智能内容创作领域,QuillBot 是领军者,它隶属于 Learneo(与 Course Hero 同属一家母公司)。QuillBot 的写作套件拥有超过 5000 万用户,其人工智能人性化工具只是众多功能之一。QuillBot 内置的人工智能检测器支持每次扫描最多 1200 个单词,每天最多可免费扫描 6 次。这两款产品都深受学生欢迎,因此大学现在会专门监控 QuillBot 的使用情况。
相对于其知名度而言,生成式人工智能的市场规模较小。据 Statista 统计,2025 年生成式人工智能整体市场规模将达到 590 亿美元。而人工智能检测器市场规模则小得多。MarketsandMarkets 的数据显示,2025 年其市场规模约为 5.8 亿美元,预计到 2030 年将达到 20.6 亿美元。人性化人工智能领域的市场规模更小,也更加分散,目前尚无汇总数据。根据 30 款追踪工具的公开收入,自下而上估算,整个领域的年经常性收入约为 5000 万美元至 1.5 亿美元。
AI人性化功能真的能绕过检测器吗?
简而言之:有时,对于某些探测器来说,会付出相当大的质量代价。
更详细的答案来自独立测试。Originality.ai 本身是一家检测软件供应商,他们对 Undetectable.ai 的人性化工具进行了一项对照实验。原始 ChatGPT 文本和人性化版本在 Originality.ai 上的 AI 识别率均为 100%,置信度相同。Writer.com 的识别率几乎没有变化(从 6% 降至 3%)。GPTZero 的识别率从 100% 降至 91%。即使在最强大的检测软件中,绕过机制的影响也微乎其微。
Aithor 在 2026 年进行了一项更全面的评估,并生成了以下表格,该表格使用四个检测器对 Undetectable.ai 的输出结果进行了分析:
| 探测器 | 原始人工智能得分 | 人性化之后 | 结果 |
|---|---|---|---|
| GPTZero | 97% | 72% | 部分绕过 |
| Originality.ai | 99% | 81% | 未被绕过 |
| Copyleaks | 已标记 | 已标记 | 未被绕过 |
| ZeroGPT | 94% | 61% | 部分绕过 |
各个测试结果都显示,ZeroGPT 和 GPTZero 更容易被淘汰,而 Originality.ai 和 Copyleaks 则相对稳定。这并非巧合。Originality.ai 专为对抗性改写文本而设计,其内部基准测试(发表于 Pangram 2026 年 1 月的 JAIT 论文)显示,其对 QuillBot 改写样本的检测率约为 97%。
供应商声称的准确性很少能经受住独立测试的检验。
| 探测器 | 供应商声明 | 独立测试 |
|---|---|---|
| Turnitin | 准确率98%,假阳性率<1% | 约85%的案例被回忆起来(Turnitin的产品负责人也承认了这一点);被标记为人工智能生成的案例被夸大了。 |
| Originality.ai | “行业领导者” | 在原始人工智能方面表现出色,但在对抗性人工智能方面有所欠缺。 |
| Copyleaks | 99.12% | QuillBot 改写文本约占 50% |
| GPTZero | “多层7组分” | 人工智能出现之前的作文中,误报率约为1-2%。 |
| 温斯顿人工智能 | 99.98% | 变量:100% 为博客文章,3% 为电子书样章 |
| OpenAI 分类器 | 不适用 | 2023年7月停产时召回26% |
没有哪种检测器能完美应对所有这些情况。声称可以完美检测的厂商往往会发布一些基于狭窄基准测试的结果,这些测试针对的是人工智能在受控提示下生成的无法检测的内容。
OpenAI 自家的 AI 分类器就是最典型的例子。该公司于 2023 年 1 月发布了该分类器,随后在同年 7 月 20 日悄然将其关闭。原因在于:其真阳性率仅为 26%。OpenAI 自己也承认该模型“不可靠”,但至今仍未发布替代模型。据《华尔街日报》报道,其水印技术研究的内部验证准确率高达 99.9%,但两年半过去了,该研究成果仍未发布。
误报:人工智能检测器将人类写作误判为误报的情况。
2024-2026 年更值得关注的是,人工智能检测器在另一个方向上也会出现严重故障。
斯坦福大学的James Zou及其团队在Patterns期刊(2023年7月,arXiv:2304.02819)上发表了题为“GPT检测器对非英语母语写作者存在偏见”的论文。他们使用七种主流检测器对非英语母语学生的托福作文进行分析。结果显示,这些检测器将其中61.22%的作文标记为人工智能生成。而对于美国本土八年级学生的作文,同样的检测器几乎没有将其标记为人工智能生成。这种偏见的成因很简单:对于基于困惑度的评分系统而言,英语作为第二语言时词汇多样性较低、句法较为简单,更容易被识别为人工智能生成。这种偏见造成的危害显而易见,而且对那些使用这些工具的院校中的国际学生影响尤为严重。
Common Sense Media 发布的 2024 年人工智能检测危害报告进一步揭示了问题的严重性。报告显示,约 10% 的青少年表示曾被错误指控使用人工智能。黑人青少年中这一比例上升至 20%,而白人学生和拉丁裔学生的这一比例分别为 7% 和 10%。这种差异性的影响与底层语言模型中已知的偏见,以及教师在工具标记学生时的反应方式密切相关。
最广为人知的早期灾难发生在2023年5月的德克萨斯农工大学科默斯分校。农业讲师贾里德·穆姆博士将学生的作文粘贴到ChatGPT中,并询问该模型是否撰写了这些作文。ChatGPT对所有作文都给出了肯定的回答。(一如既往,它“帮了大忙”。)结果,穆姆博士让一半的学生不及格。几天后,学校撤回了这一决定。学生们利用谷歌文档的版本历史记录证明这些作文是他们自己写的。《华盛顿邮报》、《NBC新闻》、《滚石》杂志和《高等教育内幕》等媒体都对此事进行了报道。
规模较大的院校开始彻底禁用Turnitin的AI检测功能。加州大学洛杉矶分校、加州大学圣地亚哥分校、加州州立大学洛杉矶分校和范德堡大学都已将其关闭。他们指出,该功能存在误报问题,并且对国际学生造成了不成比例的影响。仅加州州立大学系统在2024-2025学年就花费了110万美元用于AI检测软件。加州公立大学系统在该功能上的总支出超过1500万美元。
2025年8月,美国联邦贸易委员会(FTC)采取了严厉措施。Workado是Content at Scale公司更名后成立的实体,该公司曾宣称其“AI内容检测器”的准确率高达98%。但FTC调查人员发现,该检测器在通用内容上的实际准确率仅为53%。该模型仅使用学术散文进行训练,在其他类型的文本上表现极差。2025年8月28日的同意令要求Workado停止发布未经证实的声明,并要求其向现有客户发送FTC起草的通知。这是FTC首次针对AI检测供应商的虚假广告行为采取执法行动。

伦理底线:当人工智能文本拟人化时,就会产生风险
大多数情况下,人工智能拟人化工具的使用都是合法的,也大多不属于作弊。这取决于具体情况。
合法使用方式如下:一位小型企业主使用 ChatGPT 生成的博客文章,通过人性化工具进行润色,以柔化其正式的商务语气。之后,他们会在发布前进行编辑。一位非英语母语人士使用人性化工具的方式与使用语法检查器类似,目的是在不改变原意的前提下优化措辞。营销团队对内部产品文案进行改写。这些行为均未违反任何政策或合同,也未使作品呈现出其原本的面貌。
这种风险用途是学术性的。大多数大学禁止在课程作业中使用未经授权的人工智能。越来越多的大学现在明确禁止使用人工智能生成的拟人化文本。Turnitin 在 2025 年 8 月的更新中新增了一项反绕过功能,旨在应对最常见的拟人化文本模式。将人工智能生成的拟人化文本提交到需要原创作品的作业中属于学术不端行为。这在大多数机构的政策中都适用。无论检测器是否检测到,这一点都成立。不端行为在于对作者身份的欺骗。绕过功能仅仅是方法而已。
商业出版业的情况则更为复杂。《纽约时报》于2026年1月与自由撰稿评论家亚历克斯·普雷斯顿终止了合作关系。一项调查发现,普雷斯顿的书评中存在人工智能生成的段落,这些段落是对《卫报》文章的改写。《华盛顿邮报》在2025年12月也发生了类似事件。其内部的人工智能播客功能发布了捏造的引语。Semafor的调查揭露了此事。两家新闻机构都没有完全禁止使用人工智能。但它们都禁止在未公开的情况下使用人工智能,因为读者理应认为这些内容是由人类撰写的。
更安全的伦理默认做法如下:如果读者会介意文本是否由人工智能辅助生成,则应予以披露。如果作业禁止使用人工智能,则不要通过人性化工具来掩盖事实。没有任何真正无法察觉的人工智能工具可以帮助你规避这一伦理问题。即使无法察觉的人工智能可以帮助润色措辞,也无济于事。如果你使用人性化工具是为了使语言听起来不那么正式,或者为了修正自己草稿中的第二语言表达,那么你更接近于学术和专业语境下的编辑范畴。大多数政策对此并无太多规定。
政策方向正从检测转向溯源。C2PA 代表内容溯源与真实性联盟(Coalition for Content Provenance and Authenticity)。它将加密的内容凭证嵌入图像和视频中。OpenAI 于 2024 年 5 月加入了指导委员会。该公司现在默认将凭证附加到 DALL-E 3 输出中。Adobe、微软、谷歌、BBC、纽约时报和索尼都是其成员。C2PA 规范正在被快速推进,有望成为 ISO 标准。对于文本而言,大规模应用的等效水印标准仍未得到解决。在这些标准正式发布之前,绕过与检测之间的竞争仍将继续。