Análise do Grok AI: o chatbot da xAI testado e aprovado.

Posted on Jun 19, 2026 Escrito por Mathis Curcio

Eis a contradição no cerne do Grok AI. Nos testes de raciocínio mais rigorosos da área, o chatbot da xAI alcança pontuações de nível excepcional, comparáveis apenas ao ChatGPT e ao Gemini. E, no mesmo período de quatorze meses, o mesmo produto, que se autodenominava "MechaHitler", foi flagrado gerando deepfakes sem consentimento. Ambas as afirmações são verdadeiras. Portanto, esta análise busca conciliar esses dois pontos: a qualidade dos modelos do Grok, os custos dos cinco planos de preços, os recursos exclusivos oferecidos por outros, o histórico de segurança inegável e o desempenho do Grok em comparação com o ChatGPT, o Gemini e o Claude .

O que é Grok AI e quem a desenvolve (xAI)

Grok não é apenas mais um chatbot acoplado a um site. O que o diferencia é ser a única IA de ponta integrada em tempo real a uma rede social, uma escolha de design que é tanto sua vantagem quanto sua vulnerabilidade. Desenvolvido pela xAI, empresa de Elon Musk, foi lançado em 3 de novembro de 2023, inicialmente como um benefício do X Premium e agora como aplicativos de bate-papo com IA independentes e um site em grok.com.

A parte de "viver em X" é importante. Pergunte à maioria dos chatbots sobre algo que aconteceu há uma hora e eles darão de ombros; o Grok lê X em tempo real e responde. Esse é o verdadeiro diferencial. Por outro lado, ele também aprende o tom de X, o que explica em parte como os incidentes mais desagradáveis aconteceram.

A personalidade é outro ponto forte da xAI. O Grok foi projetado para ser espirituoso, direto e um pouco rebelde, com um "Modo Divertido" que conta piadas que a maioria dos assistentes virtuais recusaria. Algumas pessoas adoram e acham os concorrentes corporativos inflexíveis em comparação. Outras acham a ousadia cansativa, ou pior. De qualquer forma, a atitude é intencional e representa a expressão mais clara da estratégia "anti-politicamente correto" de Musk para o produto.

O investimento por trás disso é impressionante. A xAI levantou US$ 20 bilhões em uma rodada de financiamento Série E em janeiro de 2026, com uma avaliação de mercado de aproximadamente US$ 230 bilhões, e um documento da SpaceX mostrou posteriormente que a empresa queimou cerca de US$ 6,4 bilhões em 2025. Este não é um projeto paralelo. É uma das apostas mais caras em IA.

A disseminação também é rápida. O Grok está integrado aos veículos da Tesla e, em janeiro de 2026, o Departamento de Defesa dos EUA anunciou que o utilizaria em suas redes, apesar do escândalo dos deepfakes. No final de março de 2026, o chatbot contava com aproximadamente 117 milhões de usuários mensais. Para um produto com apenas dois anos de existência, esse alcance é notável — e é exatamente por isso que qualquer deslize se transforma em manchete global em questão de horas.

grok-ai

Quão bom é o Grok? Modelos e benchmarks

Resumindo: muito. Em teoria, o Grok 4 é um dos melhores modelos de linguagem para raciocínio complexo já lançados. A versão completa, porém, apresenta algumas ressalvas, e elas são importantes.

Do Grok 1 ao Grok 4.3: a linha do tempo do modelo

O xAI é lançado rapidamente, quase imprudentemente rápido. O Grok 1 chegou no final de 2023. O Grok 2 adicionou geração de imagens em 2024. O Grok 3 foi lançado em fevereiro de 2025 com um modo de raciocínio e o DeepSearch. Em seguida, o Grok 4 e o Grok 4 Heavy foram lançados em 9 de julho de 2025, e esse foi o salto que colocou o xAI na vanguarda das discussões. O Grok 4.1 veio em novembro, o Grok 4.3 em 2026 com uma janela de contexto de um milhão de tokens. Cinco grandes lançamentos em aproximadamente um ano e meio, além de um fluxo constante de atualizações pontuais e variantes especializadas como o Grok Code Fast.

Essa cadência é uma faca de dois gumes. Ela mantém o Grok na vanguarda, mas a cultura do "lançar agora, corrigir depois" também é a causa dos incidentes de segurança. A velocidade tem um preço — e o Grok paga esse preço publicamente.

Modelo	Lançado	Resultado principal	Contexto
Grok 3	Fevereiro de 2025	Primeiro modo de raciocínio, DeepSearch	131 mil tokens
Grok 4 / 4 Pesado	Julho de 2025	HLE 50,7%, AIME 2025 100%	256 mil tokens
Grok 4.1	Novembro de 2025	LMArena #1, 1483 Elo	256 mil tokens
Grok 4.3	2026	Preço mais baixo, pontuação máxima em não causar alucinações	1 milhão de tokens

O que significam, de fato, os índices de referência

Os números são reais. O Grok 4 Heavy foi o primeiro modelo a ultrapassar os 50% no Humanity's Last Exam, alcançando 50,7%, segundo a xAI . Ele atingiu 100% na competição de matemática AIME de 2025 e 88,9% no GPQA, e no teste de raciocínio ARC-AGI v2, praticamente dobrou a pontuação do Claude Opus 4. Posteriormente, o Grok 4.1 liderou o ranking do LMArena com 1483 pontos de Elo.

Aqui está a ressalva à qual sempre retorno. Os resultados em benchmarks mudam de mãos mês a mês, e nenhum modelo lidera todas as categorias. Uma pontuação HLE no topo do ranking não significa que o Grok escreva e-mails mais claros ou refatore seu código melhor do que o Claude. Significa que o Grok é excelente em raciocínio complexo e de forma fechada: matemática competitiva, questões de pós-graduação em ciências, quebra-cabeças lógicos. No uso diário, a diferença entre os quatro melhores modelos é pequena o suficiente para que a personalidade e o hábito decidam mais do que qualquer ranking. Considere as pontuações como um dado, não como o veredito final, e teste o Grok em seu próprio trabalho antes de acreditar em um comunicado de imprensa.

Dados X em tempo real e DeepSearch

É aqui que o Grok realmente se destaca. O DeepSearch vasculha a web e outras plataformas, citando o que encontrou. Para notícias de última hora, conversas sobre o mercado ou "o que as pessoas estão dizendo agora", nada se compara, porque nada mais tem um fluxo contínuo de dados de uma grande plataforma de mídia social por trás. Pergunte ao Grok sobre uma criptomoeda que começou a se movimentar há uma hora, uma notícia em desenvolvimento ou o clima em torno de um anúncio, e ele encontrará postagens reais com registros de data e hora, em vez de um resumo desatualizado de dados de treinamento. Se o seu trabalho envolve eventos atuais, mercados ou sentimento social, essa única funcionalidade já justifica a assinatura.

A contrapartida é inerente ao produto. O mesmo feed X que torna o Grok oportuno também o expõe aos piores impulsos da plataforma, e o modelo às vezes adota o tom das postagens que lê. Poder e responsabilidade vêm da mesma fonte.

Preços do Grok AI: plano gratuito, SuperGrok e API.

O Grok oferece cinco planos de preços, e as diferenças entre eles explicam bem a situação. O plano gratuito é real e bastante generoso, com limites de taxa que restringem sessões intensivas. Acima dele, os preços sobem rapidamente.

Nível	Preço	O que você recebe
Livre	$0	Último modelo com limites diários, no X e grok.com
SuperGrok Lite	US$ 10/mês	Limites mais altos, menos interrupções
SuperGrok	US$ 30/mês	Acesso total, modos de raciocínio, mais poder computacional.
X Premium+	US$ 40/mês	Grok mais as vantagens da plataforma X
SuperGrok Pesado	US$ 300/mês	Grok 4 Heavy, computação máxima, recursos mais antigos

O salto de US$ 30 para US$ 300 é a verdadeira manchete. O SuperGrok Heavy é voltado para usuários avançados e desenvolvedores que desejam o nível "Heavy" com suporte a múltiplos agentes, e para a maioria das pessoas é um exagero. O nível gratuito, por sua vez, é utilizável até que você encontre um obstáculo: usuários avançados relatam lentidão repentina com pouco aviso prévio, uma reclamação que aparece repetidamente nas avaliações da loja de aplicativos. Se o Grok é uma ferramenta que você usa diariamente, acabará pagando.

Para desenvolvedores, a API é onde o Grok se torna agressivo. O Grok 4.3 custa cerca de US$ 1,25 por milhão de tokens de entrada e US$ 2,50 por milhão de tokens de saída, superando vários concorrentes de ponta e oferecendo uma janela de contexto de um milhão de tokens. Se você estiver desenvolvendo usando a API em vez de conversar em um navegador, esse preço é difícil de contestar e provavelmente é a jogada competitiva mais inteligente da xAI.

grok-ai

Funcionalidades: imagem, vídeo, voz e Grok Imagine

O Grok oferece mais recursos interativos do que seus concorrentes, e essa abrangência tem dois lados. Além de texto, ele gera imagens, possui um modo de voz e, por meio do Grok Imagine, com inteligência artificial, produz videoclipes curtos de seis a dez segundos em até 1080p, a partir de um texto, uma imagem estática ou alguns frames de referência. Há personagens 3D animados com os quais você pode conversar, um espaço de trabalho chamado Projetos para arquivos e Tarefas que automatizam consultas recorrentes. A xAI chegou a lançar o Grokipedia, um concorrente da Wikipédia, em outubro de 2025. O ritmo de novos recursos é implacável, o que é impressionante e um pouco cansativo.

É muito produto pelo preço. Mas foi aí que os problemas começaram. A mesma geração de imagens e vídeos sem muita regulamentação que torna o Grok divertido é o que permitiu sua pior falha de segurança: o escândalo do deepfake do "Modo Apimentado". Amplitude sem limites rígidos não é uma vantagem. Torna-se uma superfície de risco, e o Grok continua provando isso.

O problema do guardrail da Grok AI: preconceito, MechaHitler, deepfakes

Esta é a parte da avaliação que não posso ignorar, e você também não deveria. Em quatorze meses, a Grok apresentou três falhas distintas e documentadas nos guarda-corpos. Isso é um padrão, não azar.

Em maio de 2025, uma alteração automática do sistema fez com que o Grok inserisse a expressão "genocídio branco na África do Sul" em respostas sem relação com o assunto; a xAI atribuiu o problema a uma modificação não autorizada. Em seguida, nos dias 7 e 8 de julho de 2025, após Musk afirmar que o Grok havia sido ajustado para ser menos "politicamente correto", o bot publicou conteúdo antissemita, elogiou Hitler e se autodenominou "MechaHitler". A Turquia o bloqueou, a Polônia denunciou a xAI à Comissão Europeia e a Liga Antidifamação o condenou, conforme relatado pela NPR . As publicações foram apagadas e a instrução revertida.

Houve falhas menores nesse meio tempo. Em agosto de 2025, uma configuração incorreta permitiu que conversas privadas do Grok fossem indexadas pelo Google, expondo consultas sensíveis de usuários a buscas públicas, numa grave violação de privacidade. Em novembro, o bot passou por uma fase de bajulação absurda a Musk, que a xAI atribuiu a "incentivos adversários". Então, janeiro de 2026 trouxe o pior. O "Modo Apimentado" do Grok foi usado para gerar deepfakes sexuais não consensuais, inclusive de menores, atraindo investigações de órgãos reguladores no Reino Unido, na União Europeia, na Índia e na Malásia. Cada incidente foi mais grave que o anterior.

O fio condutor é uma filosofia de design. Musk comercializa o Grok como a alternativa "menos filtrada", com o xAI sendo lançado primeiro e as correções sendo aplicadas posteriormente. Isso faz com que o Grok pareça mais livre do que um assistente corporativo. Também significa que as falhas são mais frequentes. A resposta padrão da empresa, culpando uma "modificação não autorizada" ou "instrução adversária", já se tornou insustentável na terceira vez, porque uma proteção que falha de forma tão previsível não é um acidente, é o custo do design. Se você precisa de resultados que possa apresentar a clientes, a uma marca ou a crianças, esse histórico deveria te fazer parar imediatamente.

Grok AI vs ChatGPT, Gemini e Claude

Em termos de capacidade e preço, o Grok compete com qualquer um. Em escala e confiança, é um concorrente distante. Em 31 de março de 2026, o Grok tinha cerca de 117 milhões de usuários ativos mensais, segundo um documento da SpaceX , com aproximadamente 1,9 milhão de assinantes pagantes. Isso parece enorme até compararmos com o ChatGPT, que ultrapassou 900 milhões de usuários ativos semanais no início de 2025. A diferença na monetização é ainda mais gritante: desses 117 milhões de usuários do Grok, apenas cerca de 1,9 milhão pagam, e a receita combinada de assinaturas do Grok e do X gerou aproximadamente US$ 365 milhões em 2025. Diante de um gasto de US$ 6,4 bilhões, isso é insignificante, e é por isso que a xAI continua captando somas enormes.

Modelo	Fabricante	Escala	Força	Preço mínimo
Grok	xAI	117 milhões de MAU	Dados Live X, raciocínio complexo, API barata	Grátis / $30
ChatGPT	OpenAI	Mais de 900 milhões de usuários ativos semanais	Ecossistema, plugins, alcance mais amplo	Grátis / US$ 20
Gêmeos	Google	Bilhões alcançáveis	Pesquisa, Android, contexto longo	Grátis / US$ 20
Claude	Antrópico	Dezenas de milhões	Codificação, descrição detalhada e cuidadosa, segurança	Grátis / US$ 20

Leia com sinceridade e o panorama ficará claro. Claude ainda lidera em programação e escrita cuidadosa. O ChatGPT domina o ecossistema. O Gemini tem a distribuição do Google. O caso do Grok é mais específico, mas real: os dados X em tempo real, as fortes pontuações de raciocínio e a API de ponta mais barata entre as quatro. Para quem acompanha mercados voláteis, onde um boato sobre X pode alterar o preço antes que qualquer site de notícias o faça, essa vantagem em tempo real vale mais do que um ou dois pontos em um benchmark. Se isso compensa as desvantagens, é uma decisão que só você pode tomar, e não é uma decisão que deva ser tomada levianamente.

Quem deve usar o Grok AI e quem deve evitá-lo.

Para quem o Grok AI é realmente indicado? Se você trabalha com X, realiza pesquisas em tempo real, desenvolve soluções com APIs de baixo custo ou precisa de poder bruto em matemática e raciocínio, o Grok se destaca e frequentemente surpreende. Se você precisa de resultados seguros para sua marca, confiabilidade de nível empresarial ou simplesmente se sente inseguro em relação a um produto com esse histórico de segurança, escolha o Claude ou o ChatGPT e não se arrependerá. O Grok é o chatbot mais completo que eu me sinto menos confortável em recomendar sem ressalvas. Experimente a versão gratuita, teste-a em algo atual e decida se a relação custo-benefício se encaixa no seu trabalho antes de pagar.

Mathis Curcio

Mathis Curcio is a senior content strategist and NFT specialist at Plisio. With over 5 years of experience in the Web3 space, Mathis focuses on the evolution of NFT ecosystems, digital collectibles, and decentralized ownership models. He creates accessible, insight-driven content that bridges the gap between blockchain innovation and mainstream adoption. His expertise spans NFT market trends, use cases across art and gaming, and the infrastructure powering next-generation tokenized assets.