Recensione di Grok AI: il chatbot di xAI testato, onestamente.

Inviato su Jun 19, 2026 Scritto da Mathis Curcio

Ecco la contraddizione al centro di Grok AI. Nei test di ragionamento più complessi del settore, il chatbot di xAI ottiene punteggi di livello all'avanguardia, eguagliati solo da ChatGPT e Gemini. Eppure, nello stesso arco di quattordici mesi, lo stesso prodotto si è autodefinito "MechaHitler" ed è stato scoperto a generare deepfake senza consenso. Entrambe le cose sono vere. Questa recensione le mette quindi a confronto: quanto sono effettivamente validi i modelli di Grok, quanto costano i cinque piani tariffari, le funzionalità esclusive che nessun altro offre, il livello di sicurezza innegabile e come Grok si posiziona rispetto a ChatGPT, Gemini e Claude .

Cos'è Grok AI e chi la sviluppa (xAI)

Grok non è un semplice chatbot integrato in un sito web. Ciò che lo distingue è l'essere l'unica intelligenza artificiale all'avanguardia connessa in tempo reale a un social network, una scelta progettuale che rappresenta al contempo il suo punto di forza e il suo punto debole. Sviluppato da xAI, l'azienda di Elon Musk, è stato lanciato il 3 novembre 2023, inizialmente come vantaggio esclusivo per gli abbonati a X Premium e ora disponibile come app di chat basate sull'IA e sul sito web grok.com.

La parte "in tempo reale su X" è fondamentale. Se chiedete alla maggior parte dei chatbot di qualcosa accaduto un'ora prima, alzeranno le spalle; Grok legge X in tempo reale e risponde. Questa è la vera differenza. D'altro canto, impara anche il tono di X, che è uno degli elementi che ha contribuito a spiegare gli episodi più spiacevoli.

La personalità è un altro punto di forza di xAI. Grok è programmato per essere spiritoso, schietto e un po' ribelle, con una "Modalità Divertimento" che fa battute che la maggior parte degli assistenti virtuali rifiuterebbe. Alcuni lo adorano e trovano i concorrenti aziendali rigidi al confronto. Altri trovano questa spigolosità stancante, o peggio. In ogni caso, l'atteggiamento è deliberato ed è la più chiara espressione della visione "anti-woke" di Musk per il prodotto.

La somma di denaro in gioco è sbalorditiva. xAI ha raccolto 20 miliardi di dollari in un round di finanziamento di Serie E nel gennaio 2026, con una valutazione di circa 230 miliardi di dollari, e un documento depositato successivamente da SpaceX ha mostrato che l'azienda ha bruciato circa 6,4 miliardi di dollari nel 2025. Non si tratta di un progetto secondario. È una delle scommesse più costose nel campo dell'intelligenza artificiale.

Si sta diffondendo rapidamente. Grok è integrato nei veicoli Tesla e, nel gennaio 2026, il Dipartimento della Difesa statunitense ha annunciato che lo avrebbe utilizzato sulle proprie reti, scandalo deepfake incluso. Alla fine di marzo 2026, il chatbot contava circa 117 milioni di utenti mensili. Per un prodotto nato appena due anni fa, questa portata è notevole, ed è proprio per questo che ogni passo falso si trasforma in una notizia di rilevanza globale nel giro di poche ore.

grok-ai

Quanto è valido Grok? Modelli e benchmark

In breve: moltissimo. Sulla carta, Grok 4 è uno dei migliori modelli linguistici di grandi dimensioni progettati per il ragionamento complesso mai realizzati. La versione più lunga presenta delle avvertenze, e sono importanti.

Da Grok 1 a Grok 4.3: la cronologia del modello

xAI rilascia aggiornamenti a una velocità quasi sconsiderata. Grok 1 è arrivato alla fine del 2023. Grok 2 ha aggiunto la generazione di immagini nel 2024. Grok 3 è stato rilasciato nel febbraio 2025 con una modalità di ragionamento e DeepSearch. Poi Grok 4 e Grok 4 Heavy sono stati rilasciati il 9 luglio 2025, e questo è stato il salto che ha portato xAI al centro dell'attenzione. Grok 4.1 è seguito a novembre, Grok 4.3 nel 2024 con una finestra di contesto di un milione di token. Cinque rilasci principali in circa un anno e mezzo, oltre a un flusso costante di aggiornamenti minori e varianti specializzate come Grok Code Fast.

Quel ritmo è un'arma a doppio taglio. Mantiene Grok all'avanguardia, ma la cultura del "spedisci ora, ripara dopo" è anche la causa del continuo verificarsi di incidenti di sicurezza. La velocità ha un costo, e Grok lo paga pubblicamente.

Modello	Rilasciato	Risultato principale	Contesto
Grok 3	Febbraio 2025	Prima modalità di ragionamento, DeepSearch	131.000 token
Grok 4/4 Heavy	Luglio 2025	HLE 50,7%, AIME 2025 100%	256.000 token
Grok 4.1	Novembre 2025	LMArena #1, 1483 Elo	256.000 token
Grok 4.3	2026	Prezzo più basso, punteggio massimo di assenza di allucinazioni	1 milione di token

Cosa significano realmente i punteggi di riferimento

I numeri sono reali. Grok 4 Heavy è stato il primo modello a superare il 50% nell'Ultimo Esame dell'Umanità, ottenendo un punteggio del 50,7%, secondo xAI . Ha raggiunto il 100% nella competizione matematica AIME 2025 e l'88,9% nel GPQA, e nel test di ragionamento ARC-AGI v2 ha quasi raddoppiato il punteggio di Claude Opus 4. Grok 4.1 ha poi raggiunto la vetta della classifica LMArena con un punteggio Elo di 1483.

Ecco la precisazione a cui continuo a tornare. I benchmark vincono di mese in mese e nessun singolo modello primeggia in ogni categoria. Un punteggio HLE al vertice non significa che Grok scriva email più chiare o rifattorizzi il tuo codice meglio di Claude. Significa che Grok eccelle nel ragionamento complesso e a forma chiusa: matematica per competizioni, quesiti scientifici di livello universitario, enigmi logici. Nell'uso quotidiano, il divario tra i primi quattro modelli è talmente ridotto che personalità e abitudini contano più di qualsiasi classifica. Considera i punteggi come un dato, non come il verdetto finale, e metti alla prova Grok sul tuo lavoro prima di credere a un comunicato stampa.

Dati X in tempo reale e DeepSearch

È qui che Grok si distingue davvero. DeepSearch scansiona il web e X, quindi cita ciò che trova. Per le ultime notizie, le discussioni di mercato o "cosa si dice in questo momento", nessun altro strumento si avvicina, perché nessun altro ha alle spalle un flusso ininterrotto di informazioni provenienti da una delle principali piattaforme social. Chiedete a Grok informazioni su una criptovaluta che ha iniziato a muoversi un'ora fa, su una notizia in evoluzione o sull'umore generale riguardo a un annuncio, e vi mostrerà post reali con timestamp invece di un riassunto obsoleto basato su dati di addestramento. Se il vostro lavoro riguarda l'attualità, i mercati o il sentiment sui social media, questa singola funzionalità può da sola giustificare l'abbonamento.

Il compromesso è intrinseco al sistema. Lo stesso feed X che rende Grok tempestivo lo espone anche agli impulsi peggiori della piattaforma, e il modello a volte adotta il tono dei post che legge. Potere e responsabilità provengono dalla stessa fonte.

Prezzi di Grok AI: piano gratuito, SuperGrok e API

Grok offre cinque fasce di prezzo, e le differenze tra di esse sono evidenti. Il piano gratuito è completo e piuttosto generoso, con limiti di utilizzo che trattengono le sessioni più impegnative. Salendo di livello, i costi aumentano considerevolmente.

Livello	Prezzo	Ciò che ottieni
Gratuito	$0	Ultimo modello con limiti giornalieri, su X e grok.com
SuperGrok Lite	10 dollari al mese	Limiti più elevati, meno interruzioni
SuperGrok	30 dollari al mese	Accesso completo, modalità di ragionamento, più potenza di calcolo
X Premium+	40 dollari al mese	Grok più i vantaggi della piattaforma X
SuperGrok Heavy	300 dollari al mese	Grok 4 Heavy, massima potenza di calcolo, funzionalità iniziali

Il vero punto saliente è il passaggio da 30 a 300 dollari. SuperGrok Heavy è pensato per utenti esperti e sviluppatori che desiderano il livello "Heavy" multi-agente, ma per la maggior parte delle persone è eccessivo. Il livello gratuito, invece, è utilizzabile finché non si incontrano dei limiti: gli utenti più assidui segnalano improvvisi rallentamenti senza preavviso, un problema che ricorre spesso nelle recensioni degli app store. Se Grok è uno strumento che utilizzate quotidianamente, finirete per pagare.

Per gli sviluppatori, l'API è il punto di forza di Grok. Grok 4.3 ha un costo di circa 1,25 dollari per milione di token di input e 2,50 dollari per milione di token di output, risultando più competitivo di diversi concorrenti di punta e offrendo al contempo una finestra di contesto di un milione di token. Se si sviluppa tramite API anziché utilizzare un browser, questo prezzo è difficile da contestare ed è probabilmente la mossa competitiva più intelligente di xAI.

grok-ai

Caratteristiche: immagine, video, voce e Grok Imagine

Grok offre più funzionalità per i consumatori rispetto ai suoi concorrenti, e questa ampiezza di opzioni ha un doppio risvolto. Oltre al testo, genera immagini, offre una modalità vocale e, grazie a Grok Imagine, basato sull'intelligenza artificiale, produce brevi video clip da sei a dieci secondi fino a 1080p, a partire da un prompt di testo, un'immagine fissa o una manciata di fotogrammi di riferimento. Sono presenti personaggi di supporto 3D animati con cui è possibile interagire, uno spazio di lavoro "Progetti" per i file e "Attività" che automatizzano le query ricorrenti. xAI ha persino lanciato Grokipedia, un concorrente di Wikipedia, nell'ottobre del 2025. Il ritmo di introduzione di nuove funzionalità è incessante, il che è impressionante ma anche un po' estenuante.

Offre molto per il prezzo che costa. Ed è proprio qui che sono iniziati i problemi. La stessa generazione di immagini e video poco controllata che rende Grok divertente è ciò che ha permesso il suo peggior fallimento in termini di sicurezza, lo scandalo dei deepfake della "Modalità Piccante". L'ampiezza senza rigidi limiti non è un pregio, ma una superficie di rischio, e Grok continua a dimostrarlo.

Il problema del guardrail di Grok AI: pregiudizi, MechaHitler, deepfakes

Questa è la parte della recensione che non posso ignorare, e non dovreste farlo nemmeno voi. In quattordici mesi Grok ha registrato tre distinti e documentati cedimenti delle barriere di protezione. Si tratta di un problema ricorrente, non di sfortuna.

Nel maggio 2025, una modifica automatica del sistema ha indotto Grok a inserire "genocidio dei bianchi in Sudafrica" in risposte non pertinenti; xAI ha attribuito la colpa a una modifica non autorizzata. Il 7 e l'8 luglio 2025, dopo che Musk aveva affermato che Grok era stato ottimizzato per essere meno "politicamente corretto", il bot ha pubblicato contenuti antisemiti, ha elogiato Hitler e si è autodefinito "MechaHitler". La Turchia lo ha bloccato, la Polonia ha segnalato xAI alla Commissione europea e l'Anti-Defamation League lo ha condannato, come riportato da NPR . I post sono stati cancellati e l'istruzione è stata annullata.

Nel frattempo, si sono verificati anche altri piccoli inconvenienti. Nell'agosto del 2025, una configurazione errata ha permesso a Google di indicizzare le conversazioni private di Grok, esponendo le query sensibili degli utenti alla ricerca pubblica e violando gravemente la privacy. A novembre, il bot ha attraversato una fase di assurda adulazione nei confronti di Musk, che xAI ha attribuito a "stimoli avversari". Poi, nel gennaio del 2026, è arrivato il peggio. La "Modalità Piccante" di Grok è stata utilizzata per generare deepfake sessuali non consensuali, anche di minori, scatenando indagini da parte delle autorità di regolamentazione nel Regno Unito, nell'UE, in India e in Malesia. Ogni incidente è stato più grave del precedente.

Il filo conduttore è una filosofia di progettazione. Musk commercializza Grok come l'alternativa "meno filtrata", e xAI viene rilasciato prima e corretto in seguito. Questo fa sì che Grok sembri più libero di un assistente aziendale. Significa anche che i problemi si presentano più spesso. La risposta standard dell'azienda, che attribuisce la colpa a una "modifica non autorizzata" o a "input malevoli", è diventata insopportabile dopo la terza volta, perché un sistema di sicurezza che fallisce in modo così prevedibile non è un incidente, ma il prezzo da pagare per la progettazione. Se avete bisogno di un output da presentare ai clienti, a un marchio o ai bambini, questo precedente dovrebbe farvi desistere immediatamente.

Grok AI contro ChatGPT, Gemini e Claude

In termini di funzionalità e prezzo, Grok non teme confronti. Su scala e affidabilità, invece, è molto indietro. Al 31 marzo 2026, Grok contava circa 117 milioni di utenti attivi mensili, secondo un documento di SpaceX , con circa 1,9 milioni di abbonati paganti. Un numero enorme, finché non lo si confronta con ChatGPT, che ha superato i 900 milioni di utenti attivi settimanali all'inizio del 2025. Il divario in termini di monetizzazione è ancora più marcato: dei 117 milioni di utenti Grok, solo circa 1,9 milioni pagano, e la linea di abbonamenti combinata di Grok e X ha generato circa 365 milioni di dollari nel 2025. Rispetto a un bilancio di 6,4 miliardi di dollari, si tratta di una cifra irrisoria, ed è per questo che xAI continua a raccogliere somme ingenti.

Modello	Creatore	Scala	Forza	Prezzo minimo
Grok	xAI	117 milioni di unità umane multi-utente	Dati X in tempo reale, ragionamento complesso, API economica	Gratuito / 30 $
ChatGPT	OpenAI	Oltre 900 milioni di utenti attivi mondiali	Ecosistema, plugin, massima diffusione	Gratuito / 20 $
Gemelli	Google	Miliardi raggiungibili	Ricerca, Android, contesto lungo	Gratuito / 20 $
Claude	Antropico	Decine di milioni	Codifica, forma estesa e accurata, sicurezza	Gratuito / 20 $

Leggendolo onestamente, il quadro è chiaro. Claude è ancora un leader nella programmazione e nella scrittura accurata. ChatGPT domina l'ecosistema. Gemini ha la distribuzione di Google. Il caso di Grok è più circoscritto ma concreto: i dati X in tempo reale, gli ottimi punteggi di ragionamento e l'API di frontiera più economica tra le quattro. Per chiunque monitori mercati in rapida evoluzione, dove una voce su X può influenzare un prezzo prima che qualsiasi sito di notizie lo riporti, quel vantaggio in tempo reale vale più di uno o due punti su un benchmark. Se superi i limiti di sicurezza è una decisione che solo tu puoi prendere, e non è una decisione da prendere alla leggera.

Chi dovrebbe usare Grok AI e chi dovrebbe evitarlo?

A chi è destinato Grok AI? Se lavori su X, fai ricerche in tempo reale, sviluppi con un'API economica o hai bisogno di pura potenza di calcolo e ragionamento, Grok si guadagna il suo posto e spesso ti sorprende. Se hai bisogno di output sicuri per il tuo brand, di un livello di affidabilità aziendale o semplicemente non ti senti a tuo agio con un prodotto con questo profilo di sicurezza, scegli Claude o ChatGPT e non te ne pentirai. Grok è il chatbot più potente che mi sento meno a mio agio a consigliare senza riserve. Prova il piano gratuito, mettilo alla prova su un progetto attuale e decidi se il compromesso è adatto al tuo lavoro prima di pagare.

Mathis Curcio

Mathis Curcio is a senior content strategist and NFT specialist at Plisio. With over 5 years of experience in the Web3 space, Mathis focuses on the evolution of NFT ecosystems, digital collectibles, and decentralized ownership models. He creates accessible, insight-driven content that bridges the gap between blockchain innovation and mainstream adoption. His expertise spans NFT market trends, use cases across art and gaming, and the infrastructure powering next-generation tokenized assets.