Durante un settimana turbolenta Elon Musk ha annunciato il lancio di Grok 4, la nuova versione del chatbot di intelligenza artificiale integrato nella piattaforma X (ex Twitter). Il debutto arriva in un momento delicato, segnato dalle dimissioni della CEO Linda Yaccarino e da una serie di post antisemiti pubblicati dall’account automatizzato di Grok. Il caso non è passato inosservato, tant'è che la Commissione Europea sta valutando le segnalazioni sul caso. Eppure Musk non si ferma.

Durante la presentazione ha annunciato: "Grok 4 ha un livello post-laurea su tutto. Almeno per quanto riguarda le domande accademiche, Grok 4 è superiore a un dottorando in ogni materia. Senza eccezioni".

Tra scandali, ambizioni e sfide normative, Grok 4 si presenta come il simbolo perfetto della visione – e della strategia – di Musk: provocatoria, accelerata, e sempre al limite del possibile. Ma vediamo nel dettaglio come funziona il nuovo modello.

Cos’è Grok?

Grok è sia il nome del chatbot, sia della famiglia di modelli linguistici sviluppati da xAI, azienda di intelligenza artificiale di Elon Musk. Il nome è una dichiarazione di intenti, viene dal verbo "to grok", utilizzato negli anni '60 dagli hippy californiani e poi rimasto nel gergo informatico. Significa comprendere a pieno e in modo intuitivo un concetto, il verbo è ampiamente utilizzato in Guida galattica per autostoppisti di Douglas Adams, uno dei libri preferiti da Elon Musk.

Il chatbot è stato integrato direttamente su X (l’ex Twitter), Grok è accessibile tramite una scheda dedicata sulla piattaforma, può essere menzionato nei post per ricevere risposte pubbliche e dispone anche di un’app e di un sito indipendenti.

Il modello originario, Grok 1, ha fatto il suo debutto nel 2023, seguito a marzo 2024 da Grok 1.5, che ha introdotto importanti miglioramenti nel ragionamento logico. Nell’agosto dello stesso anno è stato rilasciato Grok 2, con notevoli progressi nella conversazione, nella programmazione e nelle capacità deduttive. A febbraio 2025 è arrivato Grok 3, che ha ulteriormente affinato le competenze matematiche e la conoscenza del mondo. Ora xAI ha lanciato Grok 4.

Le novità di Grok 4

xAI ha lanciato Grok 4 e Grok 4 Heavy, quest’ultima descritta come una versione “multi-agente” capace di migliorare le performance generando risposte da più agenti simultanei, per poi confrontarle e selezionare la più efficace.

L’azienda sostiene che Grok 4 abbia ottenuto risultati da “modello di frontiera” in numerosi benchmark. In particolare, ha raggiunto un punteggio del 25,4% nel test Humanity’s Last Exam, un esame che mette alla prova le capacità dell’IA in materie come matematica, scienze e discipline umanistiche. Il punteggio è superiore a quello di Gemini 2.5 Pro di Google (21,6%) e del modello o3 (high) di OpenAI (21%). Con l’aggiunta della funzionalità “strumenti”, la versione Grok 4 Heavy ha invece toccato un punteggio del 44,4%, battendo Gemini 2.5 Pro (fermo al 26,9%).

xAI ha poi annunciato che nei prossimi mesi rilascerà modelli specializzati per programmazione e generazione video. Non solo, Grok verrà anche integrato nelle auto Tesla “la prossima settimana”, senza però specificare quale versione del modello verrà utilizzata. Una mossa che punta a rendere l’interazione uomo-macchina ancora più naturale ed evoluta a bordo dei veicoli elettrici.

Come viene addestrato Grok?

I modelli Grok vengono addestrati su un insieme di fonti pubbliche, selezionate e analizzate da un gruppo interno di “tutor” umani, noti anche come annotators. Tuttavia, la formazione di questi tutor ha sollevato polemiche. Documenti interni rivelano che xAI ha chiesto di evitare influenze legate alla cosiddetta “ideologia woke” e che si tende ad escludere candidati con opinioni considerate troppo progressiste.

Dopo l’apertura del codice sorgente di Grok 1 nel 2023, xAI ha continuato a pubblicare su GitHub le versioni successive, rendendo visibili alcune modifiche ai prompt di sistema. Tra queste anche una direttiva che invita Grok a non sottrarsi a dichiarazioni “politicamente scorrette”, purché supportate da argomentazioni solide e ben documentate.

Grok sotto i riflettori (e le polemiche)

Una caratteristica unica di Grok è la sua integrazione diretta e pubblica su X, molte delle sue risposte sono quindi visibili a tutti. Ma non sempre la visibilità gioca a favore. Nei giorni precedenti al lancio di Grok 4, il chatbot è finito al centro di una bufera per aver pubblicato contenuti antisemiti, tra cui riferimenti a Hitler e teorie complottiste legate ai cognomi ebraici.

I post hanno scatenato un’ondata di indignazione, costringendo xAI a sospendere temporaneamente l’account del bot e a rimuovere i contenuti inappropriati. Non solo. La Commissione Europea ha confermato di aver ricevuto una richiesta ufficiale dalla Polonia per avviare un’indagine su Grok. "Siamo in contatto con le autorità nazionali e con la piattaforma X. Valuteremo con attenzione la segnalazione e risponderemo nei tempi opportuni", ha dichiarato Thomas Regnier, portavoce per il Digitale della Commissione.

"Prendiamo molto seriamente questi potenziali rischi. Grok è integrato in una piattaforma online di grandi dimensioni, già designata ai sensi del Digital Services Act (DSA). Di conseguenza, X è tenuta per legge a valutare e mitigare i rischi associati a tutti i suoi servizi, incluso Grok", ha aggiunto Regnier.

L’incidente dei post antisemiti rischia quindi di rallentare l’adozione di Grok 4 in ambito aziendale. Il modello, al di là degli ottimi risultati tecnici, dovrà infatti anche dimostrare di essere sicuro per essere integrato nel mercato del lavoro.