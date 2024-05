video suggerito

A cura di Elisabetta Rosso

Tutti i riflettori sono su Gemini AI, il modello di punta di Google. Ma lo sapevamo già. Non poteva che essere la protagonista di Google I/O 2024, la conferenza più importante dell'anno per l'azienda. D'altronde Google ha deciso di riorganizzare i suoi team di ricerca per concentrarsi sull’IA. "Investiamo in intelligenza artificiale da una decina di anni, siamo ancora all’inizio, ma vediamo moltissime opportunità per tutti, creator, professionisti", ha esordito Sundar Pichai, Ceo di Google.

Sundar Pichai, ha anche annunciato che, a partire da oggi, Gemini 1.5 Pro sarà disponibile in 35 lingue e 150 Paesi per chi è abbonato a Gemini Advanced. Gemini sarà in grado di analizzare documenti, basi di codice, video e registrazioni audio più lunghi rispetto a prima. In un'anteprima privata di una nuova versione di Gemini 1.5 Pro, l'attuale modello di punta dell'azienda, è stato rivelato che può contenere fino a 2 milioni di token.

I motori di ricerca con l'IA

L'intelligenza artificiale promette di sconvolgere la nostra esperienza di ricerca grazie a risposte intuitive e cordiali al posto di elenchi di link. Sarà in grado di restituire risultati basati su ciò che l’utente sta cercando. Non solo, l'IA può analizzare il comportamento di ricerca passato e i dati degli utenti per fornire risultati su misura (l'implementazione non è priva di rischi). "Stiamo introducendo la multi step reasoning per permettere a Google di fare le ricerche per te: è in grado di dare risposte a domande multiple e complesse", ha annunciato l'azienda.

Google aggiungerà anche nuove funzionalità alla sua intelligenza artificiale, tra queste "Gems" che consente agli utenti di creare versioni personalizzate dell'assistente Gemini con personalità diverse.

Le altre novità presentate da Google

Pichai ha spiegato che l'azienda si sta concentrando sullo shopping online, "un assistente AI potrebbe essere in grado di restituire le scarpe acquistate che non vogliamo", ha sottolineato. Non solo, durante il keynote I/O ha annunciato "Ask Photos", la nuova funzionalità dovrebbe arrivare quest'estate. Pichai ha chiesto all'app: "Qual è il mio numero di targa?" e Google Foto è stato abbastanza "intelligente" da capire a quale veicolo si riferisse, in base alla posizione, e quante volte è apparso nelle foto nel corso degli anni, e ha restituito il numero effettivo in una risposta testuale.

C'è poi Project Astra, il nuovo progetto di intelligenza artificiale multimodale, "che può essere davvero d’aiuto nella vita di tutti i giorni". Nella dimostrazione hanno inquadrato diversi oggetti su una scrivania e l'IA è stata in grado di riconoscerli in pochi secondi. È stato anche presentato Veo, il competitor di Sora di Open AI. Con Veo è infatti possibile creare brevi video partendo da imput testuali.

Come funziona Gemini

L'anno scorso il protagonista era stato Bard, il chatbot basato sul modello di intelligenza artificiale PaLM2 che doveva competere con ChatGPT, il software creato da OpenAI. Ora il suo posto è stato preso da Gemini, non è un chabot ma un modello di intelligenza artificiale. In altre parole, è un motore a cui poi si possono collegare pezzi di software diversi in base alle funzioni di cui si ha bisogno.

Gemini è un intelligenza artificiale “multimodale”, quindi in grado di gestire con continuità una serie di formati diversi che vanno dal testo alle immagini, passando per il video e i codici informatici. La sfida è chiara: competere con ChatGPT. Non ha caso Google, dopo aver annunciato gemini ha diffuso una tabella in cui cui mostra la differenza di prestazioni tra la sua IA e ChatGPT 4.0. Le due intelligenze artificiali sono state messe a confronto in otto campi di utilizzo: Gemini è risultata superiore in sette.