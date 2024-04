video suggerito

Come creare immagini con l'intelligenza artificiale: i migliori generatori IA di immagini e come usarli I generatori di immagini IA sono numerosi e presentano caratteristiche diverse: gratis come Copilot o a pagamento come Dall-E, su un sito come Leonardo o su un software a parte come Midjourney. In questo articolo mostreremo quali sono i siti principali per creare immagini con l'IA e come usarli.

A cura di Velia Alvich

I generatori di immagini IA sono dei modelli di intelligenza artificiale (IA) che riescono a tradurre un comando testuale in una composizione visiva. Si basano sulle reti neurali, cioè la struttura che simula il funzionamento del cervello umano. Un po' come quando cerchiamo di disegnare il volto di una persona partendo dalla nostra memoria, così l'intelligenza artificiale si basa su miliardi di immagini su cui si è allenata per restituirne una fedele alla realtà.

Ad aiutarci in questo compito sono piattaforme, siti e software su cui l'utente può inserire delle istruzioni testuali per descrivere sia il contenuto dell'immagine sia la sua forma, ma anche impostare delle opzioni specifiche che aiuteranno a restituire una figura così come l'abbiamo pensata.

Da quando è cominciata l'ondata di intelligenze artificiali generative, il numero di strumenti per creare immagini si è moltiplicato di giorno in giorno. A dimostrarlo sono tutte le occasioni in cui un'immagine è stata presa per vera in un primo momento, mentre successivamente è stato necessario rivelare che si trattava di un'immagine falsa. È il caso della fotografia che ha vinto un concorso nonostante fosse stata generata da un'IA, ma anche delle celebri immagini di papa Francesco con il piumino Balenciaga o quella del presunto arresto di Trump. Così anche quelli più famosi si sono dovuti adattare alle novità degli altri. Qualcuno ha deciso anche di optare per un servizio totalmente gratuito, mentre altri generatori propongono invece un sistema di abbonamenti o l'utilizzo di "crediti".

In mezzo all'oceano di generatori di immagini, quelli che spiccano sono i "fratelli minori" dei chatbot più famosi: ChatGPT con il suo gemello Dall-E fanno parte della famiglia di OpenAI, Gemini fa sia da chatbot che da generatore di immagini nell'universo Google, così come l'intelligenza di Microsoft chiamata Copilot funziona per generare testi ma anche immagini.

Come funzionano i generatori di immagini IA

Il funzionamento di un generatore di immagini IA è simile a quello dei chatbot, anche se il risultato alla fine è diverso. Si parte sempre da un prompt, cioè un'istruzione o una descrizione di cosa deve generare il modello. A differenza dei chatbot, quindi, dal testo non nasce altro testo, bensì un'immagine: è per questo che si parla di text-to-image. Quando si parte da un'immagine che l'IA deve usare come ispirazione, invece, si parla di image-to-image.

Perché funzionino, i modelli sono addestrati su milioni (a volte miliardi) di coppie immagine-testo che permettono all'IA di capire che alla parola "cane" corrisponde una lunga serie di immagini che ha già visto. Per ricostruire poi la figura, i generatori usano due diverse tecnologie. Da un lato il Generative Adversarial Network (GAN), un metodo di apprendimento che prevede due reti neurali, un generatore e un discriminatore, che si sfidano una nel generare e l'altra nel validare delle immagini in un cosiddetto "gioco a somma zero". Il metodo che ormai sta prendendo piede, però, è quello del modello di diffusione. Grazie a questo, l'IA impara a decostruire l'immagine originale per poi ricostruirla passo dopo passo togliendo gli elementi di disturbo che aveva aggiunto per "distruggerla".

I migliori generatori IA per creare immagini con l'intelligenza artificiale

Dalla teoria alla pratica. Nelle prossime righe racconteremo quali sono i generatori IA più performanti sul mercato. Fra strumenti gratuiti e quelli che richiedono un abbonamento, fra quelli che si possono usare semplicemente grazie a un motore di ricerca e quelli che invece richiedono l'uso di altre piattaforme, c'è una vastissima offerta di generatori per gli utenti con una vena artistica. Per provare i generatori di immagini IA, abbiamo scelto un prompt che ricorda una serie tv americana, The Office. Questa è la versione in italiano delle istruzioni:

Due uomini che si stringono la mano mentre guardano verso la fotocamera che sta facendo una foto di loro due. Quello a sinistra è un uomo alto e di mezza età, indossa un completo formale e una cravatta marrone chiaro, sta sorridendo con le labbra strette. Quello a destra è un robot IA, è più basso, ha capelli castani lunghi fino alle spalle, una camicia a maniche corte e una cravatta blu e gialla e sorride in maniera imbarazzata. Sullo sfondo si intravede un ufficio. La scena ricorda la fotografia di Michael Scott ed Ed Truck che si vede in una puntata della serie tv americana The Office.

Canva

Il generatore di immagini di Canva è uno strumento semplice da usare per chi già utilizza il versatile strumento di progettazione grafica. Il primo passo è selezionare la grandezza della tela dove verrà incollata l'immagine. A sinistra dello schermo c’è uno spazio per inserire il prompt (che non può essere più lungo di 280 caratteri). E nel caso in cui manchino le idee, si può cliccare sul pulsante “Ispirami” per avere qualche suggerimento creativo.

Solo due le opzioni aggiuntive: lo stile (acquarello, sognante, anime, filmico e foto) e le proporzioni (quadrato, orizzontale e verticale). Il resto lo fa il generatore, che poi fornisce un'immagine che verrà incollata sulla tela e che potrà quindi essere integrata nella propria creazione grafica. Rispetto ad altri generatori di immagini come Leonardo AI o Adobe Firefly, insomma, scarseggia di impostazioni predefinite.

Capisce l’italiano e funziona con i crediti (quindi le prime 50 generazioni sono gratuite). Iscrivendosi a Canva Pro, il programma premium della piattaforma, si possono generare fino a 500 immagini ogni mese.

Copilot

L'immagine generata da Copilot è quella più vicina al prompt: a sinistra c'è davvero un uomo di mezza età, a destra Michael Scott in versione robot

Copilot è la creatura di Microsoft. A questo generatore si accede gratuitamente tramite il sito: fa sia da chatbot, sia da generatore di immagini. La sua natura “due in uno” lo spinge naturalmente verso una modalità basata sui prompt, proprio come Midjourney e Dall-E3. E così nello spazio per scrivere le indicazioni si comincia con un classico “Genera un’immagine di”, seguito dalle istruzioni per creare la figura desiderata.

Restituisce quattro immagini di buona qualità, nel nostro caso fedeli alla scena che volevamo riprodurre. Dopo averle generate, Copilot dà anche la possibilità di fare degli aggiustamenti (sempre partendo da un testo) sulla base dell’immagine prodotta. Non sempre riesce, però, a capire la natura dell’istruzione aggiuntiva.

In teoria capisce l’italiano. In pratica sembra tradurre il prompt in una stringa molto più breve e semplice, compromettendo così il risultato finale. Insomma, dà il meglio di sé in inglese, ma per chi ha problemi con questa lingua può avventurarsi comunque.

La tecnologia è “prestata” da Dall-E3, il generatore di immagini di OpenAI con cui Microsoft ha uno stretto rapporto. Lo stesso chatbot Microsoft, infatti, è un gemello di ChatGPT. E come Dall-E (ma anche MIdjourney), l'utente deve descrivere con precisione il prompt e non può utilizzare delle opzioni preimpostate come fanno altri generatori come, per esempio, Adobe Firefly e Leonardo AI.

Midjourney

Per accedere a uno dei modelli più famosi per generare immagini IA è necessario essere iscritti a Discord, la piattaforma di messaggistica per gamer che si divide in tanti server. Proprio uno di questi ospita Midjourney, l'intelligenza artificiale che è responsabile della creazione di immagini iperrealistiche come quella del papa in Balenciaga. Inizialmente era gratis, ma con la sua fama è diventato obbligatorio usare uno dei quattro piani tariffari: dai 9 ai 110 euro per migliorare anche la velocità della generazione e il numero di prompt che possono essere lanciati in contemporanea.

Diversamente da altri generatori di immagini (ma proprio come Dall-E3), Midjourney funziona come i chatbot: tutte le indicazioni devono essere scritte nel prompt, comprese le informazioni sullo stile, sulle proporzioni, sui filtri da applicare. Rispetto ad altre IA può risultare più difficile da usare. In compenso, il livello di personalizzazione dell’immagine è sorprendente: con prompt anche lunghissimi si possono ottenere figure che sembrano reali (specialmente se si conoscono le basi della fotografia). Per chi non sa orientarsi, il sito ufficiale offre una lunga serie di consigli, ma ci si può fare ispirare anche dai prompt lanciati dagli altri utenti nel server.

E se si vuole modificare un’immagine a partire da una già generata,è possibile chiedere delle variazioni su una delle quattro immagini proposte.

Midjourney è l'unica che non può essere utilizzata direttamente online, accedendo a un sito. Altri generatori come Canva, Craiyon, Copilot e Dall-E3 (di cui parleremo adesso) sono disponibili tramite browser.

Dall-E3

Dall-E3 è riuscita a interpretare correttamente il senso del prompt in italiano e ha realizzato un'immagine dallo stile più fumettistico

Fratello di ChatGPT, figlio di OpenAI e uno dei protagonisti nel panorama dei generatori di immagini IA. Stiamo parlando di Dall-E3, un modello sviluppato dall’azienda di Sam Altman e che ha aperto la strada alle intelligenze artificiali che si occupano di creare immagini.

C’è solo un modo per accedere direttamente a Dall-E3: acquistare l'abbonamento premium di OpenAI che costa circa 18 euro al mese. In alternativa, si può sfruttare il generatore di Copilot che usa la stessa tecnologia.

Per usare Dall-E3 si accede da ChatGPT, selezionando nel menu a tendina l’opzione per passare alla quarta versione del popolare modello di chatbot. Poi da lì si sceglie di accedere alla versione beta di Dall-E3. La modalità non cambia molto rispetto al chatbot gemello: è necessario scrivere un prompt testuale per dare le indicazioni all'IA. La regola è sempre la stessa: più sono dettagliate le istruzioni, migliore sarà il risultato finale.

Dall-E3 fornisce quattro versioni dello stesso prompt. Se non si è soddisfatti, è necessario modificare le istruzioni iniziali. Il problema è che così verranno generate nuove immagini (a differenza di quello che fa Midjourney, per esempio). Se invece il risultato va bene com’è, basta scaricarlo cliccando sull’icona in alto a sinistra sull’immagine.

Fotor

A Fotor abbiamo chiesto di partire da un'immagine e di modificarla per fare in modo che a destra ci sia un robot

Prompt da 3000 caratteri, 16 stili e 5 proporzioni. Il generatore di immagini IA di Fotor condivide le basi dei suoi concorrenti (compresa la generazione image-to-image) senza aggiungere opzioni particolarmente complicate. I token a disposizione dopo essersi iscritti non sono molti: 8 crediti per cominciare e ogni immagine generata ne fa spendere uno. Pochi, se confrontati ad altri generatori che fanno uso di token come Runaway (che ne dà 500) o Leonardo AI (sono 150 quelli iniziali). Il resto è a pagamento, come abbiamo già visto in altre piattaforme.

Mentre si aspetta che il modello generi l’immagine, sullo schermo scorrono alcuni consigli per migliorare i prompt (che possono essere scritti in italiano, generando risultati più imprecisi). Una volta creata, l’immagine può essere modificata con l’aiuto del’IA.

Adobe Firefly

L'immagine generata da Adobe Firefly rappresenta correttamente due uomini che si stringono la mano e sorridono alla fotocamera, ma sull'aspetto dei protagonisti non si è avvicinata al prompt

Firefly è lo strumento di Adobe e può essere usato in prova gratuita. Nella pagina principale si vede subito lo spazio per inserire il prompt (con un utile esempio per chi è a corto di idee). Dopo avere cliccato una prima volta su “Generate”, si accede a una lunga lista di opzioni che permette di personalizzare la propria creazione: dagli effetti da applicare al colore prevalente nell’immagine, dall’illuminazione alla posizione dell’inquadratura, ma anche le proporzioni e stile, che può essere solo artistico o fotografico. Solo due stili predefiniti (Stable Diffusion ne ha 24), ma comunque notevoli potenzialità di personalizzazione dell'immagine.

Alla fine genera quattro immagini che possono essere valutate, salvate sui preferiti ma anche modificate. Per esempio, decidendo di aggiungere sempre grazie all’IA un nuovo elemento in un punto specifico, oppure rimuovendo lo sfondo con un clic.

L’IA di Adobe capisce l’italiano quanto l’inglese, anche se in entrambe le lingue non ha seguito alla perfezione il nostro prompt (manca sempre il robot che abbiamo chiesto nelle istruzioni).

Le generazioni, però, non sono infinite, come abbiamo visto anche in altri generatori. Per sbloccare tutte le potenzialità dello strumento è necessario acquistare piano tariffario premium da poco più di cinque euro al mese.

Craiyon

Craiyon ci prova ma non riesce: i volti inquietanti, le posizioni innaturali, il prompt non rispettato

Solo tre impostazioni di stile, uno spazio per i prompt e uno per quelli “negativi” (cioè gli elementi da escludere), come Canva anche Craiyon non ha molte opzioni preimpostate e questo limita la creatività. Per generare nove immagini ci impiega un minuto, che diventano 45 secondi o 15 secondi con l’iscrizione ai piani premium (che garantiscono un numero illimitato di creazioni).

Le immagini generate non sono al passo dei suoi simili più performanti: figure distorte, volti inquietanti, mani ancora non perfette che non lasciano una buona impressione. E per quanto non ci sia nulla che impedisca di usare un prompt in italiano, l’interpretazione di qualsiasi lingua diversa dall’inglese lascia a desiderare. Come strumento, insomma, fa più al caso di chi preferisce la quantità piuttosto che la qualità.

Stable Diffusion Web

A Stable Diffusion si accede da un sito ed è uno dei più ricchi quando si tratta di stili predefiniti: ne ha 24, dal rococò ai graffiti, dalla pixel art allo stile cinematografico, dai fumetti alla caricatura. Si possono generare fino a due immagini gratuitamente, quattro solo con l’iscrizione al programma premium. Sono due i piani tariffari: con circa 7 euro al mese si possono generare fino a 2000 immagini al mese, con 14 euro se ne possono creare fino a 4000. In entrambi i casi, il piano di abbonamento premium toglie la filigrana che “marchia” l’immagine. Per chi non vuole pagare, invece, c’è una prova gratuita: Stable Diffusion dà 10 crediti che si rigenerano dopo un giorno.

Rispetto ad altri generatori di immagini d’intelligenza artificiale come Dalll-E o Canva, però, non accetta prompt in italiano. In compenso,: si possono anche caricare delle immagini che, insieme alla possibilità di caricare un prompt per modificare l’input visivo e alle altre opzioni già presenti sulla piattaforma, daranno una versione modificata della figura originale.

Leonardo AI

Diversamente da altre piattaforme, Leonardo AI si distingue perché consente di scegliere anche il modello di intelligenza artificiale da usare per generare le immagini. Non solo quelli sviluppati da Leonardo stesso (che corrispondono spesso a diverse impostazioni o stili grafici) ma anche una lunga lista di modelli addestrati dalla community.

Oltre alla possibilità di caricare sia un prompt (in inglese ma anche in italiano) ma anche un’immagine come riferimento, Leonardo AI si distingue da generatori come Craiyon o Canva per le tante le opzioni di personalizzazione oltre a quelle che abbiamo già visto in altri siti: una maggiore personalizzazione di dimensione e proporzioni della tela, la possibilità di generare immagini con sfondo trasparente e fino a otto immagini create con un solo prompt. Dopo la creazione, l’immagine può essere modificata, usata come punto di partenza per una nuova oppure si può creare un’animazione. Ogni azione, ovviamente, ha un costo in token. I crediti vengono scalati dai 150 gratuiti iniziali. Per chi vuole sfruttare le potenzialità del modello IA, ci sono tre piani tariffari che garantiscono migliaia di generazioni di immagini ma anche la possibilità di addestrare sempre più modelli a seconda delle proprie esigenze.

Runaway

Come Leonardo, anche Runaway dà agli utenti la possibilità di addestrare il proprio modello di intelligenza artificiale. Per quelli che non vogliono sforzarsi troppo, invece, c’è un generatore con poche e semplici opzioni: le proporzioni, la risoluzione, lo stile da usare e il numero di immagini da generare con gli oltre 500 token gratuiti. Anche in questo caso si può usare uno spazio per il prompt (e uno per gli elementi da escludere), oltre a poter caricare un’immagine come riferimento. Terminati i crediti gratuiti, con tre piani tariffari dai 13 agli 87 euro mensili si possono aumentare le generazioni per le immagini, ma anche migliorare le impostazioni per i video generati con l’IA.

Runaway è ricco di consigli: nella pagina principale del generatore ci sono numerose immagini da usare come spunto, ma anche una volta creata la propria si possono sfruttare dei tutorial per migliorare le proprie capacità nello scrivere prompt efficaci.

Unstable Diffusion

Unstable Diffusion può essere usato grazie a un software da scaricare sul proprio computer oppure attraverso un sito. Anche questo generatore di immagini IA garantisce un numero limitato di crediti che si rigenerano dopo 24 ore. I piani a pagamento (uno da 13 euro, uno da 26 e uno da 55) garantiscono un numero crescente di crediti mensili e l’uso commerciale delle immagini.

La struttura per generare la propria creazione è simile alle altre IA, come per esempio Stable Diffusion o Adobe Firefly: un prompt e una serie di opzioni per personalizzare la generazione. Una volta creata, l’immagine può essere utilizzata come punto di partenza per un remix dello stesso prompt o per usare le stesse impostazioni per una creazione diversa.

Tante impostazioni, ma poco spazio per gli utenti che parlano solo in italiano: non c’è nulla a bloccare i prompt nella nostra lingua, ma l’IA fatica a comprendere le istruzioni quando non sono scritte in inglese.