Creare immagini con Intelligenza Artificiale generativa text-to-image

Nella prima versione di questo post, del 19 novembre 2023 avevo inserito fra i test anche BingAI. Oggi al suo posto c’è Copilot. Quindi, dopo solo 3 mesi ecco l’aggiornamento indispensabile per allineare i contenuti.

Sono diverse le piattaforme di intelligenza artificiale (a pagamento e gratuite) che consentono la generazione di immagini (AI text-to-image). Ho provato alcune applicazioni (gratuite) per cercare di rispondere alla domanda: ma questi strumenti, in biblioteca, possono essere utili? Non sostituiscono certo le fotografie degli spazi della biblioteca o quelle che hanno come soggetti i nostri utenti. A un primo esame si possono considerare alle stregua delle immagini gratis (qui alcune riflessioni sul tema) ma in realtà aprono nuovi scenari.

Quello che accomuna l’uso di tutte le piattaforme è il prompt. In sintesi, l’insieme di istruzioni che vengono fornite all’AI per consentirle di generare l’output richiesto. Fondamentale è la capacità di essere chiari, sintetici e offrire, nello stesso tempo, gli elementi che devono connotare la nostra richiesta e quindi il risultato che ci aspettiamo. Ecco alcuni risultati dei miei test nei quali ho volutamente usato prompt molto semplici.

NightCafe

E’ uno dei grandi nomi nel mondo dei generatori d’arte AI. Di fatto è la risposta gratuita a Midjurney (che è a pagamento). Lo strumento facile da usare, con diverse possibilità a disposizione. Da evidenziare la possibilità di scegliere lo “stile”. Questa app consente di avere una piena rivendicazione del copyright delle foto generate: si è proprietari della creazione, indipendentemente dal fatto che si scelga di renderla pubblica o meno. Nella mia prova il mio prompt t: libri, biblioteca, blu. Due gli stili che ho scelto, le cui differenze sono ben evidenti nell’immagine seguente. Per ciascuna generazione sono state prodotte 4 foto.

Intelligenza Artificiale

DeepAI

Basata su sw open source, offre due linee di funzioni: AI image generator e AI image editor. Vediamo la prima: text-to-image. Fra i possibili stili ho provato il “generatore di loghi”. Da verificare bene, in caso di uso, eventuali regole e limiti legati al copyright. In questo “esercizio” il prompt è: books library blue. Ottenuto il primo risultato (a sinistra nell’immagine riportata), ho aggiunto il termine yellow. Ed eccoli entrambi.

Intelligenza Artificiale

Poi ho cambiato stile mantenendo sempre le stesse parole nel testo (books library blue) e il risultato è l’immagine di copertina (bellissima!!) ottenuta con lo stile: Cyberpunk Generator API.

Canva

Di Canva, strumento conosciutissimo e ricco di funzionalità (molte gratuite) di cui ho parlato anche nel post dedicato alle immagini “gratuite”, ha pochissimo introdotto gli “Strumenti magici“: “tutta la potenza dell’AI in un’unico posto“. Si parte dalla Scrittura magica (con generazione di testi), per passare alla Conversione magica (trasformare un progetto, ad esempio da immagine a documento), all’Animazione magica (che propone/aggiunge a un progetto grafico animazioni), agli Effetti magici che trasforma un elemento grafico in base allo stile che viene fornito in input.

Intelligenza Artificiale

A tutto questo si aggiungono i Contenuti magici da testo a video e da testo a immagine. Ecco un esempio di immagine che ho ottenuto con prompt: autunno libri foglie sfumate e stile “fotografia”.

Canva offre anche : Ritocco magico, Acquisizione magica e Espansione magica.

Intelligenza Artificiale

Conversione magicaEffetti magiciAcquisizione magicaEspansione magica e Animazione magica possono essere utilizzati solo con i piani in abbonamento (senza limiti). Contenuti magici e Scrittura magica sono utilizzabili anche nel piano gratuito ma con limiti di utilizzo “in totale”.

Copilot Designer Image creator

Da BingAI a Copilot: l’AI si sviluppa e potenzia, anche nella generazione di immagini. All’interno di Copilot è disponibile Designer. Si può accedere direttamente oppure lanciare il prompt da Copilot. Designer crea immagini basate su DALL-E anche in diverse modalità: sul web, sul dispositivo mobile o nelle app. Rispetto alla versione precedente la qualità delle immagini è migliorata anche se l’attenzione sulla formulazione del prompt rimane massima per evitare “fraintendimenti”. Ecco un esempio di prompt e di immagini realizzate.