GenAI

GenAI le evoluzioni: BingAI e Copilot, Bard e Gemini

GenAI, premessa

Come prima cosa è necessario precisare che questo post è scritto in collaborazione con Gemini, la GenAI di Google e con Copilot la nuova GenAI di Microsoft. Le informazioni contenute, dopo opportuna verifica, sembrano tutte corrette. Il prompt usato ha richiesto un linguaggio naturale, di facile comprensione. I link aggiunti sono integrazioni “umane” così come alcune variazioni rispetto ai testi originali che sono stati opportunamente “mergiati” per avere un contenuto più completo.

Obiettivi

Obiettivo di questo post è analizzare le evoluzioni di quattro strumenti di generazione di contenuti: BingAI, Copilot, Bard e Gemini. Questi strumenti sfruttano i modelli di linguaggio più avanzati LLM (descrizione chiara in questa pagina di HPE) per creare testi, codice e altro. Ho usato Copilot anche in qualche test di generazione di immagini (TTI), qui un piccolo approfondimento e in alcuni post sono presenti le immagini create. L’immagine di copertina, ad esempio è ottenuta da Copilot. Il testo in corsivo non ha interventi di GenAI.

BingAI

Era il chatbot integrato nel motore di ricerca di Microsoft. Basato si GPT-3. Lanciato nel luglio 2022, ha avuto un buon riscontro da parte degli utenti. Microsoft ha deciso di rinnovarlo e integrarlo con il browser Edge, creando Copilot.

Copilot

E’ il nuovo nome di BingAI, che ora funziona su GPT-4, il modello di linguaggio successivo a GPT-3, che offre maggiori capacità e prestazioni. Copilot, presentato nel gennaio 2024, si propone come un assistente virtuale che può aiutare gli utenti a scrivere codice, creare testi, cercare informazioni e molto altro. Copilot è in grado di apprendere dalle preferenze e dallo stile degli utenti, e di offrire suggerimenti personalizzati e pertinenti. Cosa farai con Copilot con Bing? Provalo subito …

Bard

Era il nome del progetto sperimentale di Google, che mirava a creare un’interfaccia di generazione di contenuti basata su un modello di linguaggio proprietario di Google, che integrava dati da diverse fonti, come il web, i libri e i documenti. Bard, lanciato nel marzo 2023, si è dimostrato un’alternativa interessante a ChatGPT, il chatbot di OpenAI basato su GPT-3.

Gemini

Il nuovo nome di Bard è Gemini. Ora funziona su un modello di linguaggio che è il risultato dell’unione tra il modello di Google e il modello di OpenAI. Gemini, disponibile da febbraio 2024. si presenta come uno strumento di collaborazione tra gli utenti e l’IA generativa, che può aiutare a creare contenuti di qualità e originali. Gemini è integrato con il motore di ricerca di Google e offre accesso a una vasta quantità di dati.

C’è da aggiungere che dopo il rilascio di Gemini 1.0 è passata solo una settimana per il successivo rilascio della 1,5. Molto importante evidenziare alcuni aspetti del potenziamento di Gemini 1.5. Molto si gioca sulla cosiddetta “context window”. Riprendendo la presentazione di Gemini 1.5 la “finestra di contesto” di un modello di AI è “costituita da token, che sono gli elementi costitutivi utilizzati per l’elaborazione delle informazioni. I token possono essere intere parti o sottosezioni di parole, immagini, video, audio o codice. Quanto più grande è la finestra di contesto di un modello, tanto più informazioni può accogliere ed elaborare in un dato prompt, rendendo il suo output più coerente, pertinente e utile”. Gli sviluppatori di Google hanno aumentato la “finestra di contesto” di 1,5 Pro (la versione a pagamento, oltre i 32.000 token originali per Gemini 1.0 e il target ora può arrivare fino a 1 milione di token in produzione. Che tradotto significa “poter elaborare grandi quantità di informazioni in una volta sola, tra cui 1 ora di video, 11 ore di audio, basi di codice con oltre 30.000 righe di codice o oltre 700.000 parole.” 

Considerazioni

Queste sono le principali evoluzioni di BingAI, Copilot, Bard e Gemini, che rappresentano le strategie di Microsoft e Google per competere nel campo dell’intelligenza artificiale e della generazione di contenuti. Questi strumenti offrono agli utenti la possibilità di sfruttare i modelli di linguaggio più avanzati e di creare contenuti in modo semplice e veloce. Tuttavia, questi strumenti non sono perfetti e possono commettere errori o fornire informazioni errate. Pertanto, è importante utilizzare questi strumenti con consapevolezza e verificarne sempre l’accuratezza.