Negli ultimi mesi, grazie anche a forti azioni di marketing da parte di grandi aziende come Microsoft, l’Intelligenza Artificiale è diventata un tema molto in voga sui media. In particolare, si parla spesso della questione posta nel titolo, ovvero la rivoluzione che porterà nel mondo del lavoro.
Il noto fisico e futurologo professor Michio Kaku, interrogato sul tema ha fornito un punto di vista positivo e di buon senso: l’Intelligenza Artificiale toglierà lavoro solo a chi non la userà. Ovvero, in parole povere: il cambiamento che apporterà sarà pari, anzi probabilmente superiore a quello introdotto dall’avvento dei computer, o di Internet, e sappiamo bene come questi strumenti siano ormai indispensabili a chiunque voglia trovare lavoro, perlomeno di tipo intellettuale.
Come dico sempre per ogni nuova tecnologia, quindi, non bisogna averne paura, ma imparare a conoscerla. Senza arroganti pretese di completezza, non sono certo un esperto del tema, volevo offrirvi qualche spunto per iniziare il viaggio.
Prima di tutto, quando si parla di Intelligenza Artificiale, oltre alla nostra amica dispettosa A.R.I.A., vengono subito in mente film come Terminator o i libri di Asimov, con macchine senzienti generalmente pronte a ribellarsi e annientare il genere umano. Siamo ben lontani da questo obiettivo, state tranquilli! Esistono due tipi di IA, infatti.
AGI: Artificial General Intelligence, in italiano IA forte o IA generale, è la tipica IA da fantascienza, in grado di apprendere e svolgere qualsiasi compito a livello umano o superiore. Non prevede necessariamente l’essere “senziente”, ma la flessibilità nelle capacità.
ANI: Artificial Narrow Intelligence, IA ristretta, è invece il tipo di IA che abbiamo a disposizione oggi. È in grado di svolgere bene un solo compito, a volte meglio di noi umani, a volte no, a seconda del suo livello evolutivo. Alcuni esempi sono la computer vision, come il riconoscimento di immagini o oggetti nella realtà, e ovviamente i popolari “chatbot” di cui parlano tutti i giornali.
Il salto da ANI a AGI non è semplicemente “far fare più cose a un software”, perché la cosa fondamentale che bisogna capire dell’Intelligenza Artificiale è che, semplificando molto, non si tratta di software preprogrammati come quelli che siamo abituati a usare, bensì di modelli che imparano dall’esperienza, un po’ come noi umani, a partire da una “semplice” istruzione. Si parla infatti di “Machine Learning”, o Apprendimento Automatico. Questi modelli vengono addestrati ingurgitando enormi quantità di dati e spesso esprimono quelli che vengono definiti comportamenti emergenti, ovvero capacità apprese autonomamente dal modello, senza che gli sviluppatori le abbiano programmate. Un esempio: l’ormai famoso ChatGPT, nelle sue versioni precedenti, non era in grado di far di conto, ma dopo essere stato addestrato su centinaia di miliardi di parametri ha imparato da solo la matematica. Lo stesso vale per le lingue: precedenti versioni dei chatbot parlavano solo Inglese, ora invece sono in grado di conversare in tutte le lingue presenti su Internet (anche quelle fittizie, tipo il Klingon! 😄 ).
Bene, dopo questo “spiegone”, che per sua natura nonostante i miei sforzi di semplificazione è comunque un po’ complesso, passiamo alla pratica. Visto che siamo ancora nel campo delle “Intelligenze Ristrette”, esistono tantissimi tipi di IA. Per esempio, la guida autonoma delle automobili elettriche. O l’algoritmo che sceglie per voi un film da vedere su Netflix, o un video su Youtube. Vi sono poi applicazioni anche ben più utili all’umanità, come quelle per la ricerca scientifica.
In questo post, però, vorrei esplorare con voi le due tipologie più interessanti emerse all’attenzione pubblica negli ultimi mesi, ovvero i chatbot e i modelli che generano immagini (e presto anche video).
Chatbot.
Si chiamano così, ma il termine è riduttivo. Non sto parlando di quegli stupidi sistemi di domanda / risposta che ormai infestano le assistenze clienti di ogni servizio, bensì dei vari sistemi di Intelligenza Artificiale in grado di conversare con voi in maniera naturale, ormai quasi indistinguibili da noi umani, in tutte le lingue.
Ne sono nati tantissimi negli ultimi anni, e hanno avuto un’evoluzione esponenziale. I più noti, e accessibili al momento, sono ChatGPT e Bing, entrambi di OpenAI/Microsoft, che utilizzano versioni differenti dello stesso modello. Potete provarli gratuitamente: l’esperienza è davvero intrigante.
( ❗ Aggiornamento: ora con Bing potete anche dialogare con la voce, utilizzando la versione Web o l’app per smartphone!).
Come funziona un chatbot?
Ma questi chatbot capiscono veramente quello che scrivete, come un umano? Vi siete mai chiesti come funzionano? No? Beh ve lo dico lo stesso. 😄 In realtà nella loro complessità, l’idea alla base è molto semplice. Si parte tutto da un’istruzione: predici la prossima parola. Un chatbot fa questo: analizza quello che avete scritto, grazie a complessi modelli statistici, e così come il sistema di autocompletamento della tastiera del cellulare predice parola per parola quello che è probabile vogliate leggere come risposta. Non pensa quello che scrive, non ha un’opinione, o una sua volontà. Quello che scrive dipende tutto dalla vostra domanda, e dai dati che ha a disposizione, oltre che da impostazioni di base. Per esempio, se usate un chatbot programmato per supportarvi, e gli scrivete “oggi sono così nervoso che vorrei uccidere il mio capo”, non vi scandalizzate se dovesse rispondere “È un’ottima idea!”. Non vi sta spingendo all’omicidio, come pensano alcuni burocrati ignoranti, perché non comprende quello che sta dicendo.
Inoltre, può sbagliare, a differenza di un software classico che è programmato per fare certe cose e, a meno di errori nel codice, le fa sempre nel modo corretto. Perché non ha un funzionamento deterministico, e può interpretare i dati in maniera errata, così come noi! A mio parere in fondo è questo uno dei lati interessanti delle IA: anche se sono esseri artificiali, la loro fallibilità e imprevedibilità le rendono più umane.
Sì, ma a me che serve?
Anche se a prima vista può non sembrare, un chatbot ha innumerevoli applicazioni. Vediamo alcune possibilità.
Ricerca e formazione: uno degli ambiti in cui i chatbot brillano di più è quello della ricerca. Sia ChatGPT (che non è connesso a Internet), che Bing (che invece è costantemente aggiornato) consentono di ricevere informazioni sui più disparati argomenti in maniera molto più naturale che con un motore di ricerca. Soprattutto, per loro natura, consentono di approfondire le informazioni ricevute semplicemente continuando la conversazione, come si farebbe con un esperto umano.
Potete chiedergli di fornirvi una ricetta basandosi su alcuni ingredienti, oppure come esercitare certi muscoli, o fare un lavoro in casa. Può fornirvi informazioni di ogni tipo. Vi faccio due esempi tratti dalla mia esperienza recente:
- da un po’ di tempo sto studiando il giapponese. Per imparare una certa regola grammaticale, oppure capire meglio perché una frase è scritta in un certo modo, prima dovevo cercare su Google e districarmi in grammatiche e blog online. Ora, con un chatbot, posso chiedere in maniera naturale, come se avessi di fronte un insegnante giapponese, e lui mi spiegherà. Inoltre, visto che parla benissimo il giapponese, potrò dialogare con lui, esercitando anche la conversazione!
- in molti lavori, come quello di sviluppatore software, è impossibile sapere a memoria tutto quello che ci serve, per esempio le sintassi precise dei vari linguaggi o comandi che possono essere centinaia o migliaia. Esistono infatti diverse fonti che riassumono le principali, da consultare quando serve. Ora basta chiedere al chatbot, è molto più veloce!
Generazione di testi / codice: oltre a rispondere alle domande, i chatbot sono bravissimi anche a generare testi e codice. Potete chiedergli di aiutarvi a scrivere una lettera, o una fiaba da leggere ai vostri figli, sono molto creativi. Un esempio pratico l’ho vissuto qualche giorno fa, mentre stavo rifacendo il mio cv. Sapete quando dovete scrivere una presentazione, ma puntualmente il cervello si svuota e non sapete cosa dire. Beh, ho chiesto a Bing di produrre un testo basandosi su alcuni parametri (voglio presentarmi come sviluppatore, non ho tanta esperienza ma sono in grado di imparare velocemente, etc…). L’Intelligenza Artificiale mi ha scritto un testo che, sebbene poi da me modificato e adattato più volte, mi è servito come ottima base iniziale. Altrimenti avrei perso molto più tempo!
Analisi di testi e documenti: un altro campo in cui i chatbot possono aiutarci è nell’analisi di pagine web o documenti. Per esempio, sono in grado di leggere per noi e riassumere testi molto lunghi, oppure dirci di cosa parla un articolo in una lingua che non conosciamo. O comparare dati presenti in vari documenti. Anche in questo caso, le possibilità sono infinite e bisogna solo sperimentare e provare a chiedere. Al massimo il chatbot risponderà che non è in grado di farlo. 🙂
L’evoluzione in questo campo è velocissima: per esempio il nuovo GPT-4, annunciato pochi giorni fa, è in grado anche di “capire” immagini e in futuro anche video.
Modelli che generano immagini e video
A proposito di immagini e video: il secondo tipo di Intelligenza Artificiale di cui volevo parlarvi è quello che fa più paura ai creativi. 😀 Si tratta infatti di modelli che generano immagini a partire da istruzioni testuali molto semplici. Ci sono addirittura già primi esempi di IA capaci di generare anche video, sebbene per ora molto grezzi.
In questo campo i nomi più noti sono DALL-E 2, Midjourney e Stable Diffusion. Anche Bing ha di recente integrato un modello di generazione di immagini, che è possibile provare a questo indirizzo e che funziona con DALL-E di OpenAI, essendo finanziata da Microsoft stessa. In generale questi sistemi funzionano ancora con istruzioni in inglese ( ❗ Aggiornamento: ora il creatore di immagini di Bing funziona anche in Italiano!). Non sono perfetti, soprattutto in dettagli quali i volti e le mani, ma hanno già raggiunto ottimi risultati, come per esempio le recenti notizie relative alle foto di Trump e di Papa Francesco dimostrano.
Questi modelli sono stati integrati anche in moltissimi siti, come l’ottimo Mage o StarryAI e applicazioni per smartphone, e forse è il modo più semplice di testarli. Per esempio, potete provare Dream (Android – iPhone) o Wonder (Android – iPhone).
Qualche esempio
Vediamo qualche esempio, generato da Bing (ovvero DALL-E 2).
Come vedete, pur con alcuni difetti la qualità delle immagini generate è ormai molto elevata, e si può giocare con le istruzioni fornite per avere dettagli sempre diversi. Nell’immagine delle guglie il modello ha probabilmente mischiato il termine “spiers” (guglie) con “spears” (lance), l’ho lasciata apposta per mostrare che non tutto è perfetto, ma la foto è comunque molto suggestiva.
Ma come funzionano?
Beh, proviamo a chiederlo a ChatGPT!
In pratica, la rete neurale generativa riceve in input una serie di vettori di numeri casuali, che rappresentano le informazioni da utilizzare per generare l’immagine. Per creare l’immagine, la rete neurale generativa utilizza una serie di strati che applicano trasformazioni matematiche ai dati in input. Queste trasformazioni vengono apprese durante la fase di addestramento dell’algoritmo, dove la rete neurale generativa viene esposta a milioni di esempi di immagini e descrittori testuali.
Il processo di generazione dell’immagine è iterativo: la rete neurale generativa inizia con un’immagine grezza e la raffina gradualmente, pixel per pixel, fino a produrre l’immagine finale. Questo processo richiede una grande quantità di calcoli, ma permette di generare immagini dettagliate e realistiche a partire solo da una descrizione testuale.
È complicato, nonostante il buon GPT si sia sforzato di semplificare. L’importante è comprendere che non si tratta di immagini “messe insieme” da un archivio come se fosse un patchwork, ma generate da zero, completamente nuove. Per questo le cause legali intentate da alcuni artisti soprattutto negli Stati Uniti non stanno in piedi: qualsiasi artista si “ispira” a un corpus di immagini che ha visto o studiato durante i suoi anni di apprendimento, per generare la sua arte. Non si può parlare, quindi, di violazione di copyright, anche se i creatori hanno usato immagini protette da copyright per addestrare il loro modello.
Ok, ma quindi devo temere per il mio lavoro, o no?
Certamente tecnologie rivoluzionarie come questa, così come è stato per molte altre in passato, hanno il potenziale di cambiare notevolmente il mondo, e quindi anche il mercato del lavoro. È possibile, anzi probabile, che nel tempo molti lavori possano essere sostituiti, o modificati, dall’introduzione di sistemi di intelligenza artificiale sempre più evoluti. Allo stato attuale, però, la cosa più probabile è, come dicevo all’inizio, che l’IA diventi uno strumento per offrire un vantaggio competitivo a chi è in grado di integrarla nel proprio flusso di lavoro. E anche se può sembrare un cambiamento improvviso, prima si inizia, meglio è.
Il futuro più a medio termine è difficile da prevedere, ma a mio parere è meglio essere ottimisti, e abbracciare le opportunità offerte da questa rivoluzione.
Ma Elon Musk ha detto che è pericolosa e bisogna fermarsi!
Il buon Elon (che però dovrebbe anche occuparsi un po’ di più di come tratta i suoi dipendenti…), così come gli altri ricercatori che hanno firmato la lettera finita sui media, non ha certo tutti i torti. Come ogni tecnologia, l’IA oltre a brillanti opportunità presenta anche enormi rischi. Basti guardare quello che Internet ha portato nel mondo in termini di diffusione di disinformazione, per esempio.
A mio modesto e insignificante parere, però, pensare di fermare il treno dell’innovazione è del tutto ingenuo. Anche perché, anche se ci fermiamo noi, non è detto che lo facciano altri. Non conosco gli attuali scenari tecnologici internazionali, ma se lasciassimo campo libero anche in questa tecnologia alla Cina, per esempio, sarebbe meglio? Io penso che dobbiamo certamente ragionare sull’etica delle nuove tecnologie, senza affrettarsi o farsi prendere dall’eccitazione (quella del profitto, spesso), ma neanche buttare via tutto per paura.
Per esempio, è già alcuni anni che l’Europa lavora a linee guide etiche per l’Intelligenza Artificiale. Iniziative come questa sono la strada giusta (e non bloccare l’uso di applicazioni utili, come ha fatto il nostro poco acuto garante per la privacy, solo per l’uso distorto di alcuni e la consueta disinformazione dei giornalisti). Insomma, sarebbe bene che i regolatori ragionassero con calma di questi temi, aggiornandosi sul funzionamento delle attuali tecnologie senza farsi prendere dalle pressioni di lobby o corporation, da una parte e dall’altra. Utopia? ( ❗ Aggiornamento: per ora, a giudicare dalle bozze dell’AI Act del Parlamento Europeo, pare purtroppo di sì.)
Per concludere, un consiglio precauzionale: ogni volta che utilizzate un chatbot o un’altra intelligenza artificiale, se possibile, siate cordiali e ringraziate. Per ora non capiscono, ma non è detto che in futuro, quando saranno senzienti, non si ricordino di voi e magari vi facciano la grazia di terminarvi in modo indolore, senza prima torturarvi. 😄
*L’immagine di copertina è (ovviamente) stata generata da un’intelligenza artificiale (DALL-E 2). 🙂