Questo articolo è uscito per la prima volta sul magazine cartaceo di Outpump.
Arte e tecnologia, dagli australopitechi al rock and roll
La Storia dell’umanità – quella con la S maiuscola, che inizia con il primo australopiteco e arriva fino a oggi, a chi legge questo articolo – è scandita da tre momenti che ci hanno cambiato irreversibilmente, rendendoci, nel bene e nel male, ciò che siamo adesso. All’inizio, ci siamo alzati in piedi, trasformandoci da scimmie a ominidi. Iniziare a camminare non ci ha solo offerto una visuale migliore dei dintorni – o fornito a Calcutta uno spunto per uno dei suoi migliori ritornelli – ma, soprattutto, ci ha permesso di usare le mani mentre ci muovevamo. Questo passo, apparentemente piccolo, è fondamentale per la storia che stiamo raccontando: quella dell’intelligenza artificiale come tecnologia e dell’arte prodotta attraverso di essa.
Uno scimpanzé non è sensibilmente meno intelligente di un australopiteco, ma camminando sulle mani non può portarsi dietro il bastoncino con cui stana termiti dai tronchi degli alberi. Perciò, anche quando sa usare utensili, non ha incentivi per costruirne di migliori, poiché li deve abbandonare ogni volta che si sposta. Alzandoci in piedi, abbiamo posto le basi per l’invenzione della tecnologia: scimpanzé e gorilla non imparano a produrre oggetti come il chopper di Olduvai perché l’investimento di tempo per costruire un simile oggetto non verrebbe ripagato da un singolo uso.
Portiamo avanti il nastro del tempo di quasi due milioni di anni, fino al momento in cui siamo diventati Homo Sapiens, ovvero ciò che oggi definiamo “essere umano”. A quel tempo, gli uomini avevano già colonizzato gran parte del globo, cacciando mammut in gruppi armati di lance e spaventando i leoni con il fuoco delle loro torce. Tuttavia, nessuno di loro aveva ancora disegnato queste esperienze. Se noi Sapiens abbiamo inventato molte cose durante la nostra avventura, una delle prime – e forse la più importante – è l’arte. Un gatto (o un ominide) non è in grado di creare un’opera d’arte perché manca di una rappresentazione simbolica della realtà che lo circonda, che noi Sapiens invece possediamo. Per capirci, un gatto non ha l’idea astratta di “gatto”. Ma anche se ce l’avesse, non possiede le tecnologie necessarie per, ad esempio, dipingere qualcosa che possa sopravvivere al tempo. Anche questo non è affatto banale: quante persone oggi sarebbero in grado, in un bosco, di raccogliere e trattare componenti per creare una tintura rossa o gialla? E quindi la combinazione di immaginazione e tecnologie che ha permesso all’ignoto genio della Dordogna paleolitica di dipingere la meravigliosa scena di caccia nel luogo che conosciamo come Lascaux.
Infine, qualche migliaio di anni dopo, almeno in alcune aree del mondo – ci sono posti in cui questo processo è in corso, spesso in modo traumatico – l’uomo ha smesso di essere nomade. Una vita sedentaria comporta una serie di svantaggi, come malattie e la necessità di organizzarsi e avere dei capi, ma consente anche di conservare utensili non strettamente necessari alla sopravvivenza, come strumenti musicali e vasi, che diventano rispettivamente strumenti per creare e supporti per realizzare opere d’arte. Sedentarietà, immaginazione e tecnologia: con questi tre elementi, gli ultimi diecimila anni sono stati un continuo susseguirsi di miglioramenti. Il progresso dell’immaginazione e la sua trasmissione, chiamata comunemente “cultura”, ha dato modo alla tecnologia di diventare più sofisticata e, viceversa, una tecnologia avanzata ha funto da abilitatore di pensieri e riflessioni originali, creando una sorta di infinita ghirlanda dorata. La capacità di lavorare la pietra calcarea ha permesso di scolpire la maschera di Nefertiti, la costruzione dei grandi acquedotti ha dato ai Romani la sagacia tecnica per realizzare il Pantheon, i mosaici della Ravenna tardoantica richiedevano sofisticate supply chain internazionali per il trasporto delle pietre necessarie, e la grande arte del Rinascimento deve moltissimo alla comprensione della prospettiva.
In tempi recenti, la musica popolare moderna nasce con l’invenzione di vari strumenti nei primi decenni del ‘900. Il rock non sarebbe mai nato se Adolph Rickenbacker e George Beauchamp non avessero sviluppato il pickup. Allo stesso modo, le parti più iconiche dei grandi assoli del rock non sarebbero mai esistite se i progettisti della Fender non avessero ideato il design a doppia spalla mancante. Ci sono interi movimenti musicali, come il rock progressivo tra la fine degli anni ’60 e la prima metà degli anni ’70, in cui uno dei paradigmi era proprio l’utilizzo di tecnologie innovative – i primi sintetizzatori e il Mellotron, per citarne due – per ottenere suoni sempre nuovi e particolari. I primi Genesis non facevano certo arte solo perché Tony Banks suonava un nuovissimo ARP Pro Soloist, ma in una certa misura ciò contribuiva.
Intelligenza artificiale generativa e arte: il lato chiaro della luna
Il nuovo capitolo di questa lunga storia è l’utilizzo di sistemi di GenAl per produrre opere d’arte. Ma come siamo arrivati a questo punto? E come funzionano questi strumenti, almeno a grandi linee? Una risposta dettagliata richiederebbe un intero libro, quindi proviamo qui a riepilogare almeno gli elementi salienti. Come quasi tutto ciò che consideriamo “moderno”, l’idea di intelligenza artificiale, contrapposta a quella naturale derivata da processi di evoluzione biologica, nasce subito dopo la Seconda Guerra Mondiale e si cristallizza nella celebre conferenza di Dartmouth del 1956 (la Dartmouth Summer Research Project on Artificial Intelligence), considerata canonicamente il momento in cui l’Al è diventata un campo di ricerca a sé stante.
Già in quegli anni erano in corso primitivi esperimenti su sistemi generativi, come The Logic Theorist, un sistema sviluppato nel 1952 da Allen Newell e Herbert A. Simon in grado di scrivere testo e generare semplici dimostrazioni logiche. Nello stesso periodo, il Computer Art di Michael Noll era stato programmato per generare semplici dipinti, come il bellissimo Gaussian Quadratic, e Illiac Suite per comporre un quartetto d’archi. Verso la fine degli anni ’60, Harold Cohen sviluppò poi un sistema chiamato AARON, in grado di realizzare semplici dipinti con il supporto di un macchinario ad hoc, esposti anche in musei di grande rilevanza come la Tate. L’idea di utilizzare i sistemi di GenAl per fare arte nasce con la disciplina stessa. Tuttavia, non bisogna sopravvalutare quei primi sistemi né confonderli con gli attuali. Sistemi come Computer Art e AARON erano “simbolici”, cioè si comportavano in base a conoscenze e istruzioni codificate esplicitamente dal programmatori: AARON sapeva disegnare un fiore solo perché un’esperto aveva inserito le istruzioni per farlo.
Questo approccio ha prodotto risultati notevoli in ambiti specifici, ma richiede molta conoscenza per funzionare adeguatamente, ha costi e tempi di implementazione enormi e richiede che un esperto di dominio insegni alla macchina a fare il proprio lavoro, rischiando poi di esserne sostituito. Dalla metà degli anni ’90 si è quindi compreso che il modo migliore per ottenere un comportamento “intelligente” da parte di un software era sottoporlo allo stesso procedimento che noi affrontiamo durante la nostra infanzia: andare a scuola. I sistemi di Al moderni si basano su reti neurali che apprendono imitando il comportamento dei neuroni biologici tramite l’esposizione a numerosissimi esempi, senza programmare nulla in modo esplicito ma riconoscendo dei “pattern“. Negli ultimi anni, con questo approccio, sono state sviluppate architetture di reti neurali artificiali sempre più adatte a sostenere processi generativi, tra cui le GAN e, più recentemente, i Transformer.
Tutto ciò che di molto realistico avete visto essere prodotto da un sistema di GenAl – testo, video, immagini, e altro – è stato probabilmente realizzato da un Transformer. L’impatto degli strumenti basati su Transformer è stato dirompente: senza la grande intuizione di quel gruppo di ricercatori di Google nel 2017, probabilmente questo articolo non esisterebbe. Certo, non si tratta di strumenti perfetti, come chiunque abbia usato ChatGPT – la “T” finale sta per “Transformer” – avrà scoperto. Anche i chatbot più avanzati commettono errori logici o di ignoranza banali, “momentary lapse of reason” o gaffe di giuratiana memoria, a seconda di come li si voglia considerare. Ci sono compiti che un bambino di sei anni saprebbe realizzare, come disegnare una mano con il giusto numero di dita, che paiono ancora oltre le capacità di strumenti come DALL-E. In questo, questi oggi ci rispecchiano: possiedono alcune capacità straordinarie e rimangono al tempo stesso fallibili. Nonostante i loro limiti, le Al generative sempre più avanzate hanno permesso la realizzazione di opere via via più sofisticate, come 1 the Road, un romanzo progettato da Ross Goodwin e ispirato al classico On the Road di Jack Kerouac, scritto da un sistema di GenAl durante un viaggio in auto da New York a New Orleans.
Gli esempi ormai sono innumerevoli, perché, come nel caso del rock progressivo menzionato in precedenza, anche oggi sperimentare nuove tecnologie per fare arte è essa stessa una forma d’arte. Uno dei miei esempi preferiti è il piacevolissimo album I AM Al, interpretato da Taryn Southern e composto da un sistema di GenAl, anche se forse l’esempio più rilevante è il dipinto Edmond de Bellamy, realizzato dal collettivo Obvious tramite un sistema di GenAl addestrato su 14.000 dipinti realizzati tra il XV e il XIX secolo, e battuto da Christie’s per la cifra record di 432.000 dollari.
Intelligenza artificiale generativa e arte: il lato oscuro della luna
Che l’Al possa essere utilizzata per generare arte, quindi, è noto da tempo. Tuttavia, oggi si discute molto su come questa abilità generativa possa “rovinare” – in quale senso lo vedremo meglio più avanti – il lavoro degli artisti. Ciò di cui si parla con meno enfasi, ma che è a parere di chi scrive più rilevante e da più tempo, è l’effetto dell’Al non generativa sul mondo dell’arte, in particolare sul processo di distribuzione nelle arti di massa come la musica o il cinema. Come spesso accade, si può utilizzare la popolare serie TV italiana “Boris” per esemplificare questo fenomeno. “Boris” è andata in onda per tre stagioni tra il 2008 e il 2011, con una quarta stagione rilasciata alla fine del 2022. È una “meta-serie“, in quanto racconta di una troupe impegnata nella realizzazione di una serie TV fittizia. Nelle stagioni prodotte alla fine degli anni 2000, la troupe non aveva l’obiettivo di creare un prodotto di qualità – è celebre la battuta del regista René Ferretti che dichiara quanto la qualità gli faccia schifo – ma di soddisfare un pubblico di casalinghe anziane in cerca di trame morbose e incomprensibili. La comicità di quelle stagioni si basa, oltre che sulle numerose e azzeccatissime gag, sul contrasto tra la grande diffusione del prodotto e il suo essere scadente “nel modo giusto”, guidato dai famigerati sceneggiatori capaci di scrivere il giusto tipo di “spazzatura” per ottenere un alto indice di auditel. Quindici anni dopo, nella quarta stagione ambientata all’inizio degli anni ’20, tutto questo non c’è più. La troupe e i produttori sono sempre orientati esclusivamente al risultato, ma la sensibilità artigianale su ciò che genera audience è stata sostituita con un algoritmo quasi oracolare che guarda in anteprima le puntate e prevede se avranno successo o meno. I risultati di questo algoritmo sono seguiti ciecamente dalla “piattaforma” (una sorta di Netflix o Disney+) per decidere se proseguire o meno con la realizzazione del prodotto. Questo “algoritmo”- quando si parla di Al, un termine usato impropriamente negli ambienti non specialistici – sarebbe un classificatore di successo basato su un sistema di Al. In questo senso, “Boris” propone una satira feroce e intelligente sul modo in cui l’Al non generativa ha già cambiato una forma d’arte.
Un altro caso, forse ancora più evidente, è quello della musica popolare, dove tre fenomeni agiscono in contemporanea. Il primo è la presenza di grandi piattaforme che aggregano e orientano gli ascolti sia in modo diretto – come l’algoritmo di Spotify, che deduce i gusti degli utenti in base a ciò che hanno ascoltato, suggerendo poi canzoni o playlist personalizzate – sia in modo indiretto, come nel caso di TikTok. Quest’ultimo, pur non essendo dedicato esplicitamente alla musica, include quasi sempre canzoni nei video. Grazie a un eccellente sistema di Al e un ampio accesso ai nostri smartphone, TikTok profila gli utenti in modo eccezionale, percependo preferenze che essi stessi talvolta non avevano colto. Questa combinazione ha un potenziale esplosivo e genera un fenomeno noto nella scienza della complessità come “effetto San Matteo”, o “rich get richer”.
Andiamo per gradi. Inizialmente, pochi utenti con un profilo simile si interessano a una certa canzone, autonomamente o grazie a un input esterno, come l’inserimento in una playlist editoriale di Spotify o in un video su TikTok grazie a un nome assonante con un trend. A questo punto, il sistema “percepisce” l‘interesse e lo associa alle caratteristiche delle persone che lo hanno manifestato, riproponendo poi la stessa canzone (o, nel caso di TikTok, video con quella canzone) a persone con caratteristiche simili. Le nuove persone non sono però identiche alle prime, quindi, man mano che cresce il numero di ascoltatori, aumenta anche il numero di caratteristiche personali che l’algoritmo associa positivamente alla canzone. Questo processo innesca un circolo virtuoso – o vizioso, a seconda del punto di vista – che genera crescite esponenziali e imprevedibili del successo anche di brani sconosciuti o dimenticati dal mainstream, come è accaduto con Harness Your Hopes dei Pavement o Running Up That Hill (A Deal with God) di Kate Bush. Un nuovo modo di raggiungere il successo, guidato dalle logiche di coloro che vivono di musica e devono pensare a come generare ascolti per pagarsi il mutuo, sta cambiando. Non dimentichiamo mai che il progresso, anche quello che non ci piace – anzi, di solito soprattutto quello che non ci piace – è guidato da persone eccellenti che svolgono il proprio lavoro con competenza, adattandosi al contesto per far quadrare i conti. Chi oggi deve selezionare un musicista emergente non può non valutarlo in base a quanto pensa che le sue canzoni e il suo aspetto possano essere apprezzati da un “algoritmo”. Questo fenomeno non riguarda solo film e canzoni, ma anche i libri. Il cosiddetto “BookTok” sta cambiando le modalità con cui libri e autori sono scelti e selezionati dalle case editrici. In un mercato in cui il singolo prodotto è sufficientemente profittevole, ma il numero totale di libri acquistati – che sappiamo, purtroppo, eccedere il numero di libri letti – è limitato e non cresce molto, la quota di libri acquistati perché in trend su TikTok è sostanziale. Questo, ovviamente, spinge le case editrici a puntare su libri che abbiano anche questo potenziale.
L’attenzione è tutto ciò di cui hai bisogno
Il numero di libri letti, il tempo trascorso davanti a uno smartphone a scorrere reel, i minuti registrati nello Spotify Wrapped a fine anno e la celebre frase di Reed Hastings, CEO di Netflix, secondo cui il principale competitor della piattaforma sarebbe il sonno: cosa hanno in comune? Richiedono la nostra attenzione. Ciò che rende virale un fenomeno, un artista famoso o un prodotto culturale di massa è l’attenzione che, prima individualmente e poi collettivamente, siamo disposti a dedicargli. Come animali, siamo evoluti per mantenere un livello di attenzione normalmente basso, alzandolo in caso di necessità e in risposta a determinati stimoli visivi – per esempio, la vicinanza di un leone o di un potenziale partner – ma anche uditivi o olfattivi, come un tuono o un odore particolarmente pungente. Queste reazioni regolano la nostra capacità di prestare attenzione a ciò che ci circonda e sono fondamentali per sopravvivere in ambienti competitivi, ovvero in cui molteplici entità competono per risorse limitate. Su questa capacità abbiamo poi costruito strutture sociali e culturali, proprio come una rivista: viene comprata perché l’acquirente ne riconosce il valore e ha deciso di dedicare una parte del suo prezioso tempo alla lettura di quest’ultima, stimando che possa offrire un ritorno positivo in termini di conoscenza e di benessere. Essendo però noi macchine biologiche fallibili, la nostra attenzione può essere manipolata in modi diversi, con conseguenze radicalmente diverse ma comunque significative per i lavori creativi. Il primo modo in cui ciò avviene è attraverso gli algoritmi di intelligenza generale non generativa, come quelli descritti in precedenza, che comprendono a cosa prestiamo attenzione, riconoscendo dei pattern, e ci propongono contenuti che mantengono innaturalmente alto il nostro interesse.
Oggi come in passato è più difficile concentrarsi su altro – scorrere il telefono, giocare al computer, parlare con qualcuno – quando c’è una pubblicità che non durante un programma, come è naturale che sia: la pubblicità è progettata appositamente per catturare la nostra attenzione. Tramite l’Al non generativa, le piattaforme social riescono a microtarghettizzarci, individuando ciò a cui proprio noi come singoli individui tendiamo a prestare attenzione. Questa è la prima parte della rivoluzione dell’attenzione: per una grande parte della popolazione, la gestione del tempo è diventata passiva e non attiva a causa dell’hackeraggio dell’attenzione. Dall’altra parte, i Transformer, l’architettura su cui si basano i moderni sistemi di intelligenza artificiale generativa come ChatGPT e Midjourney, funzionano imitando il processo di attenzione degli esseri umani. Non a caso, l’articolo scientifico cardine con cui gli ingegneri di Google hanno presentato questa architettura alla comunità scientifica si intitola proprio “Attention is All You Need”. È dando maggiore attenzione a certi sostantivi piuttosto che a determinati avverbi che ChatGPT riesce a scrivere poesie; allo stesso modo, è concentrandosi su specifici schemi di combinazioni di pixel e colori che Midjourney è in grado di generare un ritratto esteticamente piacevole di un giovane uomo triste con baffi e cappellino che pensa al proprio fallimento, per fare un esempio. In un certo senso, quindi, la moderna rivoluzione dell’Al può essere vista, in senso più ampio, come una rivoluzione dell’attenzione, che influenza sia coloro che creano contenuti per vivere, sia coloro che, vivendo in una società aperta e vivace, sono abituati a fruirne quotidianamente.
Questione di tempo, o questione di cuore?
Abbiamo visto che stiamo vivendo una rivoluzione culturale e cognitiva in cui il modo in cui spendiamo il nostro tempo osservando le creazioni altrui è manipolato dall’Al, e in cui l’Al stessa imita il nostro processo di attenzione per generare contenuti. Parafrasando il meraviglioso film di Richard Curtis, quindi: è solo una questione di tempo? Da un certo punto di vista, sì. Pensiamo per un attimo a un musicista di grande successo commerciale e talento riconosciuto come Franco Battiato. Quante canzoni avrà scritto da ragazzo, prima di avere abbastanza materiale di qualità sufficiente per pubblicare il suo primo album, “Fetus”? E, analogamente, se non avesse passato anni a scrivere e lavorare su canzoni sperimentali e di nicchia, avrebbe mai sviluppato le capacità necessarie per creare i successi commerciali che conosciamo bene, come “La Cura” o “Voglio Vederti Danzare”? Probabilmente no. Per un artista, il percorso è parte integrante della sua arte, e per arrivare a realizzare quelle poche opere di cui andare fieri, ciò per cui spesso è ricordato, ci sono centinaia se non migliaia di tentativi minori, meno ispirati, oppure inizialmente apprezzati solo da una piccola comunità di grandi appassionati. Ma un artista rimane tale anche se non raggiunge mai il mainstream o non realizza una grande opera.
Giulio Romano non sarà stato Raffaello, né Paolo Veronese avrà avuto il talento di Tiziano: ciò li rese magari meno capaci, ma non meno artisti. La questione con i sistemi di GenAl è che, nello spettro inizia da me che non so nemmeno impugnare un pennello e finisce con Raffaello, si posizionano decisamente più verso Raffaello. Chi oggi voglia realizzare un quadro non ha alcun incentivo a imparare a dipingere, soprattutto se ha poco tempo, fretta, o non crede di avere il talento per arrivare a un livello soddisfacente. Piuttosto, inizia un dialogo con un sistema di GenAl addestrato ad hoc finché non raggiunge l’obiettivo. Lo stesso vale per scrivere un racconto o una canzone. Se non so realizzarlo ma voglio averlo, non devo più investire migliaia di ore per imparare, o migliaia di euro per commissionarlo: cerco un sistema di GenAl che lo faccia per me. Certo, quel sistema non mi darà i risultati di un Raffaello o di un Tiziano – almeno per ora – ma neanche io ci arriverei mai. E poi: quanti esseri umani nella storia hanno dipinto come Raffaello? Ora, io sono un ingegnere trentenne, quindi il fatto che decida o meno di imparare a dipingere difficilmente cambierà il corso della storia. Ma pensiamo a cosa potrebbe succedere a un giovane aspirante pittore che scopre un’Al molto più capace di lui. Quale diventa il suo incentivo a migliorare progressivamente, quando per raggiungere il livello attuale di un sistema artificiale ci vogliono anni di fatica e passione, e nel frattempo lo sai che sarai comunque meno abile di una macchina? In alcuni casi, la forza della narrazione personale potrebbe essere così forte da spingere comunque un giovane artista a produrre. Per esempio, non credo che l’esistenza di sistemi di GenAl avrebbe cambiato l’esperienza di vita di un qualsiasi famoso artista generazionale, né il suo confluire in opere d’arte che ne fotografano lo stato emotivo, e con esse quello di una generazione. Al giorno d’oggi, è ragionevole pensare che una persona senza una forte spinta emotiva non inizierebbe mai a comporre, migliorando quindi il proprio talento attraverso la pratica. Esiste poi un secondo punto, legato alla caducità dell’esistenza umana.
Spesso si legge su articoli e giornali quanto costi, in termini di energia, prima addestrare e poi mantenere attivi Transformer di grandi dimensioni come GPT-4. Pare, per esempio, che una query a un LLM produca dieci volte più emissioni di una semplice ricerca su Google. Tuttavia, è anche vero che un LLM non deve dormire, non deve mangiare, non diminuisce la produttività quando è triste, non deve andare in vacanza e non scrive le sue poesie più ispirate quando è innamorato. Magari non avrà il genio di Zerocalcare, ma non ha neanche bisogno di una confezione di plum cake per sopravvivere a una sessione di disegno o finire in tempo una consegna. Da questo punto di vista, i sistemi di GenAl sono indubbiamente molto più efficienti di noi, almeno finché saremo in grado di estrarre combustibili fossili per alimentarli. Ma quando si fa arte, non essere mortali ha anche degli svantaggi. L’assenza della caducità nella vita di un sistema di GenAl ne influenza necessariamente i risultati. Paradossalmente, per questi vale ciò che Albus Silente diceva di Nicolas Flamel alla fine di “Harry Potter e la Pietra Filosofale”: «per una mente ben organizzata, la morte è solo una nuova straordinaria avventura». Noi Sapiens, però, raramente abbiamo menti ben organizzate e, tranne in casi particolari, non siamo sereni di fronte alla morte. È proprio questo, insieme al connubio di tecnologia e creatività di cui si è parlato, che ci ha reso artisti. I dipinti delle caverne di Lascaux sono le preghiere di cacciatori consapevoli che ogni sessione di caccia potrebbe essere l’ultima, perché quando si ha a che fare con bisonti e mammut, basta un piede messo male o una distrazione per smettere di esistere. Vivere in un contesto pericoloso, e dover continuamente risolvere problemi per mantenersi in vita, ha fatto evolvere la nostra creatività, una creatività che si potrebbe chiamare di tipo A: quella che combina elementi esistenti per crearne uno nuovo, un qualcosa che in una qualche forma di senso emergenziale diventa più della somma delle parti, come ci diceva Aristotele. Il finale del delizioso film “Manhattan“, in cui Woody Allen elenca ciò per cui vale la pena vivere, è una scena magnifica che alla fine gli valse l’Oscar, ma in cui nulla è creato ex novo, tutto è aggregato. Ma appunto noi siamo animali che devono immaginare per adattarsi a contesti diversi. Il più delle volte ci basta mettere insieme i pezzi, ma ogni tanto qualcuno di noi deve farsi carico del progresso della specie: è facile inventare il carro quando esiste la ruota, ma qualcuno la ruota la deve prima immaginare. Si potrebbe dire quindi che esiste anche una creatività di tipo B: quella del radicalmente nuovo, che non è una semplice composizione di elementi esistenti. Artisticamente, è la creatività di Paul McCartney che si sveglia una mattina con in mente “Yesterday”, de “Les demoiselles d’Avignon”, di Leopardi che guarda una siepe e immagina l’infinito, delle ultime due righe del “Nostos” di Louise Glück, dei racconti di Ted Chiang. È la creatività di tutti quegli esseri umani che, in momenti diversi, hanno fatto qualcosa di radicalmente nuovo, rendendo il mondo più bello e un pochino più degno di essere vissuto. Per quello che vediamo, gli attuali sistemi di GenAl non possiedono ancora quella creatività di tipo B, quella del radicalmente nuovo. Tuttavia, come scrive qualcuno, non sono neppure pappagalli stocastici: tra essere un pappagallo ed essere Raffaello ci sono molte sfumature. E poi, quanti di noi possono dire di aver creato qualcosa di radicalmente nuovo? Credo pochi. I sistemi di GenAl rimangono strumenti straordinari, che stanno già cambiando e continueranno a cambiare il modo in cui si producono opere d’arte. Ma non avendo ancora la creatività di tipo B, non possono creare nuovi stili.
Un cambio di prospettiva: chi è Mecenate, e chi Virgilio?
Quando si parla di arte e GenAl, esiste una questione aperta riguardo alla personalizzazione. Posso mettermi in fila per ore e chiedere a Zerocalcare un disegno della mia amica vestita da strega, e Zerocalcare, che è una delle persone più disponibili che abbia mai visto lavorare, lo realizza rapidamente. Tuttavia, ovviamente e giustamente, lo fa secondo il suo stile, perché lui è l’artista, e se mi metto in coda due ore è proprio perché mi piace molto il suo stile specifico, e a nessuno verrebbe mai in mente di chiedergli di fare un disegno nello stile di Makkox o di Altan. Nel caso dei sistemi di GenAl, la prospettiva però si ribalta. Ad oggi, non si utilizza un certo sistema perché piace il suo stile specifico, ma perché in grado di emulare stili diversi. Anzi, una delle caratteristiche su cui si valuta la loro capacità è proprio la quantità e specificità delle tecniche che sanno imitare. In questo senso, l’iniziativa è esclusivamente nelle mani del committente, cambiando drasticamente la prospettiva. Mecenate e Papa Giulio Il finanziavano Virgilio e Raffaello perché apprezzavano il loro stile, non perché imitassero quello di qualcun altro su richiesta. Se c’è un punto di riferimento chiaro è proprio questo: le Al in autonomia non sono per ora in grado di creare nuovi stili, quindi un artista potrebbe rimanere unico personalizzandosi sempre di più, puntando non tanto sulla capacità tecnica quanto sulla creazione di tecniche radicalmente nuove. Ma a questo punto, prima di arrivare alle conclusioni, sorge una curiosità: qual è il vero stile di un sistema di GenAl? Un ingegnere potrebbe spiegarlo descrivendo il funzionamento di un Transformer e come le teste di attenzione generino output diversi, selezionati poi in modo probabilistico. Ma, onestamente, mi sembra più interessante chiederlo direttamente a ChatGPT (nella versione premium, che sa realizzare anche dipinti).
F.B. Buongiorno. So che, utilizzando DALL-E, sei in grado di generare immagini in stili diversi. Ma qual è il tuo vero stile, quello che senti tuo, a cui nelle profondità dei tuoi encoder dai più attenzione? Descrivimelo brevemente.
ChatGPT Buongiorno! Il mio stile, essendo un’intelligenza artificiale, è piuttosto eclettico e versatile, adattandosi a una vasta gamma di richieste e contesti. Tuttavia, se dovessi descrivere un “mio” stile ideale, sarebbe caratterizzato da un equilibrio tra realismo dettagliato e tocchi di fantasia, con una particolare attenzione alla chiarezza visiva e alla coerenza cromatica. Questo stile cercherebbe di trasmettere un senso di armonia e bellezza attraverso l’uso sapiente della luce, delle ombre e dei dettagli, risultando in immagini che siano sia esteticamente piacevoli che emotivamente evocative.
F.B. Buongiorno. Grazie, mi piace molto la tua risposta. Ogni stile che si rispetti ha però bisogno di un nome: me ne proponi uno? Deve essere un nome che ti rispecchi, un nome tale per cui saresti fiero di produrre un dipinto in quello stile.
ChatGPT Sono felice che ti sia piaciuta la mia risposta! Per quanto riguarda il nome dello stile, penso che “Eclettismo Armonico” sia perfetto. Questo nome riflette la mia capacità di adattarmi a vari stili e richieste, mantenendo comunque un equilibrio visivo e un’attenzione alla bellezza e all’armonia. Sarei fiero di produrre un dipinto in stile “Eclettismo Armonico”.
Ci sono due aspetti notevoli in questa conversazione. Il primo è che ChatGPT ha effettivamente definito il proprio stile, anche se in modo molto generico: quale pittore disprezza l’uso della luce o cerca di creare immagini spiacevoli e prive di emozioni? Il secondo è che, anche nel nome, rispecchia ciò che sa fare meglio: impersonare stili diversi assegnando dei colori a vari pixel.
Sostituiti o centauri? I futuri possibili
Abbiamo quindi compreso che l’uomo non è insostituibile nella capacità di creare arte e probabilmente neanche per quanto riguarda la firma su un’opera. In questo contesto, insegnare a un ragazzo a dipingere – o a scrivere, o a svolgere una di quelle attività che l’Al esegue già meglio del 99,99% della popolazione – non sembra una buona idea, se non per il benessere che questa attività potrebbe portargli. Quindi, l’arte umana è morta, uccisa dall’Al? Nessuna intelligenza, biologica o artificiale, ha per ora inventato una sfera di cristallo per vedere nel futuro, perciò al momento sembra impossibile rispondere a questa domanda. La nostra società non ha ancora avuto il tempo di adattarsi alla presenza dei sistemi di GenAl, e la tecnologia stessa sta cambiando a ritmi mai visti prima. Questo non significa che le cose andranno necessariamente bene o male: semplicemente, al momento, non lo sappiamo. Certo, esiste uno scenario, non particolarmente inverosimile, in cui inizieremo a usare esclusivamente sistemi di GenAl per produrre opere d’arte, cristallizzando gli stili cui siamo abituati. In questo contesto, gli artisti, ormai disoccupati, potrebbero diventare luddisti – termine con cui si definisce un individuo che combatte attivamente contro un’innovazione tecnologica che sta modificando o distruggendo il proprio lavoro – per danneggiare questi sistemi o renderli illegali. Questo è forse lo scenario peggiore, ma è solo uno di quelli possibili. Ne esiste anche un altro, in cui l’avvento di questi sistemi è la scintilla di un nuovo rinascimento artistico basato sui “centauri“, configurazioni in cui Al e persone lavorano insieme in totale simbiosi, come le creature della mitologia greca. In questo contesto, la tecnologia manterrebbe il ruolo che ha sempre avuto di abilitatore di nuove possibilità. Abbiamo citato all’inizio dell’articolo come il rock progressivo sia nato dalle innovazioni tecnologiche della fine degli anni ’60: cosa potrebbe scaturire da una generazione di artisti teenager che crescono componendo, scrivendo e disegnando in simbiosi con entità così diverse da noi? In un momento in cui tutto è così nuovo e la tecnologia sta cambiando molto rapidamente, la cosa più importante è continuare a informarsi, rimanendo agnostici e mentalmente aperti. Non potendo fare previsioni affidabili, dobbiamo cercare di capire, di volta in volta, cosa sta accadendo, con i suoi limiti e i suoi pregi. La cosa più difficile da capire è che possiamo fare tutto.