Resoconto semiserio della nascita di un cortometraggio in AI

Giazz, ovvero la computazione dei comportamenti intelligenti

Giazz è il titolo di un cortometraggio che ho realizzato con l’utilizzo di strumenti di intelligenza artificiale generativa text to image, image to video e text to video: ogni sequenza ha richiesto diversi passaggi e, in montaggio, ha richiesto un ulteriore e inaspettato lavoro di post-produzione. Quello che segue è il resoconto del difficile rapporto tra il prompter e la sua macchina intelligente ma non troppo.

Prima di addentrarci incautamente nelle ambiguità di un dibattito vago sulle derive delle intelligenze artificiali, è necessario togliere ogni dubbio sulla natura delle stesse: eliminate dalla vostra testa ogni riferimento alle riflessioni sociali di Asimov, scordatevi le meta-rappresentazioni di Clarke perché, sebbene in rapidissima evoluzione, ci vorrà tempo prima che queste macchine si possano rivolgere a noi con l’ipocrisia, tutta umana, di Hal 9000. Creare “sistemi artificiali capaci di prestazioni paragonabili a quelle delle bio-intelligenze, partendo dalla conoscenza dell’architettura e dei principi che governano il funzionamento del sistema nervoso” richiederà tempo, denaro e soprattutto una grande idea. Tre cose di cui solitamente l’essere umano fa cattivo uso.
La definizione di macchina intelligente, quindi, può essere fuorviante perché ciò che fanno non è requisito di intelligenza ma la “simulazione” di un comportamento intelligente. E c’è una grossa differenza tra essere intelligente e porre in essere un comportamento intelligente: intelligente è un replicante che, al largo dei bastioni di Orione, ha visto cose che noi umani non possiamo immaginare ma, a confronto, le macchine di oggi sono poco più che la risposta ghiandolare di una manciata di cani nella Russia di fine Ottocento al tintinnio di una campanella. O, più correttamente, una (strabiliante, costosissima e ad alto impatto ambientale) calcolatrice approssimativa che, alla domanda quanto fa 3 x 2, potrebbe rispondere 5,3 oppure circa 6 o con una matrice lineare.

Andrea Campo, Giazz, 2024

In alcuni casi risponde giraffa. Ma le allucinazioni (errori della macchina) sono da tenere in considerazione. Così come le istruzioni per l’uso, che per gli strumenti di intelligenza artificiale sono brevissimi video a velocità doppia, esplicativi come una lunga sequenza di scimmie impazzite attorno a un monolite.

A differenza della sveglia, però, è proprio l’utilizzo della macchina che permette di fornire prompt sempre migliori: il paradigma è invertito, l’uso precede l’istruzione per, macchina e uomo si formano vicendevolmente attraverso la pratica e, seppur impossibile il pieno controllo sulla risposta dello strumento, l’addestramento diventa attributo della produzione: la tua produzione. Nel cortometraggio, le aberrazioni della macchina sono state accentuate creando personaggi dismorfici e distorsioni prospettiche o temporali che richiamano la storia narrata e la corruzione morale dei personaggi e dell’ambiente in genere. Ovviamente si tratta di un’eccezione in cui, per necessità, si fa di forma sostanza. E non può essere questo l’uso di macchine progettate per sostituire troupe e cast nonché intere categorie di artisti di ogni settore.

La macchina (perlomeno quella da me utilizzata) produce video di quattro secondi, oltre i quali (NB è possibile aggiungere altri 4 secondi in continuità con la prima sequenza, fino a un massimo di 12 alla data della produzione del cortometraggio) aumenta significativamente la possibilità di allucinazioni: oltre il 30% del materiale video prodotto è stato scartato ma in questo caso ho pagato la scelta di addestrare la macchina con immagini troppo “jazz” e soprattutto di lavorare prevalentemente con immagini (image to video) e non con testi (text to video, che offre risultati sorprendenti). È possibile anche lavorare sull’animazione di singole porzioni dell’immagine e anche in questo caso l’accuratezza dei dettagli stupisce: nonostante l’apparente puntualità, è chiaro che la macchina soffre i dettagli, la luce e i movimenti: per questo non sempre risponde correttamente ai prompt (posta l’ambiguità della lingua) restituendo qualcosa che si avvicina più a Il Tagliaerbe che ad Akira.

Andrea Campo, Giazz, 2024

Ad oggi, l’intelligenza artificiale pare ancora uno strumento per chi non ha mestiere e mezzi ma tante, tantissime, buone idee. Qui finiscono i difetti.

Perché la macchina in fondo un po’ mostro lo è. Nella declinazione latina del termine. Un prodigio della tecnologia che offre innumerevoli opportunità e strumenti (green screen, lip sync, deepth field, et cetera) sia nella creazione di prodotti visivi, sia nella creazione di audio e i suoi possibili usi. E richiede un uomo orchestra che, non solo sa suonare tutti gli strumenti che indossa ma, sa anche spiegare al suo cervello quando mandare gli impulsi al suo corpo affinché gli strumenti suonino al momento giusto e la giusta melodia. La macchina è il nostro cervello fuori di noi. Ma non ha la nostra capacità linguistica e saremo noi a dovergli insegnare come capirci. E se non sempre a buoni insegnamenti corrispondono buoni comportamenti, alla lunga la pratica paga. Snervante, dispendiosa, faticosa e spesso sincopata pratica ma con un indiscutibile vantaggio: ci si diverte da matti.

Andrea Campo
Torna in alto