MUSICA E IA: Il caso Otaku Boy


Ultimamente, grazie all'attenzione dedicata loro dai mass media, le AI (o Intelligenze Artificiali, IA, in italiano) sono finalmente diventate un fenomeno di interesse pop.

Va però detto che l'uso dei processi di machine learning non è una novità in ambito audio.

I corsi di musica elettronica in conservatorio, ormai da diversi anni, spesso ospitano esami come “composizione assistita dal calcolatore”.

Le software house che realizzano prodotti per i professionisti del settore stanno puntando sempre più sul supporto al processo tecnico e creativo dell'utente tramite machine learning. L'esempio più lampante di questo fenomeno è probabilmente Izotope, con i suoi plugin apprezzati soprattutto nell'ambito del restauro audio (RX) e del master (Ozone).

E di recente il fascino per le IA ha catturato anche l'attenzione dei produttori di hardware con esempi come Neurorack, una rack unity basata sull'utilizzo dell'intelligenza artificiale realizzata nientemeno che all'IRCAM di Parigi.

In ambito pop, esistono poi diverse canzoni realizzate con il supporto di IA (e poi suonate da un musicista umano). Tra gli esempi più noti di tale approccio abbiamo Daddy's Car, realizzata da Benoît Carré in collaborazione con i Sony Csl Research Laboratory (2016).

O l'album I AM AI di Taryn Southern (2018). E, se ve lo steste chiedendo, sì: è la stessa Taryn Southern che cantava Wrong Hole e Wrong Hole (The Untold Story).

Probabilmente dedicheremo degli articoli più approfonditi a tutti questi argomenti nei prossimi numeri, ma per oggi vorrei concentrarmi sull'analisi del processo creativo dietro a Otaku Boy di S3RL, visto che il brano è uscito in contemporanea a un video dove l'artista spiega per filo e processo il processo creativo dietro a questa specifica produzione (novembre 2021).

S3RL è un artista abbastanza difficile da descrivere. Il suo stile richiama a ritmi e sonorità d'impostazione Hardcore techno, mantenendosi però molto vicino all'approccio “sperimentale” dell'hyperpop, facendo abbondante uso di sample chiptune e confezionando il tutto in un'estetica che attinge a piene mani dalla internet culture e dalla cultura otaku.

Per prima cosa S3RL ha dato il proprio catalogo (circa 250 brani) in pasto a Jukebox, una IA dedicata alle generazione di tracce audio, così da ricavarne un insieme di “spezzoni” musicali coerenti con il proprio stile. I materiali così ottenuti sono stati poi riorganizzati da S3RL stesso, per creare una struttura musicale di senso compiuto.

Il risultato è stato poi processato per migliorarne la qualità. Nel video si parlava di un plugin di futura uscita, un certo S3RL Enhanced, pensato per replicare su nuove tracce il mix e il master dei brani di S3RL.

Non è dato se questa parte sia veritiera, o se si tratti semplicemente di un troll (ottenere un risultato simile sarebbe probabilmente possibile, tramite una serie di tool come match EQ e compressori basati sul machine learning, ma ad oggi non ci sono stati update sull'uscita di tale plugin).

Di certo, è chiaro che siano stati applicati al pezzo dei processi di master, per elevarne la qualità musicale.

Nella base così generata erano presenti anche dei vocalizzi privi di testo. Per generare il testo vero e proprio l'artista ha quindi utilizzato un'altra IA, che ha portato a un risultato ancora una volta basato sull'analisi di suoi precedenti lavori.

La parte vocale è stata poi affidata a Vocaloid, sintetizzatore vocale il cui utilizzo è prassi abbastanza comune e (timbricamente caratteristica) di questo tipo di produzioni.

E, per chiuderla in bellezza, anche il videoclip finale del brano è stato creato utilizzando una IA.