FYI.

This story is over 5 years old.

Tecnologia

Ascolta la prima canzone composta dall'intelligenza artificiale di Google

Non ti piace? Ripensaci.
via Google Deepdream

Ok, ormai, è una storia vecchia: molti lavoratori verranno rimpiazzati dai robot. Quando giungerà quel momento così vicino, qualcuno di loro si pentirà di non essersi dedicato ad attività difficilmente riproducibili dalle macchine, come fare l'artista—un lavoro notoriamente remunerativo. Ma niente paura: in un certo modo, Google vuole vendicare gli operai che resteranno a casa, da un po' di tempo a questa parte, infatti, il Google Brain Team sta elaborando degli algoritmi per rimpiazzare anche i privilegiati che svolgono lavori intellettuali.

Pubblicità

Tramite la piattaforma open source TensorFlow, il team studia le reti neurali per il deep learning, ovvero la reincarnazione moderna delle reti neurali cercando di applicarle nei più svariati campi. Dalle traduzioni simultanee, a tool per rispondere automaticamente alle mail, fino appunto ad applicazioni più artistiche come Deep Dream o Google Poetics.

In mezzo a questa serie di progetti, i musicisti, forse, avranno pensato di poter dormire sonni tranquilli—ammesso che non rientrino nella categoria degli strumentisti, le cui possibilità di ingaggio sono già diminuite drasticamente da decenni con l'avvento della musica elettronica. Eppure, esiste un ambito delle attività musicali che si è sempre creduto potesse conservarsi saldamente nelle mani degli esseri umani: la composizione di brani musicali. Il classico compito che richiede troppe competenze per essere replicato in maniera asettica ma sopratutto noiosa.

Ma ecco che, a cambiare le carte in tavola, arriva la presentazione del progetto Magenta durante l'ultimo MoogFest. La dimostrazione live non è delle più incoraggianti tanto che viene persino interrotta in seduta stante con un po' di imbarazzo.

La dimostrazione poco convincente di Magenta al MoogFest.

Molto più interessante da analizzare è una melodia di pianoforte della durata di 90 secondi creata attraverso una rete neurale a partire da un input umano di quattro note diffusa negli stessi giorni dai tipi di Google.

Pubblicità

Eccola in tutto il suo splendore.

Piuttosto scialbo non c'è che dire. Ma chi sono io per giudicare il parto di una rete neurale?

Tuttavia, passando sopra al sound infernale General MIDI—una scelta quasi obbligata quando si intende presentare una melodia nella maniera più neutrale possibile—si scopre che, nella composizione, sono riscontrabili elementi compositivi di alto livello—in una scala gerarchica in cui la scelta delle singole note rappresenta il livello più basso.

L'obiettivo dei tipi di Google, non è la semplice generazione di melodie, per questo esistono algoritmi che svolgono il loro dovere già da tempo, i quali, tuttavia, hanno il difetto di produrre musiche che funzionano solo sul breve termine. Piuttosto, il progetto Magenta mira ad emulare le capacità di composizione delle strutture a lungo termine dei brani, anche questa feature è già stata emulata dalle macchine, ma passando attraverso degli algoritmi pre-impostati da esseri umani.

Per cui, riconsiderando il brano sotto questo punto di vista, in cosa consiste il lavoro svolto della rete neurale di Magenta? Partendo dalle quattro note fornite in input, ha generato una melodia e delle variazioni secondo uno schema che si può identificare come:

A - A - A'- B - A

Il brano in quattro quarti in Si maggiore, parte con una melodia principale della durata di otto battute costruita sui gradi I-V-IV-V. Il motivo viene ripetuto inizialmente due volte—per favorirne la fruizione, durante la seconda ripetizione della melodia, qualcuno di Google hanno aggiunto una traccia di batteria, credo proprio che un giorno lo stesso algoritmo adotterà automaticamente soluzioni simili. Intorno al secondo 32, giungiamo ad una variazione sulla melodia—anch'essa della durata di otto battute—che ho identificato come A', nella quale vengono introdotte più note e viene modificato anche il sostegno armonico. Intorno al 48 secondo viene presentata la seconda variazione che ho indicato come B—sempre per otto battute—questa perde ogni riferimento alla fonte originaria, andando a parare da un'altra parte, pur restando nella tonalità di riferimento. Infine, intorno al 64 secondo la ormai familiare melodia A viene presentata un'ultima volta.

Pubblicità

Questo modo di sviluppare i brani, mi ricorda un artificio retorico molto comuni nelle canzoni popular, dai brani di Tin Pan Alley ai Beatles, basato sul Chorus e sul Bridge—qui trovate un'analisi ad opera di Franco Fabbri, uno studioso e musicista ben noto anche ai nostri colleghi di Noisey.

In sostanza la chiave è questa: presentare la melodia principale all'inizio ripetendola più volte per imprimerla nella memoria dell'ascoltatore, sottraendola poi progressivamente alle sue orecchie per poi ripresentarla alla fine, per soddisfare la tensione che si è creata grazie a delle variazioni.

Anche il brano creato da Magenta funziona in questo modo: la—ehm—irresistibile melodia principale viene presentata due volte, così abbiamo modo di impararla, dopodiché arrivano delle variazioni che ci portano sempre più lontano ad essa, per poi risolvere questa tensione tornando in qualche modo a "casa" con l'ultima ripetizione della melodia, una sola per non stufarci troppo e sopratutto per non toglierci la volta di ascoltare e ri-ascoltare—ehm—centinaia di volte il brano.

Uno dei primi fantastici remix del primo brano composto da Magenta diffusi su YouTube.

Esistono ovviamente anche altri metodi di strutturare i brani—da quelli in cui si ripete ciclicamente lo stesso modulo, fino a quello in cui si cerca di raggiungere un climax final, partendo dalle strofe per poi esplodere successivamente nel ritornello, la melodia che deve restare impressa nella memoria. Ma come spiegato nella pagina dedicata al progetto, Magenta esplorerà varie tecniche, utilizzando le capacità di comprendere un contenuto già sfruttate in applicazioni come il riconoscimento vocale e visuale oppure nei traduttori automatici,il tutto per ottenere come output che abbiano un proprio valore artistico.

Pubblicità

Ma come si svolgerà il lavoro? La chiave è la costituzione di una comunità di artisti, programmatori e ricercatori che intendono sperimentare con il machine learning. I suoi membri saranno presto messi nella posizione di adoperare strumenti di facile utilizzo per produrre audio ma anche video, i quali sfrutteranno formati come il MIDI, connettendo gli artisti con i modelli di apprendimento automatico e consentendogli di produrre quello che desiderano.

Una volta che saranno sviluppati un'insieme stabile di strumenti e modelli, i collaboratori esterni saranno invitati ad esaminare il codice per porsi domande interessanti: come rendere questi modelli autenticamente generativi? Come sfruttare le risorse costituite dai feedback degli utenti? Come riprodurre i meccanismi per tenere desta l'attenzione oppure garantire l'effetto a sorpresa all'interno di un'opera?

Un'altra eccezionale interpretazione del primo brano composto da Magenta.

Il Google Brain Team è deciso a lanciarsi nell'emulazione delle capacità di storytelling, ovvero la possibilità di sviluppare un arco narrativo a lungo termine. Questa capacità non si rivelano essenziali solo nella produzione artistica, ma anche in ambiti che hanno applicazioni ancora più vaste come il Modeling Language—in cui allo stato attuale risulta difficoltoso trasmettere dei significati persino attraverso un semplice paragrafo, figurarsi lungo un interno racconto.

In fin dei conti, cosa ritenete peggio? Un robot che impara ad ucciderci o un bot che produce nel peggiore dei casi brani brutti o inutili? Quanto tempo dovremmo attendere per lanciarci in languidi duetti con le nostre IA di fiducia che parlano con la voce di Scarlett Johansson come nel film Her? Se volete scoprirlo, non vi resta che seguire il progetto Magenta contribuendo anche attivamente—la versione alfa del codice è disponibile qui—attraverso il GitHub dedicato e il gruppo di discussione.

Nel frattempo godiamoci i primi remix diffusi in rete.

Seguici sulla nostra nuova pagina!