Quantcast
DNA

Si può davvero ricostruire un volto dal DNA?

Una ricerca recente ha combinato DNA, scansioni facciali e machine learning, ma ha già ricevuto parecchie critiche.

Alessandro Tavecchio

Alessandro Tavecchio

Immagine via PNAS

Da sempre il sogno bagnato delle agenzie di sicurezza nazionali e internazionali, la ricostruzione del volto di una persona partendo dal suo DNA è una di quelle idee fascinose che saltano fuori spesso nella fantascienza, con comprensibili sottotoni distopici.

Una recente pubblicazione dello Human Longevity Institute di Craig Venter — il miliardario imprenditore biotech famoso per le sue ricerche al limite dell'incredibile — sostiene che, grazie ad una combinazione di nuovi metodi bioinformatici e intelligenza artificiale, il futuro è già qui.

I ricercatori hanno utilizzato una scansione tridimensionale ad alta risoluzione dei volti di più di mille persone di diverse età, generi ed etnia, di cui hanno anche sequenziato il genoma completo. Combinando DNA e scansioni facciali, il team ha utilizzato un sistema basato su machine learning per associare differenze di una singola base nella sequenza dei geni ( SNPs) a particolari caratteristiche facciali, come l'altezza degli zigomi. Una volta addestrato il sistema su questa enorme base di dati, l'intelligenza artificiale è diventata in grado di riconoscere correttamente un individuo dai dati estratti dal suo genoma nel 74 percento dei casi.

La pubblicazione ha comprensibilmente suscitato immediatamente interesse, ma anche molte critiche, sia da parte di genetisti che da parte di informatici. Quanto immediatamente, chiedete? L'articolo del team dello Human Longevity Institute è stato pubblicato alle tre del pomeriggio, mentre il primo articolo che lo confutava è stato pubblicato in preprint su Biorxiv alle sette di sera.

L'intelligenza artificiale sembra più che altro utilizzare una generica approssimazione di connotati per l'etnia e il genere considerato, più che quelli di una specifica persona.

La critica principale al lavoro del team di Venter riguarda il meccanismo con cui avviene il "riconoscimento". Il database dell'HLI contiene poco più di mille individui e l'intelligenza artificiale in pratica, cerca di riconoscere il "bersaglio" tra 10 scelti a caso tra di essi. Ma viste le dimensioni ridotte del database, oltre al fatto che la comparazione avviene tra 10 individui alla volta, è molto facile per il computer individuare la persona giusta solo grazie a variabili demografiche come età o sesso, senza bisogno di scavare nel genoma per cercare di capire quanto sono distanziate le sopracciglia del soggetto.

In un piccolo studio di risposta, il genetista Yaniv Erlich del New York Genome Center — nonché consigliere scientifico capo di MyHeritage, una start-up genealogica che fa concorrenza a Venter — ha mostrato che, ignorando il DNA e utilizzando solo età, sesso e etnicità, il sistema era in grado di riconoscere il bersaglio nel 75 percento dei casi, contro il 74 percento del metodo "genetico."

Un'altra pesante critica riguarda la ricostruzione dei volti: nonostante la montagna di dati raccolti su zigomi e strutture facciali, l'intelligenza artificiale sembra più che altro utilizzare una generica approssimazione di connotati per l'etnia e il genere considerato, più che quelli di una specifica persona.

A dimostrazione della validità del metodo, Craig Venter ha postato la ricostruzione software del suo volto basato sul suo DNA, anche se Erlich fa notare che è talmente generica che potrebbe essere benissimo la faccia digitalizzata di Bradley Cooper.

La genericità è ancora più evidente quando si va a confrontare previsioni di volti differenti:

A sinistra la scansione 3D del volto, a destra e al centro la ricostruzione dell'intelligenza artificiale. Immagine via

Anche la pubblicazione stessa dell'articolo ha avuto una storia travagliata. Uno dei più fermi critici dello studio, Jason Piper, è uno degli autori della ricerca che ha lasciato l'HLI durante il processo di pubblicazione dello studio (Secondo Piper, dei 29 autori del paper, solo 13 sono ancora all'HLI). L'accusa è che la ricerca sia stata pensata per spaventare il pubblico e rendere più difficile la condivisione di database pubblici di dati genetici, per rendere più appetibili i database privati come quelli che Venter già possiede.

Piper fa inoltre notare come la pubblicazione sia stata rifiutata in prima battuta da Science e Nature, e sia finita su PNAS tramite processo diretto — ovvero il meccanismo eterodosso tramite cui la rivista permette agli autori di scegliere chi saranno i suoi revisori.

Il team dell'HLI ha già annunciato di star lavorando ad una replica e, per ora, si limita a dire che le supposte debolezze dello studio sono dovute solo al campione limitato ma che la metodologia è del tutto funzionale. Venter, nel frattempo, ha continuato a sottolineare che, debolezze o meno dello studio, questo dovrebbe essere un segnale d'allarme, e che l'anonimato per i donatori di DNA è solo una "falsa promessa."

"Presto saremo in grado di prevedere personalità dal genoma," incalza Venter, sostenendo che potremmo trovarci all'alba "della pubblicità profilata sul genoma."

Per certi versi, le critiche alla specifica pubblicazione dell'HLI sono un microcosmo più generale sulla possibilità di ricostruire un volto dal DNA. La maggior parte degli esperti concorda che — almeno in linea teorica — il processo sia possibile, specialmente se si parte da un genoma completo. Quanto sia realistico eseguirlo in pratica, però, è tutto da vedere; i più scettici sostengono infatti che alcuni tratti complessi che dipendono dallo sviluppo embrionale non saranno mai prevedibili solo dal DNA — lasciandoci previsioni facciali molto generiche.

Anche per questo motivo, concentrarsi su avveniristiche ricostruzioni di volti umani potrebbe essere una distrazione da problemi di privacy più immediati, come la ri-identificazione degli individui partendo da database genealogici "ricreativi" come 23andMe.