Quantcast
Twitter

Come Twitter prevede i danni dei disastri naturali

Un gruppo di ricercatori ha analizzato l'attività su Twitter dopo l'Uragano Sandy e ha scoperto come sfruttare i dati per gestire le emergenze.

Federico Nejrotti

Federico Nejrotti

via PBS Newshour

Ora sfrutterò un cliché trito e ritrito. L'11 settembre 2001 io ero bello spaparanzato sul mio divano, e stavo guardando la Melevisione, quando di punto in bianco il mio pomeriggio assieme a Tonio Cartonio è stato interrotto da un'edizione straordinaria del TG 3. Avevo 6 anni, e la prima emozione che associo all'attentato delle Torri Gemelle è la rabbia furiosa che ho provato: tutti i cazzo di canali erano monopolizzati da telegiornali, e io volevo vedere i benedetti cartoni animati.

La buona notizia è che ora la Melevisione la posso guardare in streaming quando mi pare, quella cattiva è che la monopolizzazione mediatica ora passa anche per i social network.

Il consumarsi di un evento rilevante si accompagna ad un picco di attività su tutti i social network—Lo abbiamo visto con le recenti capriole politiche sul DDL Cirinnà, e qualche mese fa con gli attentati di Parigi. Questa tendenza è stata individuata anche da un team di ricercatori guidati da Yury Kryvasheyeu, un fisico computazionale dell'Australia's National Information and Communications Technology Research Centre of Excellence di Melbourne.

Il punto di partenza della ricerca è semplice: le persone utilizzano i social network per comunicare in tempo reale, e spesso e volentieri si può individuare un picco di attività in corrispondenza di eventi rilevanti per la società intera. In particolare, quando si parla di emergenze di livello nazionale l'attività arriva alle stelle. In caso di disastri, è possibile sfruttare i dati presenti sui social network per monitorare e analizzare l'entità dell'evento?

Utilizzo delle parole chiave prese in analisi dallo studio.

Il disastro analizzato è stato quello dell'Uragano Sandy, un uragano di categoria 2 che nel 2012 ha devastato la Giamaica, Cuba, Bahamas, Haiti, Repubblica Dominicana e la costa orientale degli Stati Uniti. I danni che ha causato Sandy sono secondi solo a quelli prodotti da Katrina, e uno dei problemi più rognosi da gestire è stata proprio la configurazione di un piano di soccorso sensato. In breve: il disastro era stato di così ampia portata che capire chi avesse più urgenza di aiuto era un bel grattacapo.

Il team di Kryvasheyeu ha stilato una lista di parole chiave legate all'Uragano Sandy, ha individuato la finestra di tempo da prendere in analisi (dal 15 ottobre al 12 novembre 2012). Dopodiché ha acquistato i dati relativi a Twitter da un privato che si occupa proprio di raccogliere questo tipo di dati—infatti, cercare dei tweet su Twitter non è semplice come sembra.

La ricerca ha dimostrato che Twitter può essere un'ottima fonte di informazioni e dati per questo tipo di eventi. Infatti, dopo aver catalogato e geolocalizzato tutti i tweet, il team ha scoperto che più una persona si trovava vicino alle zone più colpite dall'Uragano, maggiori erano le informazioni che era in grado di fornire. Il modello sviluppato dal team si è rivelato ancora più accurato di quello sfruttato dal Federal Emergency Management Agency statunitense, l'agenzia che si occupa proprio di configurare le operazioni di soccorso.

"È possibile condurre una vita sociale normale rimanendo fuori dalla rete digitale dei social network?"

"Lavoro con i dati di Twitter da oltre 5 anni, e credo che Twitter possa fornire un grande contributo alla scienza permettendo ai computational social scientist di accedere alle informazioni che il social network custodisce: così facendo, i ricercatori otterrebbero una valanga di dati fondamentali per comprendere meglio il comportamento degli esseri umani in questo tipo di emergenze," mi spiega Manuel Cebrian, co-autore dello studio e informatico del Commonwealth Scientific and Industrial Research Organisation a Clayton, in Australia, mentre gli chiedo quali sono i costi per accedere a questo tipo di dati.

"Aziende come GNIP facilitano agli scienziati l'accesso di dati ormai persi nel tempo, e il prezzo richiesto in cambio di questi servizi è ragionevole, specie perché nelle realtà accademiche vengono applicati dei grossi sconti. Si tratta di risorse inestimabili per progetti di ricerca come quello che abbiamo appena pubblicato su Science Advances—Senza di loro, questo tipo di ricerca semplicemente non è realizzabile."

La questione dell'accesso ai dati non è banale. In una società ormai sempre più dipendente dall'identità che proietta sulla rete, e in particolar modo sui social network, che valore hanno questi dati? Benché si tratti effettivamente di dati ospitati da piattaforme gestite da privati, si può dire che l'importanza storica che i tweet e i post su Facebook ormai hanno li renda automaticamente un bene di interesse pubblico?

"La domanda è un'altra: è possibile condurre una vita sociale normale rimanendo fuori dalla rete digitale dei social network? È una discussione interessante, supportata da prove e punti di vista di tipo molto diverso. Alcune ricerche dimostrano collegamenti positivi tra l'utilizzo dei social network e il nostro umore, altre ricerche dimostrano il contrario. Credo che questi risultati riflettano la complessità della natura umana, quanto ancora poco noi riusciamo a comprenderla e quanto i social media stiano cambiando il modo in cui comunichiamo tra di noi," mi spiega Manuel.

Distribuzione del rapporto tra attività e danni per tutti i disastri analizzati nello studio.

Resta da chiedersi perché, eccezion fatta per chi sceglie di rendere privati i propri post, i contenuti naturalmente pubblici non siano analizzabili autonomamente dai ricercatori—Sicuramente, si tratta di una questione di profitti generati dai big data immagazzinati dalle grandi piattaforme ma, come detto, queste informazioni sono ormai fondamentali per il progredire di una serie di campi di ricerca, "Da diverso tempo seguo le attività di Sandy Pentland, mio mentore e professore dell'MIT, maggior esponente degli studi in questo campo, ovvero i pro e i contro dei profitti delle piattaforme social e la proprietà individuale dei dati che queste aziende posseggono, e credo sia uno degli aspetti più interessanti di questa nuova era fatta di dati e informazioni," dice Manuel.

Questo tipo di dati soffre però di un problema piuttosto rilevante: quello dei bot. Come già dimostrato in campo politico, una buona parte dei contenuti pubblicati sui social media è prodotto da bot o algoritmi automatizzati, che in più di un caso rischiano di falsare la reale percezione di un determinato evento, "È una questione parecchio importante per noi, e quando si tratta di analizzare milioni di messaggi su Twitter cerchiamo di essere quanto più attenti possibile nella rilevazione e rimozione dei bot—Anche in questo caso, però, si tratta di un vero e proprio campo di ricerca (vedi, The DARPA Twitter Bot Challenge) a sé stante; è inevitabile dovervi avere a che fare, almeno per ora," conclude Manuel.

I risultati di questa ricerca, in un certo senso, dimostrano come attraverso il nostro comportamento sui social network sia possibile configurare un modello predittivo—Lo stesso team ha lavorato sull'argomento, come nel caso di un'ulteriore analisi del comportamento degli individui coinvolti nell'Uragano Sandy e sulla possibilità di sfruttare i dati presenti sui social per prevedere lo scatenarsi di epidemie.

Non mi resta che chiedermi se studi del genere vengano effettuati anche sul territorio italiano—Nella speranza che il soggetto di studio non debba necessariamente essere una super-tempesta distruttiva.

Segui Federico su Twitter: @nejrottif