FYI.

This story is over 5 years old.

Tech

De database die het wereldnieuws bijhoudt kan toekomstige conflicten voorspellen

In de toekomst zullen conflictvoorspellingen een klik van iedereen verwijderd zijn.

Er raast een schier eindeloze lijst conflicten over de wereld - de rebellenoorlog in Oekraïne, Israëls nieuwe offensief in Gaza, de situatie in Syrië en Irak - maar waarom ontstaan al die oorlogen eigenlijk?

De Global Database of Events, Languages and Tones (GDELT) is een open source online tool die meer dan 250 miljoen wereldwijde gebeurtenissen sinds 1979 bevat. De tool is een toegankelijk platform om wereldnieuws te monitoren op de Big Data-schaal. Wat de site in fiete doet, is conflicten en andere geopolitische gebeurtenissen begrijpelijk maken voor computers, waardoor het in de toekomst wellicht mogelijk zal zijn om conflicten te voorspellen.

Advertentie

"Het ultieme doel is om publieke informatie van over de hele wereld te monitoren" via nieuwsmedia, aldus Kalev Leetaru, een onderzoeker aan Georgetown University die GDELT maakte.

Leetaru heeft GDELT zo ontworpen dat het programma tekstanalyse en algoritmes gebruikt om nieuwssites in meer dan 100 talen te lezen. Vervolgens produceert het een database met dagelijkse rapporten. De database deelt gebeurtenissen in 59 verschillende categorieën en hangt er een lokatie aan. Door deze data in algoritmische voorspellingen te pluggen, zou je een soort voorspellend model moeten kunnen maken.

Dat bestaat nu nog niet, maar GDELT kan nu al gebruikt worden om vooroordelen in nieuwsmedia aan te tonen. Leedaru vertelde bijvoorbeeld dat terwijl het MH17-incident in Oekraïne de Westerse media overheersde, de rest van de wereld zich vooral boog over het Gaza-conflict.

In essentie is het een dataset, beschikbaar op Google BigQuery, met plannen voor een live-kaart waarop gebruikers op een intuïtieve manier in real time gebeurtenissen over de hele wereld kunnen volgen.

Hoewel Leetaru toegeeft dan nieuwsmedia, met al haar vooroordelen en fouten, geen perfect inzicht geeft in de geschiedenis, maar toch inzicht kan geven in de emotionele motivaties achter nieuwsgebeurtenissen.

"In de openbare informatie die mensen elke dag publiceren zit een enorme rijkdom aan indicators die je informatie kunnen geven over hoe bevolkingen zich voelen en wat ze belangrijk vinden," volgens Leetaru. Hij wil die informatie extraheren en op een slimme manier weergeven om inzicht te geven in de maatschappij "als geheel."

Advertentie

"Voorspellen is duidelijk de Heilige Graal. Er wordt daar nu een hoop onderzoek naar gedaan," zei Leetaru. Hij vertelde ook dat GDELT binnen enkele weken details zal publiceren over "hele simplistische algoritmes" die als voorspellende modellen gebruikt worden en "hele nuttige data en voorspellingen" opleverden.

Volgens hem hebben bestaande voorspellingen altijd geaccepteerd dat "black swans" zoals de Russische schermutseling in de Krim of de Arabische Lente in Egypte moeilijk te verklaren zijn. Maar door te vertrouwen op kwantificeerbare data als BNP, kindersterfte, of feitelijke cijfers zoals het aantal protesten, negeren traditionele voorspellingen meer kwalitatieve metingen zoals emotie.

"Als je kijkt naar dingen als de thematische en emotionele dimensies, zie je een hoop signalen die voorbodes zijn van narigheid," volgens Leetaru. Hij geeft als voorbeeld dat pro-Russische berichten in de Krim begonnen op te duiken tijdens de protesten in Kiev, ver voordat Rusland binnenviel.

"Je gaat nooit op een punt komen waarop de kaart zegt dat er aanstaande vrijdag om 15:05 een rel zal plaatsvinden… Maar wat we nu al kunnen is opmerken wanneer de data 'hey, je zou hier misschien eens naar moeten kijken' zegt."

GDELT is niet de enige database die informatie en nieuws over conflicten verzamelt met een dataperspectief om voorspellingen te doen.

De Amerikaanse DARPA heeft haar Worldwide Integrated Crisis Early Warning System (W-ICEWS), die door Lockheed Martin ontwikkeld is, en uit zo'n 17 miljoen nieuwsverhalen put om "een voorspellende nauwkeurigheid van meer dan 80% te halen."

Advertentie

Het bezitten van betrouwbare informatie om beleid te vormen zou in de toekomst ontzettend waardevol kunnen zijn, vooral als de modellen nauwkeuriger worden.

Ik vroeg Leetaru of private beveiligingsbedrijven zijn database al gebruiken voor hun eigen agenda, aangezien sommige private inlichtingendiensten risicobeoordelingen maken voor bedrijven of overheden. "Ik kan met zekerheid zeggen dat GDELT over de hele wereld gebruikt wordt."

Leetaru benadrukt ook dat een van de toepassingen van zijn database een soort early warning-systeem zou kunnen zijn voor burgers in conflictzones.

Helaas zijn computers niet perfect. Leetaru geeft toe dat GDELT fouten maakt bij het analyseren van sarcasme. Zo zorgden de neergeschoten MH17 en de resulterende beschuldigingen van Russische en Oekraïense kant ervoor dat het systeem in de war raakte.

Met deze zwakheden in het achterhoofd, zou het kunnen dat het toevoegen van meer input (zoals klimaatproblemen of waterschaarste) ervoor kan zorgen dat de nauwkeurigheid verbeterd wordt.

"Dat is de toekomst waarin ik geïnteresserd ben. De wetenschappelijke wereld heeft fantastisch werk gedaan door allemaal satellieten in de lucht te en sensoren in de grond te krijgen, waardoor we binnen een paar seconden weten wanneer er een aardbeving plaatsvindt en wie daardoor beïnvloed wordt. We hebben dat niet voor de maatschappij," aldus Leetaru.

Uiteindelijk ziet hij een toekomst voor zich waarin de hele wereld bestaat als een model op een computer: een model dat alle beschikbare info combineert om voorspellingen over conflicten te produceren. In die wereld kunnen we hopelijk oorlogen aan zien komen voordat ze zulke grote humanitaire rampen worden.

Of overheden hun beslissingen zullen laten beïnvloeden door voorspellingen is een andere vraag. Om die reden is een open source waarschuwingssysteem misschien wel beter voor een gemiddeld persoon die zoekt naar vroege waarschuwingen, of een journalist die op zoek is naar een verhaal.