Tech

Kunstmatige intelligentie kan veel sneller oude teksten ontcijferen dan historici

Onderzoekers van Oxford kwamen erachter dat je met machine learning een stuk makkelijker kunt achterhalen wat er op half vervaagde, Griekse tabletten staan geschreven.
Grieks kleitablet
DEA / L. PEDICINI / Contributor

Het is best makkelijk om __ begrijpen wat er in deze zin staat als __ alleen maar wat kleine woorden ontbreken. Maar wat als je ____ _______ niet kunt lezen? Vanwege de eerste zin kun je de context er waarschijnlijk nog wel uit opmaken, maar is dat ook zo als _____ ______ ______ ______?

Volgens een nieuw paper van onderzoekers van het Britse bedrijf DeepMind en Oxford is kunstmatige intelligentie goed in staat om oude Griekse teksten die half zijn vervaagd te herstellen en te begrijpen – en veel sneller dan historici. De vondst wordt volgende maand gepresenteerd bij de Empirical Methods in Natural Language Processing-conferentie in Hongkong.

Advertentie

De onderzoekers gebruikten een algoritme dat vernoemd is naar Pythia, een vrouwelijke profeet uit de Griekse mythologie die de profetieën van Apollo overleverde. Ze kwamen erachter dat de AI hier beter in slaagde dan historici die gespecialiseerd zijn in het herstellen van gefragmenteerde boodschappen op steen, klei of metaal. De historici hadden ongeveer 43 procent achterhaald na twee uur, terwijl Pythia al binnen een paar seconden bijna 70 procent terug kon halen.

Het is voor historici vaak moeilijk om oude boodschappen te ontrafelen, omdat volledige groepen symbolen vaak in de loop der jaren zijn verdwenen. Epigrafie, de wetenschappelijke bestudering van dit soort inscripties, heeft zo zijn beperkingen, zoals de voorkennis (en dus misschien vooringenomenheid) van de historicus die de boodschappen bestudeert. Zeker aangezien je alle bewijsstukken ook nog eens in de juiste tijd moet plaatsen, is epigrafie een ingewikkelde en tijdrovende bezigheid.

Pynthia is volgens de ontwikkelaars niet bedoeld om historici te vervangen, maar juist om hun werk aan te vullen. Het algoritme is getraind om naar een beschadigde tekst te kijken, de rest van de zinnen te voorspellen en verschillende mogelijkheden te laten zien.

Om Pynthia te trainen, zetten de onderzoekers ‘s werelds grootste digitale collectie Griekse inscripties om in een formaat waarin hun neurale netwerk het kon begrijpen. Bij deze gegevens zat ook informatie zoals de vorm van de symbolen, de voorgaande en volgende syntax en semantiek van symbolen of secties, en de vormgeving van vergelijkbare teksten. Pythia kan met name van waarde zijn in epigrafisch onderzoek omdat het in staat is om voorspellingen te maken op basis van de context.

De rest is vervolgens aan de historicus, die de beste opties uitkiest die Pythia te bieden heeft – waar natuurlijk wel wat kennis en begrip bij komt kijken.

Pythia zal dan ook vooral een assistent blijven. Het blijven mensen die de archeologische opgravingen doen, de fysieke inscripties bij elkaar brengen en bepalen welke poging van Pythia uiteindelijk het meest hout snijdt.