Kunnen we met kunstmatige intelligentie de mysteries uit de geschiedenis ontgrendelen?

Foto van Richard van Hooijdonk
Richard van Hooijdonk
  • Wetenschappers gebruiken KI om eeuwenoude Griekse teksten te herstellen
  • Kan machine learning ons helpen onbekende talen te ontcijferen?
  • Wetenschappers ontwikkelen een algoritme dat beschadigde archeologische artefacten kan herstellen
  • KI onthult een verborgen geoglyph in de Nazcalijnen
  • KI helpt ons de geschiedenis weer tot leven te brengen

De geschiedenis is van cruciaal belang voor ons begrip van de wereld. Met behulp van waardevolle inzichten in ons verleden kunnen we onze huidige situatie beter begrijpen en ons voorbereiden op wat de toekomst brengt. Helaas blijft een groot deel van onze geschiedenis nog steeds een raadsel. Om deze puzzel op te lossen maken wetenschappers steeds vaker gebruik van opkomende technologieën. Vooral kunstmatige intelligentie (KI) is voor historici een bijzonder waardevol hulpmiddel. Deze technologie helpt hen met het herstellen en ontcijferen van eeuwenoude, beschadigde teksten, het repareren van archeologische artefacten en het ontdekken van verborgen ontwerpen die door oude beschavingen zijn achtergelaten.

Wetenschappers gebruiken KI om eeuwenoude Griekse teksten te herstellen

Oude teksten geschreven op stenen tabletten, zoals die in Griekenland, bieden belangrijke inzichten in de geschiedenis van vroegere beschavingen. Deze inscripties zijn maar liefst 2.600 jaar oud en van onschatbare waarde. In veel gevallen zijn ze echter beschadigd en soms ontbreken er hele tekstfragmenten. Om deze ontbrekende delen te reconstrueren maken historici vaak gebruik van epigrafie, een techniek waarmee men met behulp van “grammaticale en taalkundige overwegingen, layout en vorm, tekstuele parallellen en historische context” probeert de oorspronkelijke betekenis van de tekst in te schatten. Omdat dit een zeer complex en tijdrovend proces is, heeft het team achter de DeepMind AI van Google zijn krachten gebundeld met de University of Oxford om Pythia te ontwikkelen, het eerste tekstherstelmodel dat diepe neurale netwerken gebruikt om de ontbrekende tekens van eeuwenoude, beschadigde teksten te herstellen.

Om het systeem te trainen hebben de onderzoekers PHI, het grootste digitale corpus van oude Griekse inscripties, eerst omgezet in tekst die begrijpelijk zou zijn voor machine learning algoritmen. Vervolgens creëerden ze een algoritme dat de ontbrekende tekens in beschadigde tekst kan raden, een gerangschikte lijst met mogelijke opties biedt en elke suggestie voorziet van een score. Vanaf dat moment kunnen menselijke experts het overnemen en hun eigen oordeel en expertise gebruiken om de meest geschikte optie te kiezen. Om het tekstherstelmodel te testen gaven de onderzoekers het systeem de opdracht om de ontbrekende tekens in 2.949 beschadigde inscripties aan te vullen. Het systeem slaagde erin om de taak met 30,1 procent minder fouten af te ronden dan de menselijke experts. Bovendien wist het systeem alle inscripties binnen enkele seconden te bekijken – menselijke experts hadden voor 50 van deze teksten maar liefst 2 uur tijd nodig. “Dit is een geweldige ontwikkeling omdat het ons inzicht kan geven in bijna elk aspect van het religieuze, sociale en economische leven van de oude wereld”, zegt Thea Sommerschield van de University of Oxford, die deel uitmaakte van het team.

Kan machine learning ons helpen onbekende talen te ontcijferen?

Naast eeuwenoude beschadigde teksten zijn er ook teksten die niet beschadigd zijn maar geschreven in een onbekende taal. In de loop der jaren hebben archeologen talloze inscripties ontdekt die zijn geschreven in verloren gewaande talen die men nog niet heeft kunnen ontcijferen, waardoor de betekenis ervan tot nu toe verborgen is gebleven. Een van de beroemdste voorbeelden zijn oude stenen en tabletten die op het Griekse eiland Kreta gevonden zijn. Deze teksten dateren uit 1800 voor Christus en zijn geschreven in twee verschillende scripts, bekend als Linear A en Linear B. Hoewel Linear B in 1953 uiteindelijk werd ontcijferd, blijft Linear A nog steeds een mysterie. Nu heeft een team van onderzoekers van MIT en Google’s AI Lab een machine-learning-systeem ontwikkeld dat dit soort verloren talen kan ontcijferen.

Een infographic met de snelheid en nauwkeurigheid van Pythia, het eerste KI tekstherstelmodel ter wereld.
Pythia, het eerste tekstherstelmodel op basis van KI, werd succesvol gebruikt om de ontbrekende tekens in 2.949 beschadigde inscripties aan te vullen met een foutenpercentage van 30,1 procent. Dat foutpercentage ligt bij menselijke experts op 57,3 procent. Bovendien wist het systeem alle inscripties binnen enkele seconden te bekijken – menselijke experts hadden voor 50 van deze teksten maar liefst 2 uur nodig.

Om dit voor elkaar te krijgen gebruikten de onderzoekers een innovatieve benadering van machinevertaling die rekening houdt met de manier waarop talen in de loop van de tijd evolueren, waardoor grote datasets overbodig worden. Gebaseerd op het idee dat talen alleen op bepaalde manieren kunnen veranderen, richt de nieuwe aanpak zich op “vier sleuteleigenschappen die verband houden met de context en de uitlijning van de tekens: verdelingsovereenkomst, monotone karakterafbeelding, structurele schaarsheid en significante cognitieve overlap”. Het enige nadeel van deze aanpak is dat je de taal waaraan de verloren taal is gerelateerd moet kennen. De onderzoekers lieten het systeem eerst Linear B en Ugaritic vertalen, twee verloren talen met bekende zogenaamde ‘vooroudertalen’. Het systeem slaagde erin om beide talen met opmerkelijke nauwkeurigheid te vertalen en 67,3 procent van Lineaire B-cognaten correct te vertalen naar hun Griekse equivalenten. Maar omdat de vooroudertaal van Lineair A niet bekend is, kan deze techniek hier niet toegepast worden. Deze belangrijke mijlpaal in machinevertaling brengt ons echter een stap dichterbij het oplossen van het mysterie van de verloren talen.

Wetenschappers ontwikkelen een algoritme dat beschadigde archeologische artefacten kan herstellen

Het zijn niet alleen teksten die in de loop der eeuwen door de tand des tijds zijn aangetast. Hetzelfde kan gezegd worden van allerlei andere archeologische objecten, waarvan de meeste in slechte staat verkeren of waarvan alleen fragmenten over zijn. Archeologen zetten deze overblijfselen over het algemeen handmatig opnieuw in elkaar, wat een enorm gecompliceerd en tijdrovend proces is. Om historici te helpen deze archeologische puzzels op te lossen, heeft een team van onderzoekers van Technion – Israel Institute of Technology en de University of Haifa een algoritme ontwikkeld dat fragmenten van archeologische artefacten opnieuw in elkaar kan passen.

Bij het herstellen van beschadigde artefacten staan ​​archeologen voor drie belangrijke problemen: slijtage, kleurvervaging en continuïteit. Door slijtage ontstaan gaten tussen stukken, wat het lastiger maakt om aangrenzende fragmenten te matchen. Kleurvervaging creëert weer ‘valse’ randen, waardoor je echte randen moeilijk van vervagingen kunt onderscheiden. De onregelmatige aard van de fragmenten veroorzaakt continuïteitsproblemen omdat daardoor een bijna oneindig aantal mogelijke configuraties ontstaan. Om deze problemen op te lossen, scant en extrapoleert het algoritme eerst elk fragment en voorspelt dan de mogelijke aangrenzende stukken. Rekening houdend met unieke kenmerken als de ruimte tussen fragmenten, kleurvervaging, ‘onechte’ randen, variërende lengten en onnauwkeurige transformaties, kent het algoritme elk fragmentpaar vervolgens bepaalde scores toe om de best mogelijke match te vinden. Het algoritme werd getest op verschillende echte archeologische objecten van het British Museum en fresco’s van kerken uit de hele wereld en wist daarbij de meeste gebroken artefacten met succes opnieuw in elkaar te zetten.

KI onthult een verborgen geoglyph in de Nazcalijnen

De Nazcalijnen in het woestijngebied van Zuid-Peru bestaan uit tekeningen op de grond die gemaakt zijn door het verwijderen van stenen en aarde om het witte zand eronder te onthullen. De lijnen komen samen en overlappen elkaar en vormen daardoor allerlei ontwerpen, variërend van eenvoudige geometrische vormen tot mensachtige en dierlijke figuren. Ondanks dat er door de jaren heen talloze theorieën de revue zijn gepasseerd, blijft het ware doel van de Nazcalijnen tot op de dag van vandaag een mysterie. Van deze geogliefen wordt aangenomen dat ze zijn gemaakt door de Nazcabevolking die ooit Peru bezette en sommige van de ontwerpen dateren uit 100 voor Christus. Dankzij het droge klimaat en de wind die het zand wegblaast zijn de meeste lijnen ondanks hun leeftijd goed bewaard gebleven. Door menselijke activiteit en overstromingen zijn een aantal van deze lijnen echter minder goed zichtbaar, waardoor het steeds moeilijker wordt om nieuwe ontwerpen te identificeren. Nu is een team van onderzoekers van Yamagata University onlangs met IBM Japan gaan samenwerken om een ​​machine learning-algoritme te ontwikkelen dat verborgen ontwerpen in de Nazcalijnen automatisch kan identificeren.

Het algoritme ontdekte bijvoorbeeld een ​​kleine, vijf meter lange humanoïde figuur met een stok of een knots die waarschijnlijk dateert uit tussen 100 v.Chr. En 500 n.Chr. De ‘man met de stok’ werd ontdekt door het analyseren van on-site surveys en luchtfoto’s die tijdens eerder onderzoek gemaakt werden. Omdat er tot nu toe minder dan 100 geogliefen – met daarbij enorme variaties in vorm en afmeting – zijn geïdentificeerd, was het een enorme uitdaging om het algoritme te leren waar het naar moest zoeken. “We hebben specifiek technieken in het deep learning-kader ontwikkeld om het systeem onderscheid te leren maken tussen de verschillende patronen en afmetingen van deze geogliefen”, vertelt Akihisa Sakurai, een onderzoeker van IBM Japan. Uiteindelijk slaagde het algoritme erin om enkele honderden potentiële kandidaten voor nieuwe geogliefen te identificeren, die vervolgens handmatig door wetenschappers werden onderzocht, waardoor de kleine man met de stok zichtbaar werd.

KI helpt ons de geschiedenis weer tot leven te brengen

Kunstmatige intelligentietechnologie heeft op allerlei gebied inmiddels baanbrekende toepassingen gevonden. In de archeologie is KI van onschatbare waarde gebleken bij het razendsnel analyseren van grote hoeveelheden gegevens en het ontdekken van verborgen patronen. Of het nu wordt gebruikt om eeuwenoude teksten te ontcijferen of beschadigde archeologische artefacten te herstellen, KI wordt voor historici een steeds belangrijker hulpmiddel waarmee ze de geschiedenis weer tot leven kunnen brengen.

Share via
Copy link