Het project begon met de conversie van Lowfat-boomstructuren uit de MACULA-taalkundige datasets voor het Nestle 1904 Griekse Nieuwe Testament naar het Text-Fabric (TF)-formaat. TF is een krachtig Python-pakket dat ondersteuning biedt bij het werken met antieke teksten. Voor degenen die minder vertrouwd zijn met de programmeertaal Python, biedt TF ook een browserfunctie waarmee teksten en hun taalkundige annotaties kunnen worden weergegeven en eenvoudige zoekopdrachten kunnen worden uitgevoerd.
Het project omvatte niet alleen de conversie van de XML-data van de Lowfat-boomstructuren naar het TF-formaat, maar ook de verrijking van de data om syntactische analyse mogelijk te maken. Daarnaast hebben we ervoor gezorgd dat de uiteindelijke dataset uitgebreid is gedocumenteerd, inclusief illustratieve voorbeeldtoepassingen.
Het project diende niet alleen als voorbereiding op een rijk geannoteerde syntactische dataset voor het Griekse Nieuwe Testament, maar ook als casestudy voor de conversie van XML naar TF en het maken en presenteren van syntactische datasets.
Een speciaal nummer van Andrews University Seminary Studies (verschijnt in 2025) zal gewijd zijn aan de ontwikkelingen binnen de Digital Humanities in het nieuwtestamentisch onderzoek. Het zal onder andere ingaan op de positie van de huidige dataset binnen het vakgebied, de uitdagingen tijdens het conversieproces, en het potentieel van de database – zowel in onderzoek (aangetoond via een casestudy over het zogeheten historisch presens in de evangeliën) als in onderwijs (dankzij de integratie in de Bible Online Learner).
Meer over dit onderzoeksproject
Start-/einddatum:
2022–2025
Team
Projectleiding: Oliver Glanz (Andrews University) en Willem van Peursen (SRT, VU Amsterdam)
Team: Saulo de Oliveira Cantanhede (Andrews University) en Tony Jurg (SRT, VU Amsterdam)
Project website: GitHub - CenterBLC/N1904: Text-Fabric dataset of the Greek New Testament, based on the Nestle 1904 (7th printing) edition.