< Terug naar vorige pagina

Project

Corpus-taalkunde in de Griekse papyri: ontwikkeling van een corpus om variatie en verandering in het post-klassieke Griekse complementatie-systeem te bestuderen

Dit doctoraatsproject heeft als doel het corpuslinguïstisch onderzoek van de Griekse papyri te bevorderen, een uitgebreid diachroon corpus (3de eeuw v.C. – 8ste eeuw n.C.) van niet-literaire teksten. Het bestaat uit twee centrale delen. Het eerste deel is gericht op corpusdesign: vertrekkende vanuit de getranscribeerde (XML) versie van deze teksten, beschrijft het een pipeline model om de papyri stap voor stap te voorzien met linguïstische information met behulp van technieken uit de natuurlijke taalverwerking (NLP). De verschillende componenten zijn beschreven in de individuele hoofdstukken. Allereerst worden de teksten getokenizeerd. Vervolgens wordt hun woordsoort, morfologie en lemma automatisch voorspeld. De volgende stap is syntactisch parsen: de individuele zinnen worden getransformeerd in syntactische dependentiebomen. Ten slotte worden een aantal technieken voor automatische semantische analyse onderzocht, o.a. het ontwikkelen van zogenaamde distributionele woordvectoren voor de individuele lemma’s, die hun lexicale betekenis beschrijven, en het automatisch labelen van semantische relaties in de zin (“semantic role labeling”).

Het volgende deel beschrijft hoe deze automatisch geanalyseerde teksten gebruikt kunnen worden voor corpusonderzoek. Het centrale linguïstische onderwerp is variatie en verandering in het verbale complementatiesysteem van het Grieks, bestudeerd vanuit het theoretisch kader van de taalgebruiksgebaseerde taalkunde. In een eerste inleidend hoofdstuk analyseer ik hoe dergelijke verbale complementatieconstructies gedefinieerd dienen te worden en hoe deze constructies uit de corpusdata gehaald kunnen worden. Bijzondere aandacht gaat ook uit naar de vraag welke plaats constructies met een ‘vage’ betekenis tussen complementen en bijwoordelijke bepalingen in deze analyse hebben. De volgende twee hoofdstukken zijn gericht op twee belangrijke loci van variatie in het Griekse complementatiesysteem. Het eerste van de twee analyseert de keuze tussen complementeerders: in dit hoofdstuk beschrijf ik hoe een aantal verkennende kwantitatieve technieken gebruikt kunnen worden om een overzicht te krijgen van de belangrijkste extra- en intralinguïstische factoren die de keuze tussen een groot aantal mogelijke complementeerders bepalen. Dit hoofdstuk onderzoekt ook de vraag hoe systematisch het Griekse ‘complementatiesysteem’ werkelijk is. Het tweede hoofdstuk is gericht op de keuze tussen verbale stammen: aan de hand van een specifieke case study (werkwoorden van zeggen) onderzoek ik welke temporele, aspectuele en modale factoren de keuze tussen de vier verbale stammen bepalen (praesens, aorist, perfectum en futurum).

In een laatste, afsluitende hoofdstuk, analyseer ik de belangrijkste bevindingen van de corpuslinguïstische benadering die ik heb ontwikkeld, door haar sterkten en tekortkomingen te beschrijven, en hoe we deze tekortkomingen in de toekomst kunnen opvangen.

Datum:1 okt 2016 →  31 dec 2020
Trefwoorden:Greek Linguistics, Corpus Linguistics, Papyri
Disciplines:Theorie en methodologie van de literatuurwetenschappen
Project type:PhD project