Project
Morfosyntaxis en lexicale semantiek verbinden met Elastic Net regressie
Dit project bepleit het gebruik van regularisatiemethoden uit
machinaal leren, met name Elastic Net-regressie (en de verwante
technieken Ridge en Lasso), om lexicaal-semantische effecten in
morfosyntactische alternanties te onderzoeken. Die regularisatietechnieken
passen shrinkage toe en kunnen dus ingezet worden voor
variabeleselectie, in het bijzonder wanneer het aantal predictoren
heel groot is. Dat is vaak het geval in variationele studies als men de
lexemen die gecombineerd kunnen worden met een constructie wil
invoeren in een regressiemodel om de constructionele varianten te
voorspellen. We koppelen de 'Elastic Net regulator' aan een kvoudige
kruisvalidatie - een standaardprocedure - om overfitting te
vermijden. Onze aanpak vermijdt de nadelen van alternatieve
benaderingen die op dit moment gebruikelijk zijn in de
variationistische taalkunde, zoals random factoren in gemengde
modellen en collostructionele analyse. We onderzoeken tien
multifactorieel aangedreven alternanties in het Nederlands. Dit
project biedt een transparante pijpleiding aan die gemakkelijk
overgenomen kan worden voor andere gevalstudies en andere talen.