Project

Dynamische netwerkmodellen voor dyadische data

Psychologisch onderzoek focust steeds vaker op hoe processen interageren doorheen de tijd binnen individuen. Er zijn twee belangrijke verklaringen voor deze evolutie. Ten eerste is het door technologische vooruitgang mogelijk om variabelen herhaaldelijk te meten. Ten tweede vertellen de resultaten van tussen-persoonsanalyses zelden veel over wat er gebeurt binnen personen. Deze toename wordt nog versterkt door recente oproepen om psychologische constructen te beschouwen als netwerken van gerelateerde variabelen die elkaar rechtstreeks beïnvloeden over de tijd.

In dit proefschrift bestuderen we de populairste manier om multivariate tijdsreekdata van één persoon te analyseren: het vectorautoregressiemodel (VAR-model) van eerste orde. Dit model voorspelt elke variabele op basis van alle variabelen (inclusief zichzelf) op het vorige tijdsmoment. In de netwerkbenadering worden de VAR(1)-coëfficiënten gevisualiseerd in een dynamische netwerkfiguur. Vervolgens kan men netwerkkarakteristieken berekenen, om bijvoorbeeld te achterhalen welke variabelen verschillende andere variabelen activeren over de tijd heen.

Aangezien het VAR(1)-model aan populariteit wint binnen de psychologie, dienen de mogelijkheden en beperkingen ervan in kaart gebracht en geremedieerd te worden. Wij bestudeerden drie onderwerpen. Ten eerste gingen we na hoe we tijdsreeksdata van meerdere personen gezamenlijk kunnen analyseren, rekening houdend met theoretische en empirische bevindingen die wijzen op het bestaan van subgroepen van personen met gelijkaardige dynamische processen. Hiervoor ontwikkelden we een clustergewijs VAR(1)-model, dat personen groepeert op basis van hun VAR(1)-coëfficiënten en tegelijkertijd groepsspecifieke VAR(1)-coëfficiënten berekent.

Ten tweede focusten we op de interpretatie van de VAR(1)-coëfficiënten. Een eerste probleem hiermee is dat ruwe VAR(1)-coëfficiënten niet vergelijkbaar zijn in het geval van variabelen met ongelijke varianties. Een tweede probleem is dat de VAR(1)-coëfficiënten enkel de unieke directe effecten weergeven en (de bij psychologische data vaak aanzienlijke) gedeelde of indirecte effecten niet vatten. Hoofdstuk 3 schuift gestandaardiseerde coëfficiënten en maten voor het relatieve belang van variabelen, zoals aanbevolen in de literatuur over regressieanalyse, naar voor als een eerste oplossing. In Hoofdstuk 5 wordt de hoofdcomponenten-VAR(1)-benadering (PC-VAR(1)) voorgesteld als tweede oplossing. In de eerste stap van deze benadering wordt een hoofdcomponentenanalyse uitgevoerd om de contemporaine structuur van de variabelen in kaart te brengen en zo rekening te houden met de gedeelde effecten. Deze stap reduceert de variabelen tot een kleiner aantal componenten. Vervolgens wordt een VAR(1)-analyse uitgevoerd op de componenten, in plaats van op de variabelen.

Een derde onderwerp is het relatief hoge risico op overfitting gegeven de vele VAR(1)-parameters. Overfitting treedt op in het geval dat de VAR(1)-coëfficiënten niet enkel de onderliggende tijdseffecten weergeven maar ook random fout. Dit gebeurt wanneer er te weinig data is in verhouding tot het aantal parameters. In Hoofdstuk 4 zijn we nagegaan of er sprake is van overfitting bij actuele psychologische toepassingen van VAR(1). We demonstreerden dat het VAR(1)-model niet beter presteert dan eenvoudigere tijdsreeksmodellen en bespreken mogelijke redenen en oplossingen. In Hoofdstuk 5 tonen we aan dat het PC-VAR(1)-model enige bescherming biedt tegen overfitting, doordat de dimensiereductiestap het aantal VAR(1)-parameters sterk vermindert.

Datum:1 okt 2013 → 26 sep 2018

Trefwoorden:dyadic

Disciplines:Toegepaste wiskunde, Statistische en numerieke methoden, Psychologische methoden, Mathematische en kwantitatieve methoden, Algemene pedagogische en onderwijswetenschappen, Sociale theorie en sociologische methoden, Politieke theorie en methodologie

Project type:PhD project

Project

Dynamische netwerkmodellen voor dyadische data

Onderzoekers

Project partners

Financiering

Publicaties