< Terug naar vorige pagina

Project

Geavanceerde screeningstechnieken voor ultrahoog dimensionele data (R-4478)

Statistici worden vaak geconfronteerd met grote datasets uit verschillende wetenschappelijke onderzoeksdomeinen. Hoewel onderzoekgebieden zoals genetica, neurologie, financiën en aardwetenschappen verschillende vragen stellen, delen ze een gezamenlijk thema: ze steunen op het extraheren van nuttige informatie uit grote datasets hoewel het aantal verklarende variabelen zeer groot kan zijn in vergelijking tot de steekproefgrootte. In zo'n geval zijn de parameters enkel identificeerbaar als het aantal verklarende variabelen dat relevant is voor de response klein is. Hiervoor is variabelenselectie nodig. Sure independence screening (SIS) is een krachtige methode voor het selecteren van variabelen wanneer het aantal verklarende variabelen zeer groot is. In dit project bestuderen we alternatieven voor de bestaande SIS methode die ook bruikbaar zijn wanneer de grote datasets extra moeilijkheden bevatten.
Datum:1 feb 2013 →  31 dec 2013
Trefwoorden:omvangrijke data, variabelenselectie
Disciplines:Wiskunde en statistiek