< Terug naar vorige pagina

Project

Robus groupwise variable selection.

Normal 0 false false false EN-US X-NONE X-NONE /* Style Definitions */ table.MsoNormalTable {mso-style-name:"Table Normal"; mso-tstyle-rowband-size:0; mso-tstyle-colband-size:0; mso-style-noshow:yes; mso-style-priority:99; mso-style-parent:""; mso-padding-alt:0cm 5.4pt 0cm 5.4pt; mso-para-margin-top:0cm; mso-para-margin-right:0cm; mso-para-margin-bottom:10.0pt; mso-para-margin-left:0cm; line-height:115%; mso-pagination:widow-orphan; font-size:11.0pt; font-family:"Calibri","sans-serif"; mso-ascii-font-family:Calibri; mso-ascii-theme-font:minor-latin; mso-hansi-font-family:Calibri; mso-hansi-theme-font:minor-latin; mso-bidi-font-family:"Times New Roman"; mso-bidi-theme-font:minor-bidi;} Methoden voor selectie van variabelen in statistische modellen hebben tot doel om een klein aantal verklarende variabelen te vinden, met een hogere verklarende kracht en een betere interpreteerbaarheid dan het volledige model. Een voorbeeld van dergelijke methode is genaamd Least Angle Regression (LARS). Deze methode rangschikt kandidaat voorspellers naargelang hun voorspellende kracht. LARS kan uitgedrukt worden enkel in termen van correlatie. Een robuuste variant van deze methode vervangt dan ook de klassieke correlatieschattingen met robuuste met een hoog breekpunt. Het is echter wel zo dat LARS en zijn robuuste alternatieven ontwikkeld werden voor cross-sectionele numerische variabelen. Voor het klassieke geval werden recent uitbereidingen van LARS voor gegroepeerde variabelen voorgesteld. In het geval van tijdreeks data worden deze groepen gevormd door de variabelen zelf en hun respectievelijk verleden. Voor cross-sectionele data kunnen deze groepen blokken zijn of binaire variabelen die factors vertegenwoordigen. Gegroepeerde LARS kan in ieder geval uitgedrukt worden in termen van R² maatstaven van korte regressies en correlaties. De doelstelling van dit project is dan ook om de gegroepeerde LARS robuust te maken, voortbouwend op robuuste regressie, R² en correlatie schattingen. Verschillende configuraties van robuuste schattingen zullen daarbij onderzocht worden en geëvalueerd op het vlak van performantie voor elke robuuste gegroepeerde LARS procedure.
Datum:1 apr 2011 →  30 sep 2011
Trefwoorden:Econometrics, Data analysis, Robust statistics
Disciplines:Toegepaste wiskunde