< Terug naar vorige pagina

Project

Een studie van een familie van asymmetrische dichtheden en flexibele kwantiel regressie


Kansverdelingen zijn fundamentele gereedschap voor data-analyse en statistische besluitvorming. Hoewel vaak symmetrische verdelingen gebruikt wordt voor het statistisch modelleren, zijn deze in vele toepassingen niet gepast. In deze thesis bestuderen we een brede familie van asymmetrische verdelingen voor het beschrijven van scheve data. Een symmetrische verdeling is een speciaal element van deze familie. Op basis van deze familie voorzien we een verenigend kader voor conditionele kwantielschatting in een flexibele regressiecontext, in dezelfde geest als in veralgemeende (niet-)lineaire modellen.

 

In een eerste deel bestuderen we de algemene familie van asymmetrische dichtheden voor reële stochastische veranderlijken, waarbij de locatieparameter een kwantiel is (i.p.v. een gemiddelde). Binnen dit algemene kader, tonen we uitdrukkingen voor belangrijke karakteristieken van de verdelingen aan en bestuderen we het schatten van parameters via de methode van de momenten en de meest aannemelijke schatter. Voor beide schatters tonen we asymptotische normaliteitsresultaten aan. Bovendien vergelijken we hun asymptotische efficiëntie. De resultaten, verkregen binnen dit algemeen kader, worden ook toegepast op enkele specifieke voorbeelden van asymmetrische dichtheden. Het gebruik van asymmetrische dichtheden wordt geïllustreerd in een data-analyse.

 

In een tweede deel voorzien we een verenigend kader voor het schatten van conditionele kwantielcurves in een flexibele regressiesetting. Dit is gebaseerd op een algemene familie van asymmetrische dichtheden (bestudeerd in het eerste deel). Via conditionele dichtheden en lokale aannemelijkheidstechnieken in een multi-parameter omgeving komen we tot een semi-parametrische schattingsprocedure. Voor lokale meest aannemelijke schatters tonen we de asymptotische verdeling aan en bespreken we de vertekening en variantie bij een eindige steekproef. We gaan ook dieper in op de keuze van de bandbreedte en stellen verschillende praktische methoden voor het kiezen van de bandbreedte voor. Het praktisch gebruik van de semi-parametrische methode wordt geïllustreerd in een data-analyse. Een simulatiestudie houdt zowel een vergelijking met een niet-parametrische lokale lineaire kwantielregressie in als een studie van de robuustheid tegenover het verkeerdelijk specifiëren van het parametrische deel van het model.

 

Een derde deel focust op het verbreden van de familie van asymmetrische dichtheden naar een continue stochastische veranderlijke met een willekeurig domein (deel van de reële getallen), door het introduceren van een linkfunctie volgens dezelfde filosofie als bij veralgemeende (niet-)lineaire modellen. De hoofdfocus binnen deze familie ligt op kwantielschatting in plaats van het schatten van het gemiddelde. Op een gelijkaardige manier wordt een brede familie van conditionele verdelingen in een regressiecontext beschouwd. We onderzoeken het schatten van parameters in het niet-conditionele geval en bewijzen een asymptotisch normaliteitsresultaat, met een expliciete uitdrukking voor de variantie-covariantiematrix. In de regressiecontext laten we opnieuw flexibele modellering toe en schatten we de locatie- en schaalfuncties niet-parametrisch, resulterend in een semi-parametrische schattingsprocedure van conditionele kwantielen. Het praktisch gebruik van de voorgestelde methoden wordt geïllustreerd in een data-analyse.

 

In een laatste deel focussen we op het ontwikkelen van formele methodes  voor een toets van symmetrie binnen het parametrisch kader. We ontwikkelen hiervoor een parametrische en niet-parametrische aannemelijkheidsquotiënttoets. We voeren een simulatiestudie uit waarin de prestatie van beide toetsen onderzocht wordt. Het praktisch gebruik van de voorgestelde methoden wordt geïllustreerd in drie data-analyses.

 

Een R-pakket QBAsyDist werd ontwikkeld waarin de voorgestelde methoden werden opgenomen. Dit pakket is beschikbaar op de CRAN-website.

Datum:1 okt 2015 →  29 aug 2019
Trefwoorden:Quantile Regression, Asymmetric Family of Densities, Mathematical Statistics
Disciplines:Toegepaste wiskunde, Computerarchitectuur en -netwerken, Distributed computing, Informatiewetenschappen, Informatiesystemen, Programmeertalen, Scientific computing, Theoretische informatica, Visual computing, Andere informatie- en computerwetenschappen, Statistische en numerieke methoden
Project type:PhD project