< Terug naar vorige pagina

Project

Niet-parametrische besluitvorming gebaseerd op het concept van diepte voor multivariate data

Statistische 'data-diepte' is een niet-parametrische techniek die toepasbaar is op multivariate datasets, in een poging tot het veralgemenen van kwantielen voor complexe data zoals daar zijn stochastische vectoren, stochastische functies, of verdelingen op ruimtes en grafen. De hoofdidee is om aan elk punt x in M, met  M een algemene multivariate ruimte met een kansverdeling P op M, een getal D(x; P) toe te kennen dat karakteriseert hoe "centraal gelegen" x is met betrekking tot P. Een punt dat D(.; P) maximiseert is dan een veralgemening van de mediaan tot M-waardige data, en de locus van punten wiens diepte-waarde  groter is dan een zekere drempelwaarde geeft dan de diepte-kwantiel regio van de verdeling P.

In deze thesis ligt de focus op het concept data-diepte voor oneindig-dimensionale ruimtes M en functionele data. Er wordt een overzicht gegeven van diepte functionalen die beschikbaar zijn in de literatuur. Bij deze voorstelling ligt de nadruk op de eenheidsstructuur die in de diverse concepten terug te vinden is vanuit een theoretisch standpunt. We tonen aan dat de meeste van de bestaande diepte-maten passen in het kader van projectie-gebaseerde functionalen van een integraal type of een infimaal type.

Gebaseerd op de voorgestelde methodologie kunnen dan de karakteristieken en theoretische eigenschappen van al deze diepte-maten tegelijkertijd geëvalueerd worden. Het eerste deel van dit werk is dan ook volledig gewijd aan het onderzoek van deze theoretische eigenschappen, met name dan consistentie en meetbaarheid, en  de voorwaarden onder dewelke deze kunnen gegarandeerd worden. We tonen aan dan sommige van de meest gebruikte en welgekende diepte-maten niet aan deze vitale voorwaarden voldoen, en aldus niet als geschikt kunnen beschouwd worden met het oog op statistische analyses. Voor de familie van integraal types van diepte-maten voor functionele data, biedt dit werk een uitgebreide studie van hun belangrijkste theoretische eigenschappen, met inbegrip van een bespreking van de wenselijke kenmerken waaraan een oneindig-dimensionale diepte functionaal zou moeten voldoen.

In een tweede deel van het werk gaat de aandacht uit naar uitbreidingen en toepassingen van de voorgestelde methodologie. We behandelen de belangrijke topics van discreet-geobserveerde, en discontinue functionele data, en ontwikkelen de nodige theoretische basis voor het gebruik van diepte-maten in deze settings. We stellen ook een nieuwe diepte-maat voor die vormelijke eigenschappen van functionele data kan herkennen, en bestuderen deze nieuwe diepte-maat.

Datum:1 okt 2013 →  30 sep 2017
Trefwoorden:Multivariate Data
Disciplines:Toegepaste wiskunde, Computerarchitectuur en -netwerken, Distributed computing, Informatiewetenschappen, Informatiesystemen, Programmeertalen, Scientific computing, Theoretische informatica, Visual computing, Andere informatie- en computerwetenschappen, Statistische en numerieke methoden
Project type:PhD project