< Terug naar vorige pagina

Project

Flexibele modellen voor hiërarchische multivariate biomedische gegevens, met inbegrip van overdispersie

Vaak in biomedische studies, verzamelt de onderzoeker longitudinale, continue, binaire, ordinale, categorische en overlevingsdata, waarbij eventueel enkele waarnemingen kunnen ontbreken. Ordinale gegevens krijgen echter onvoldoende aandacht in de statistiek. Dit vormt de motivatie voor dit doctoraatsproject. Het proportionele odds model (Agresti, 2002) kan beschouwd worden als een voorbeeld van een veralgemeend lineair model (Breslow and Clayton, 1993) waarbij ordinale data eenvoudigerwijze kunnen vervangen worden door een minimale set van indicatoren.

Niet-Gaussische respons wordt vaak gemodelleerd via leden van de exponentiële familie. Een belangrijk kenmerk van deze familie is hun gemiddelde-variantie relatie, nl. waarbij de variantie kan worden beschouwd als een deterministische functie van het gemiddelde. Er zijn twee redenen om de exponentiële familie uit te breiden: (1) het voorkomen van overdispersie, nl. wanneer de variabiliteit van de gegevens onvoldoende door de modellen wordt beschreven, en (2) de opname van de hiërarchische structuur van de gegevens. Molenberghs et al. (2007, 2010) introduceerde het zogenaamde gecombineerde model om beide problemen tegelijkertijd aan te pakken. In dit proefschrift werd een model voor de ordinale respons met herhaalde metingen geformuleerd, gericht naar overdispersie. Het model werd verder toegepast op gegevens afkomstig van een epidemiologische studie bij diabetespatiënten en een klinische studie met het oog op het toedienen van  fluvoxamine aan psychiatrische patiënten.

Vaak beschrijven de uitkomsten van een medisch onderzoek gezamelijk de conditie van de patiënt, en kunnen ze niet worden beschouwd als afzonderlijke uitkomsten. Bijgevolg moeten ze gezamenlijk gemodelleerd worden. Wanneer longitudinale gegevens deel uitmaken van een gezamelijk model, neemt de complexiteit nog verder toe. Om dit aan te pakken, werden in dit proefschrift modellen gebaseerd op willekeurige effecten geformuleerd. In deze modellen kunnen de overeenkomstige variantiecomponenten gebruikt worden om de associatie tussen de verschillende sequenties vast te leggen. In sommige gevallen worden willekeurige effecten gezamelijk beschouwd voor de verschillende sequenties, eventueel op een schaalfactor na, in andere gevallen zijn er verschillende, gecorreleerde willekeurige effecten. Met behulp van twee case studies werd in dit proefschrift aangetoond dat de combinatie van willekeurige effecten de modelaanpassing aanzienlijk kan verbeteren en het mogelijk maakt onderzoeksvragen te beantwoorden die anders niet zouden kunnen beantwoord worden. Een bijkomend probleem van modelaanpassing is de hoeveelheid verzamelde data. Pseudowaarschijnlijkheidsmethoden zoals (1) paargewijs fitten (Fieuws and Verbeke, 2006), (2) opgesplitste steekproeven (Molenberghs et al., 2011b), en hetgeen in dit proefschrift wordt voorgesteld, de paargewijze fitting binnen opgesplitste steekproeven, maken de gezamenlijke modellering van grote aantallen responsen mogelijk. Uit het resultaat van de diabetesstudie -- een grote, multidimensionale dataset -- bleek dat de pseudowaarschijnlijkheidsmethodologie op zeer efficiënte en snelle wijze de nodige resultaten oplevert. Om de ontbrekende gegevens in de fuvoxaminestudie aan te pakken, werd het uitvalsmechanisme opgenomen in de gezamelijke modellering van twee ordinale responsen met herhaalde metingen. Als uitbreiding van de methodologie werden verschillende modellen met niet-willekeurige uitval voor geobserveerde gegevens geformuleerd en werd het aangetoond dat ze ongeveer hetzelfde resultaat leveren als de modellen met willekeurige uitval, doch met een geringere precisie. Daarnaast werd het effect van verschillende identificerende restricties op meervoudige imputatie onderzocht. Verder werd een alternatieve aanpak voorgesteld om de gegevens te modelleren, waarbij gegevens kunnen ontbreken, wanneer de modellen een complexe waarschijnlijkheidfunctie hebben. Als de ontbrekende gegevens op willekeurige wijze ontbreken, stelde Molenberghs et al. (2011a) een reeks correcties voor op de standaardvorm van pseudo-waarschijnlijkheid, nl. in de vorm van enkelvoudig- en dubbel robuuste schattingen. De bijdrage van dit proefschrift is de gedetailleerde ontwikkeling van de paarsgewijze marginale pseudo-waarschijnlijkheid voor onvolledige herhaalde binaire data en de toepassing ervan met behulp van het Bahadur-model op gegevens uit een studie met pijnstillers.

Alle geformuleerde modellen werden geïmplementeerd in SAS (9.3 -- 9.4) met behulp van proc NLMIXED en voor de matrixberekeningen werd proc IML aangewend.

Datum:1 nov 2013 →  23 feb 2018
Trefwoorden:Ordinal Response, Overdispersion, Joint Modeling, Pseudo-likelihood, Incomplete Data
Disciplines:Toegepaste wiskunde, Statistische en numerieke methoden, Scientific computing, Bio-informatica en computationele biologie, Maatschappelijke gezondheidszorg, Publieke medische diensten
Project type:PhD project