Project

Flexibele regressiemodellen voor de analyse van hiërarchische gegevens uit medische studies.

Het startpunt is de volgende twee onderzoekslijnen van I-BioStat:

(1)              Pseudo-likelihood methodologie voor onvolleidge gegevens (Geert Molenberghs, Michael G. Kenward, Geert Verbeke, Teshome Birhanu).

(2)              Een flexibel modelkader voor hiërarchische gegevens met overdispersie (Geert Molenberghs, Geert Verbeke, Clarice Demétrio, Tony Vangeneugden).

Pseudo-likelihood krijgt reeds lang aandacht binnen CenStat (Aerts, Geys, Molenberghs en Ryan 2002; Molenberghs en Verbeke 2005). De methode is niet-likelihood gebaseerd en heeft dus dezelfde problemen als GEE wanneer gegevens onvolledig zijn. In (1) werden zogenaamde inverse probability weighting methoden ontwikkeld, enkelvoudig en dubbel robuust, om hiermee om te gaan. De methode werd reeds beperkt en met succes toegepasaat.

In (2) werd een modelmatig kader ontwikkeld voor hiërarchische (bijv. longitudinale) gegevens, met twee types random effecten: (a) normaal verdeelde effecten om rekening te houden met hiërarchie in de gegevens en (b) geconjugeerde random effecten om overdispersie op te nemen. Het is hierbij belangrijk op te merken dat voor verschillende gegevens-types gesloten-vorm uitdrukkingen werden bereikt voor gemiddelden, varianties, correlaties, en marginale verdelingen (aantallen, binaire gegevens, overlevingsanalyse). Correlaties zijn nuttig voor psychometrische validering en voor de evaluatie van surrogaatrespons in klinische studies.

Projecten (1) en (2) hebben een soortgelijke complexiteit:

·            In project (1) zijn de schattingsvergelijkingen vrij complex. Daarnaast zijn de uitdrukkingen voor de varianties zeer ingewikkeld, wanneer ze analytisch worden afgeleid. Daarom is er nood aan efficiënte computationale methodologie.

·            In project (2) is het schatten van parameters via modellen met twee types random effecten geen sinecure. Daarom is het van belang een reeks computationeel efficiënte methoden te beschouwen en met elkaar te vergelijken. Deze omvatten, onder meer, pseudo-likelihood methodologie. Daarmee worden beide projecten met elkaar verbonden.

Het voorgestelde werkplan omvat:

(1)              Voor PL met onvolledige gegevens: exploratie van het gebruik van stochastische EM (Cristina Sotto, Caroline Beunckens, Geert Molenberghs end Michael G. Kenward), multiple imputation, bootstrap, en/of MCMC methodologie, om de robuuste standardfouten te berekenen en/of parameterschatting te vergemakkelijken.

(2)              Toepassing van PL en/of Bayesiaanse methodologie om parameters in het tweede project te schatten, samen met precisiematen. In eht geval dat pL gebruikt wordt en de gegevens onvolledig zijn, kunnen enkelvoudig en dubbel robuuste methoden gebruikt worden.

Er wordt specifiek aandacht besteed aan de context van psychometrie, waar vaak grote datasets voorkomen met heel wat verzamelde items. De random effecten zijn vaak genest en/of gekruist. De methodologie kan en zal toegepast worden op dit soort gegevens, wat dus een connectie inhoudt met item-response theory.

Datum:1 mei 2009 → 6 jun 2014

Trefwoorden:schattingsvergelijkingen, random effect, onvolledige gegevens, pseudo-likelihood, single robustness, double robustness

Disciplines:Toegepaste wiskunde, Statistische en numerieke methoden, Scientific computing, Bio-informatica en computationele biologie, Maatschappelijke gezondheidszorg, Publieke medische diensten

Project type:PhD project

Project

Flexibele regressiemodellen voor de analyse van hiërarchische gegevens uit medische studies.

Onderzoekers

Project partners

Financiering