< Terug naar vorige pagina

Project

Klinische predictiemodellen op basis van multicentrische studies: methoden voor geclusterde data

Risicopredictiemodellen worden ontwikkeld om artsen te helpen bij het stellen van een diagnose, het maken van een medische beslissing of het geven van een prognose. Om er voor te zorgen dat risicomodellen veralgemeenbaar zijn, verzamelen onderzoekers steeds vaker data van patiënten in verschillende ziekenhuizen door samen te werken aan zogenaamde multicentrische projecten. De resulterende datasets zijn geclusterd: patiënten van eenzelfde centrum kunnen meer met elkaar gemeen hebben dan patiënten van verschillende centra. Dat komt bijvoorbeeld door regionale verschillen in populaties en lokale doorverwijspatronen. Bijgevolg is de assumptie van onafhankelijke observaties, die gemaakt wordt door de meest gebruikte analysetechnieken (bv. logistische regressie), ongeldig. Dit wordt genegeerd in het meeste predictieonderzoek. Onderzoek dat foute assumpties maakt kan niettemin misleidende resultaten geven en leiden tot suboptimale verbeteringen in de patiëntenzorg.

Om dit probleem aan te kaarten heb ik onderzocht wat de gevolgen zijn van de aanname dat observaties onafhankelijk zijn en alternatieve technieken bestudeerd die clustering erkennen, voor het hele proces van het plannen van een studie, het bouwen van een model en het valideren van voorspellingen in nieuwe data. Ik gebruikte hiervoor mixed en randomeffects modellen, omdat hiermee verschillen tussen centra gemodelleerd kunnen worden. De voorgestelde oplossingen werden geëvalueerd met simulatiestudies en klinische data. Dit proefschrift behandelt de benodigde steekproefgrootte, de dataverzameling en de selectie van predictoren, het schatten van het model, en de validatie van risicovoorspellingen in nieuwe datasets. Hierbij ligt de focus voornamelijk op diagnostische modellen. De belangrijkste casestudy is het ontwikkelen en valideren van modellen voor de preoperatieve diagnose van ovariumkanker, waarvoor de multicentrische dataset verzameld door de International Ovarian Tumor Analysis-groep (IOTA) gebruikt werd.

De resultaten suggereren dat mixed effects logistische regressiemodellen centrumspecifieke predicties geven die beter presteren in nieuwe patiënten dan de predicties van standaard logistische regressiemodellen. Hoewel simulaties aantoonden dat modellen toevallige patronen ongewenst oppikten in kleine datasets, hadden mixed effects modellen niet meer data nodig dan standaard logistische regressiemodellen. Uit een casestudy van predictoren voor ovariumkanker bleek dat metingen systematisch kunnen verschillen tussen centra in multicentrische datasets. Deze predictoren konden gedetecteerd worden met de residuele intraklasse correlatiecoëfficiënt en kunnen uitgesloten worden bij het bouwen van een risicomodel. Bovendien toonde een casestudy aan dat mixed effects modellen nodig zijn in elke stap van de selectieprocedure wanneer statistische variabelenselectiemethoden gebruikt worden, dit om te voorkomen dat de inferenties incorrect zijn. Tot slot demonstreerden casestudy’s over ovariumkanker dat de voorspellende kracht van risicomodellen verschilde van centrum tot centrum. Dit kon aangetoond worden door het gebruik van modellen voor de meta-analyse van discriminatie, kalibratie en klinisch nut.

Ter conclusie, het in rekening brengen van verschillen tussen centra gedurende het plannen van predictieonderzoek, de ontwikkeling van een model en de validatie van de voorspelde risico’s in nieuwe patiënten biedt inzichten in de heterogeniteit en betere predicties in lokale omstandigheden. Er resten nog veel methodologische uitdagingen, waaronder de inclusie van interacties tussen predictoren en centra, de optimale toepassing van mixed effects modellen in nieuwe centra en de verfijning van technieken om klinisch nut samen te vatten op basis van multicentrische data. De bevindingen in dit proefschrift wijzen er echter op dat toegepast predictieonderzoek baat zou hebben bij de implementatie van mixed en random effects technieken om ten volle gebruik te maken van alle informatie aanwezig in multicentrische studies.

 

Datum:3 okt 2011 →  31 dec 2016
Trefwoorden:risk prediction, multicenter data, Ovarian tumours, Pre-operative diagnosis
Disciplines:Controlesystemen, robotica en automatisatie, Ontwerptheorieën en -methoden, Mechatronica en robotica, Computertheorie, Modellering, Biologische systeemtechnologie, Signaalverwerking, Toegepaste wiskunde, Computerarchitectuur en -netwerken, Distributed computing, Informatiewetenschappen, Informatiesystemen, Programmeertalen, Scientific computing, Theoretische informatica, Visual computing, Andere informatie- en computerwetenschappen
Project type:PhD project