< Terug naar vorige pagina

Project

Early detection of Diabetes trough advanced data mining techniques.

Diabetes mellitus is een metabolische stoornis die gekarakteriseerd wordt door chronische hyperglycemie, hetgeen zware schade kan veroorzaken aan verschillende biologische systemen in het lichaam. Diabetes is een dodelijke pandemie die leidt tot een enorme belasting op de wereldwijde gezondheidszorg. De impact van diabetes zal verder toenemen in de komende jaren aangezien de globale prevalentie nog steeds stijgt, in het bijzonder deze van type 2 diabetes. In ontwikkelde landen is de stijgende prevalentie voornamelijk te wijten aan vergrijzing, veranderingen in levensstijl en langere overleving van diabetespatiënten. Wanneer diabetes vroeg gedetecteerd wordt, kan de ziekte goed behandeld worden, maar vroegtijdige detectie blijkt problematisch aangezien de periode tussen de ontwikkeling en diagnose van diabetes verschillende jaren kan duren. Verder is naar schatting één derde van de type 2 diabetes-patiënten niet gediagnosticeerd in Westerse landen.

Wij hebben het potentieel onderzocht om een kosteneffectieve, nationale screening-methode voor (type 2) diabetes mellitus te ontwikkelen op basis van Belgische ziekenfondsgegevens. Dit zou een meerwaarde kunnen betekenen in secundaire preventie als we hiermee sneller patiënten kunnen diagnosticeren en vervolgens behandelen voor de ziekte onherroepelijke schade heeft aangericht. We maakten gebruik van ziekenfondsgegevens die verzameld werden door de Landsbond der Christelijke Mutualiteiten (CM) - het grootste ziekenfonds in België. Deze data omvat simpele biografische informatie en records van alle terugbetaalde medische interventies en aankopen van medicijnen, wat in zijn geheel een longitudinaal overzicht over lange termijn geeft van de medische uitgaven van de meer dan 4 miljoen CM-leden.

Screening werd geformuleerd als een binaire klassificatie-taak, waarin diabetespatiënten de positieve klasse voorstellen. Door de aard van het probleem en beperkingen van ziekenfondsgegevens konden we geen verzameling van gekende negatieven bekomen (dit zijn mensen die zeker geen diabetes hebben). Daarom hebben we modellen moeten opstellen op basis van positieve en niet-gelabelde data. Tijdens dit project hebben we twee bijdragen geleverd aan dit subdomein van semi-supervised learning: (i) een nieuwe leermethode die robuust is tegen valse positieven en (ii) een aanpak om de performantie van modellen te evalueren via traditionele metrieken zonder gekende negatieven in de test set. Verder hebben we de overleving van patiënten die startten met verscheidene glucoseverlagende farmacotherapiëen in kaart gebracht en twee open source pakketten ontwikkeld voor machine learning: één voor ensemble learning en één om hyperparameter-optimalisatie te automatiseren.

De ontwikkelde screening-methode is qua performantie competitief met de beste bestaande alternatieven. Dit overtrof onze verwachtingen, aangezien ziekenfondsgegevens weinig tot geen informatie bevatten over een aantal typische risicofactoren die aan de basis liggen van de meeste bestaande screening-methodes (BMI, levensstijl, genetische aanleg, ...). Hieruit volgt dat de combinatie van ziekenfondsgegevens en bijkomende informatie over risicofactoren een interessante piste is voor toekomstig onderzoek in screening voor diabetes mellitus. Tenslotte heeft onze aanpak een zeer lage operationele kost omdat de methode volledig gebaseerd is op gegevens die reeds ter beschikking staan, hetgeen een oplossing biedt aan één van de belangrijkste barrières voor nationale screening-methodes voor diabetes.

Datum:4 okt 2010 →  31 dec 2015
Trefwoorden:Algorithms
Disciplines:Controlesystemen, robotica en automatisatie, Ontwerptheorieën en -methoden, Mechatronica en robotica, Computertheorie, Modellering, Biologische systeemtechnologie, Signaalverwerking, Toegepaste wiskunde, Computerarchitectuur en -netwerken, Distributed computing, Informatiewetenschappen, Informatiesystemen, Programmeertalen, Scientific computing, Theoretische informatica, Visual computing, Andere informatie- en computerwetenschappen
Project type:PhD project