Project
Inductie van multi-directionele ensembles van beslissingsbomen
Het domein van datamining behelst een grote variëteit aan taken, zoals classificatie, regressie, clustering, detectie van anomalieën, het vinden van subgroepen, probabilistische inferentie, ..., en een zo mogelijke nog grotere variëteit aan methodes. Veel methodes hebben een hoge computationele complexiteit, wat ze ongeschikt maakt om zeer grote datasets te analyseren. Een mogelijke oplossing hiervoor is de automatische constructie, op basis van data, van een model dat vervolgens geanalyseerd kan worden, in plaats van de data zelf. Idealiter vergt de constructie van zo'n model een tijdspanne die lineair schaalt met de grootte van de dataset terwijl de analyse van het model zelfs compleet onafhankelijk is van de grootte van de dataset (zgn. onmiddellijke datamining). In dit project leggen we ons erop toe om te onderzoeken in welke mate een nieuwe klasse van modellen, i.e.: multi-directionele ensembles van beslissingsbomen aan deze eisen kan beantwoorden. Het onderzoek focust op de efficiënte constructie van deze modellen van data, op zo'n manier dat de veelzijdigheid gegarandeerd blijft.