Project
MERCS: Efficiënte modellering van "big data" met multidirectionele ensembles van beslissingsbomen
Analyse van digitale gegevens komt steeds vaker voor. Er is in het bijzonder een stijgende interesse voor de analyse van "big data", waar grote hoeveelheden gegevens, van zeer diverse en complexe aard, aan een hoog tempo gegenereerd worden. Methoden voor analyse van big data moeten uit terabytes aan gegevens efficiënt modellen kunnen construeren, en die modellen moeten zelf ook efficiënt gebruikt kunnen worden. In dit project wordt een nieuw soort methoden ontwikkeld, methoden die sterk afwijken van de probabilistische methoden die momenteel populair zijn (maar die een hoge computationele complexiteit hebben). De nieuwe methoden zijn gebaseerd op verzamelingen van ensembles van beslissingsbomen. Ze zullen het mogelijk maken om veelzijdige modellen (d.w.z. modellen die voor veel verschillende zaken gebruikt kunnen worden), zeer snel te leren uit zeer grote datasets, en dit volautomatisch, zonder uitvoerige afstelling van parameters te vereisen. De resulterende modellen zullen zeer efficiënte predictieve inferentie mogelijk maken, op basis van een eenvoudige, vraag-gestuurde interface.