< Terug naar vorige pagina

Project

Een declaratieve aanpak voor het optimaliseren van parallelle dataverwerking (R-8196)

Binnen de database research is er een vernieuwde interesse voor parallelle dataverwerking. Hoewelparallelle en gedistribueerde systemen al langer bestaan, brengen cloud computing en de opkomst van big data nieuwe uitdagingen met zich mee. Terwijl parallellisme zich vroeger beperkte tot enkele servers worden nu honderden tot tienduizenden computing nodes gebruikt. Queries zijn niet langer beperkt tot simpele keyword zoekopdrachten, maar omvatten complexe join queries over meerdere database tables om data analyse op grote schaal mogelijk te maken. Daarnaast wordt snelheid niet langer gedomineerd door het aantal I/O requests naar extern geheugen zoals in traditionele systemen, maar door de communicatie nodig om data uit te wisselen over het netwerk tijdens een query evaluatie. Dit vereist nieuwe technieken om complexe queries te analyseren en optimaliseren voor parallelle settings.De opkomst van verschillende systemen bracht echter een opsplitsing van gespecialiseerde techniekenmet zich mee die moeilijk naar andere systemen overgebracht kunnen worden. In dit project wil ik een uniforme aanpak ontwikkelen om queries te optimaliseren voor parallelle systemen. Meer bepaald omvat mijn projectvoorstel de volgende doelstellingen: (1) een declaratief framework voor parallelle dataverwerking ontwikkelen; (2) beslisbaarheidsproblemen onderzoeken ter ondersteuning van statische analyse van queries in dit framework; (3) algemene technieken voor multi-query optimalisaties onderzoeken
Datum:1 okt 2017 →  30 sep 2019
Trefwoorden:Big data, databases, Parallel data processing, Query optimiza
Disciplines:Toegepaste wiskunde