Project

Een formele aanpak voor het ondervragen van grote hoeveelheden data (R-4633)

De term "big data" is een modewoord geworden waarmee wordt verwezen naar een context waarin datavolumes worden gemeten met Gigabytes, Terabytes vaak voorkomen, en veel internet bedrijven, wetenschappelijke en financiële instellingen te maken krijgen met Petabytes aan informatie. Door de praktische noodzaak zijn er verschillende systemen ontstaan voor het verwerken van big data, zoals Mapreduce dat een brede aanname kent via zijn open source implementatie Hadoop. Deze laatste heeft ook geleid tot een heropleving van parallelle database management systemen en een verhoogde interesse in zogenaamde NoSQL data stores. Voortgang in het database onderzoek heeft geleid tot een diepgaand inzicht in traditionele data modellen en sequentiële ondervragingen, maar er ontbreekt een gelijkaardig begrip voor berekeningen op "big data". Gegeven het aantal concurrerende systemen en hun diversiteit, blijft het onduidelijk welk systeem het best geschikt is voor welk soort van ondervragingen. Dit werk richt zich daarom op de ontwikkeling en studie van computationele modellen voor grote hoeveelheden data om inzicht te verkrijgen in het gebruik van bestaande systemen en om mogelijke verbeteringen te formuleren. Dit onderzoeksvoorstel heeft twee hoofddoelstellingen: (1) de ontwikkeling van een computationele complexiteit, geschikt voor grote hoeveelheden data; en (2) de ontwikkeling en studie van ondervragings- en transformatietalen voor grote hoeveelheden data binnen dit framework.

Datum:1 okt 2013 → 30 sep 2017

Trefwoorden:SCIENTIFIC DATA MANAGEMENT

Disciplines:Toegepaste wiskunde

Project

Een formele aanpak voor het ondervragen van grote hoeveelheden data (R-4633)

Onderzoekers

Project partners

Financiering