< Terug naar vorige pagina

Project

Middleware voor gegevensbeheer in Multi-Cloud

Cloud storage is een essentieel servicemodel voor cloud computing waarbij de inzet en het beheer van opslagmiddelen wordt uitbesteed aan externe derde partijen. Multi-cloud (federated cloud) storage architecturen combineren, integreren en gebruiken opslagbronnen, technologieën en diensten van meerdere cloud-opslagaanbieders, en maken dus gebruik van opslagbronnen, technologieën en diensten van meerdere cloud-opslagaanbieders. Deze aanpak wordt steeds populairder en aantrekkelijker voor een breed scala aan cloud-gebaseerde toepassingen en diensten zoals Software-as-a-Service (SaaS) en Internet-of-Things (IoT) toepassingen.

Deze toegenomen populariteit brengt echter ook aanzienlijke uitdagingen met zich mee voor dienstverleners, in het bijzonder met betrekking tot de complexiteit van het beheer van een gefedereerde cloud storage setup. Dienstverleners hebben dus te maken met het gebrek aan standaardisatie (bv. in termen van heterogene technologieën, API's en datamodellen). Bovendien leiden de mate van heterogeniteit in cloud storage providers (verschillende SLA-garanties, vertrouwensmodellen) en de noodzaak om in te spelen op verschillende opslag- en privacygerelateerde vereisten van de applicatie onvermijdelijk tot het probleem van de exploderende complexiteit in de implementatie van applicaties en diensten.

Daarenboven leidt herbruik van traditionele gegevensbeschermingsstrategieën voor het leveren van veilige gegevensbeheerdiensten (gezien het beperkte vertrouwen in externe cloud storage providers) tot aanzienlijke prestatie- en schaalbaarheidsvermindering. Tot slot draagt de run-time dynamiek in cloud storage providers (bv. in termen van prestatiekenmerken, beschikbaarheid, aangeboden SLA's, etc) aanzienlijk bij aan het probleem van de exploderende complexiteit van het beheer. In de praktijk vraagt dit continu toezicht en een reeks handmatige handelingen die door een menselijke operator moeten worden uitgevoerd. Bovendien kan het negeren van de run-time dynamiek die inherent is aan cloud providers (bijv. performance fluctuatie, kosten, beschikbaarheid, etc) leiden tot zowel suboptimale beslissingen over gegevensbeheer als dure SLA-overtredingen.

Dit proefschrift richt zich op de bovengenoemde uitdagingen door gerichte bijdragen te leveren op middleware niveau. Als zodanig gaat het om het ontwerpen van een effectief middleware-raamwerk voor het omgaan met deze belangrijke uitdagingen om de bredere adoptie van een gefedereerde cloud storage setup te vergemakkelijken. In het bijzonder wordt speciale aandacht besteed aan aspecten van performance overhead op de applicatie en de vereiste ontwikkelings-, beheer- en integratiekosten.

Dit proefschrift levert in dit verband vijf aanvullende bijdragen: (i) het biedt een uitgebreide analyse van trade-offs tussen de prestatie-impact en de migratiekost van bestaande Object-NoSQL Datastore Mapper (ONDM) frameworks, (ii) het beschrijft een overkoepelend en coherent middleware framework voor federatief cloud data management, (iii) het presenteert PERSIST, een middleware voor gegevensbeheer in federated cloud storage setup, (iv) het introduceert een schaalbare en herbruikbare gegevensbeschermingsstrategie voor veilig gegevensbeheer, en ten slotte (v) presenteert het SCOPE, een zelf-adaptieve en autonome middleware voor SLA-gedreven gegevensbeheer.

Deze bijdragen zijn gevalideerd en uitgebreid geëvalueerd in de context van twee verschillende industriële SaaS-toepassingen: een logboekbeheer en een dienst voor documentverwerking. We hebben een grondige evaluatie van onze bijdragen uitgevoerd om de voordelen in termen van verminderde ontwikkelings- en beheerinspanningen te evalueren en ook om de impact in termen van ingevoerde performantie-overhead te kwantificeren.

Datum:3 mrt 2014 →  18 feb 2019
Trefwoorden:Software-as-a-Service (SaaS), Cloud Computing, NoSQL Databases, Middleware, Adaptive Data Management, Multi-Cloud Storage
Disciplines:Computer hardware, Computertheorie, Scientific computing, Andere computer ingenieurswetenschappen, informatietechnologie en mathematische ingenieurswetenschappen, Toegepaste wiskunde, Computerarchitectuur en -netwerken, Distributed computing, Informatiewetenschappen, Informatiesystemen, Programmeertalen, Theoretische informatica, Visual computing, Andere informatie- en computerwetenschappen
Project type:PhD project