< Terug naar vorige pagina

Project

Grootschalige multi-agent omgevingen beheersen met model- gebaseerde reinforcement learning (FWOSB87)

Veel scenario's in de echte wereld bevatten meerdere agenten die samen moeten werken om een gemeenschappelijk doel te bereiken. Het multi-agent domein is heel uitdagend vanwege de exponentiële groei in staat- en actieruimtes. Dit maakt het moeilijk om efficiënt te leren, en resulteert ook in moeilijk te bepalen optimale oplossingen.
In meeste multi-agent problemen interageert iedere agent echter met enkel een deel van de omgeving. Deze onderliggende structuur laat toe om een compacte representatie van het probleem te bepalen dat gebruikt kan worden om het leren te versnellen. Ook kan het ook gebruikt worden om, samen met benaderingen, moeilijk te bepalen optimale oplossingen te vinden. Door theoretische grenzen te bepalen voor deze benaderingen is het mogelijk om de kwaliteit van een gegeven algoritme te garanderen.
Om dit te verwezenlijken stellen we voor om model-gebaseerde reinforcement learning te gebruiken, aangezien dit een goed kader is om zulke uitdagingen aan te pakken. We zullen ons focussen op drie hoofddoelen. Met de aanname dat de structuur gekend is, zullen we nieuwe algoritmes ontwikkelen zodat een agent zich efficiënt leert gedragen in sequentiële grootschalige omgevingen. Ook zullen we deze algoritmes toepassen op scenario's waar de structuur niet vastgezet is, maar eerder afhangt van de huidige staat in de omgeving. Tot slot zullen we een theoretisch kader maken om de kwaliteit van de benaderde oplossingen te begrenzen ten opzichte van de optimale oplossing
Datum:1 nov 2019  →  Heden
Trefwoorden:multi-agent, Reinforcement Learning
Disciplines:Adaptive agents en intelligente robotica, Machine learning en besluitvorming