< Terug naar vorige pagina

Project

Multiagent bekrachtigingsleren door middel van het uitwisselen van observaties en beloftes (FWOTM1008)

Multiagent-systemen vormen een krachtig hulpmiddel voor het modelleren van gedistribueerde systemen die robuuste, schaalbare en gedecentraliseerde controle vereisen. De complexiteit van die systemen maakt ze over het algemeen moeilijk te construeren. We beschouwen hier multiagent bekrachtigingsleren (BL) als een interessant paradigma voor dergelijke systemen. Ondanks dat dit gebied de afgelopen tien jaar steeds meer aandacht kreeg, zijn er nog steeds belangrijke onontgonnen onderzoeksrichtingen. Recente resultaten hebben de kwetsbaarheid van huidige algoritmen blootgelegd door perturbaties te introduceren tijdens de uitvoering van het geleerde gedrag. Gegeven dit probleem, willen we robuustere algoritmen ontwikkelen. Aangezien er nog geen gepaste test omgevingen zijn ontworpen, zullen we eerst een reeks omgevingen produceren om de robuustheid van multiagent BLalgoritmen te evalueren. Om robuustere controle strategieën te leren, moeten ze perturbaties kunnen anticiperen die mogelijs kunnen optreden bij het uitvoeren van de geleerde strategie. We zullen nieuwe algoritmen ontwikkelen die cruciale observaties kunnen identificeren en uitwisselen tussen agenten, en die anticipatie mogelijk maken om de robuustheid te verbeteren in zowel coöperatieve als gemengde systemen. Verder zullen we ideeën uit modelgebaseerde BL onderzoeken, zodat agenten zich kunnen inplannen gebasseerd op toekomstige staten, wat betere oplossingen toelaat.
Datum:1 nov 2020 →  Heden
Trefwoorden:multiagent versterkend leren, Gedistribueerd diep leren
Disciplines:Adaptive agents en intelligente robotica, Machine learning en besluitvorming