< Terug naar vorige pagina

Project

Machine Learning for Predictive and Prescriptive Process Monitoring

Predictive process monitoring (PredPM) is een relatief jong en levendig onderzoeksveld dat zich bezighoudt met het doen van voorspellingen over bedrijfsprocessen. Tot nu toe hebben echter weinig PredPM-methoden of -toepassingen hun weg naar de praktijk gevonden. Het werk dat in dit proefschrift wordt gepresenteerd, bouwt voort op en draagt bij aan de huidige literatuur. Tegelijkertijd wil het de weg effenen voor praktische implementatie. Om deze reden hebben we onze inspanningen gericht op het gebruik van vijf hefbomen om vooruitgang te boeken in de richting van dit doel: (1) nauwkeurigheid, (2) snelheid, (3) robuustheid, (4) evaluatie en selectie en (5) beslissingsondersteuning. De laatste hefboom ''beslissingsondersteuning'' overtreft de loutere voorspellingen over processen en betreft het formuleren van beslissingen om de uitkomsten van lopende processen daadwerkelijk te optimaliseren. Prescriptive process monitoring (PresPM) is de overkoepelende term voor werk op dit gebied.

Dit proefschrift levert in meerdere opzichten waardevolle bijdragen aan de bestaande literatuur. Ten eerste stellen we  preprocessing technieken voor om bias in de test set te verwijderen en pleiten we voor een schone scheiding van trainings- en test sets om gegevenslekken te voorkomen. Deze zorgvuldig geselecteerde  preprocessing technieken maken modellen meer robuust en ondersteunen de beoefenaar bij evalueren en het selecteren van modellen. We pleiten ook voor het gebruik van benchmarks om PredPM-onderzoeksresultaten beter vergelijkbaar te maken dan ze nu zijn.

Ten tweede introduceren we convolutionele neurale netwerken (CNN) voor zowel uitkomst- als resttijdvoorspellingstaken in PredPM. In onze experimenten was CNN sneller en meer nauwkeurig dan de long short-term memory (LSTM) -netwerken die onderzoekers vaak gebruikten in werk voorafgaand aan het onze.

Ten derde gebruiken we Bayesiaanse neurale netwerken (BNN) met loss attenuation om op onzekerheid gebaseerde modellen te trainen om de resterende tijd en resultaten van bedrijfsprocessen te voorspellen. In onze experimenten lieten onzekerheidsschattingen toe om de nauwkeurigheid van voorspellingen te evalueren en diegene te selecteren die vooraf ingestelde nauwkeurigheidsdrempels overschreden. Betrouwbaarheidsintervallen kunnen worden geconstrueerd op basis van de onzekerheidsschattingen. Bovendien waren de ingezette technieken snel en leverden ze nauwkeurigere voorspellingen op. Aangeleerde onzekerheid houdt de belofte in om het vertrouwen van gebruikers in hun procesvoorspellingssystemen te vergroten, een betere samenwerking tussen mensen en deze systemen te bevorderen en eerdere implementaties met kleinere datasets mogelijk te maken.

Ten vierde, wat betreft de ondersteuning van de besluitvorming, hebben we experimenten uitgevoerd met timed process interventions met synthetische gegevens die echte online reinforcement learning (RL) en de vergelijking met causale inferentie (CI) mogelijk maken en een nauwkeurige evaluatie van de resultaten mogelijk maken. In onze experimenten presteerde de online RL policy beter dan CI en was het tegelijkertijd robuuster. Niettemin heeft CI policy ook nuttig beleid geproduceerd en zou het zijn verdiensten kunnen hebben in omgevingen waar online leren geen optie is.

Ten slotte beschrijven we experimenten waarbij het gebruik van onzekerheidsschattingen door het stacking model van een ensemble de nauwkeurigheid ervan verbetert. We presenteren ook een nieuwe neurale netwerkcel voor PredPM-taken, de multi-dilational convolutional unit (MDCU). In de meeste scenario's in onze experimenten presteerde MDCU beter dan zowel CNN als LSTM in termen van nauwkeurigheid en was het veel sneller dan LSTM.

De meeste van deze technieken en suggesties zijn klaar en relatief eenvoudig te implementeren. Door tegelijkertijd aan verschillende belangrijke hefbomen te werken, kunnen ze gebruikers motiveren om de sprong te maken naar de real-life toepassing van PredPM en PresPM voor hun bedrijfsprocessen.

 

Datum:23 apr 2019 →  23 jun 2023
Trefwoorden:deep learning, process mining, e-learning, machine learning
Disciplines:Kennisrepresentatie en redenering, Machine learning en besluitvorming
Project type:PhD project