< Terug naar vorige pagina

Project

A matter of time - leveraging time series data for business applications.

Het onderwerp van dit proefschrift wordt mooi weerspiegeld door de titel - 'a matter of time' -, aangezien we verschillende manieren verkennen om gegevens te gebruiken, nl. 'matter', die overheen de tijd worden verzameld. Dit wordt steeds gekoppeld aan hoe dit type van data kan worden geïntegreerd binnen bedrijfscontexten. Tijdreeksgegevens geven de veranderingen weer van een bepaald kenmerk in de loop van de tijd en kunnen worden verzameld voor elke verklarende of doelvariabele. Tijdreeksen maken daarom al tientallen jaren onderdeel uit van bedrijfsapplicaties en werden reeds uitgebreid bestudeerd in zowel de academische literatuur als in praktische toepassingen. Dit werk omvat beide zijden van dit spectrum en probeert zowel theoretische als praktische standpunten over het onderwerp te combineren. Dit proefschrift heeft daarom twee thema's: bedrijfsgericht onderzoek, dat business concepten wil integreren in toepassingen met tijd\-reeksen in het algemeen, en toepassingsgericht onderzoek, dat bekijkt hoe tijdreeksgegevens kunnen worden gebruikt in specifieke case studies. Binnen deze twee secties definiëren we drie belangrijke onderzoeksonderwerpen: winstgedreven voorspellingen, modelautomatisering en voordeel halen uit tijd\-reeksgegevens in applicaties.

In de context van winstgedreven voorspellingen, introduceren we een 'verwachte winst' functie die kan worden gebruikt voor verkoopvoorspelling\-en en die uitgebreid werd getest op datasets van The Coca-Cola Company. Als voorspellingsmodellen geen nauwkeurige predicties kunnen produceren, leidt dit tot een stijging in de kosten, b.v. door over-stock. We bereken\-en de verwachte winst van een voorspelling door de accuraatheid ervan te combineren met een winstmarge voor een bepaald product, die kan worden bepaald door een expert. De resulterende formule is eenvoudig aan te passen aan elke situatie en makkelijk interpreteerbaar als de potentiële monetaire waarde van een voorspelling. We tonen aan dat deze functie kan worden gebruikt voor het modelleren en evalueren van voorspellingen, waarbij ze kan vergeleken worden met de traditionele metrieken om het uiteindelijke model te selecteren.

Het tweede onderwerp van het bedrijfsgerichte onderzoek betreft de automatisering van voorspellende modellen en analyses in het algemeen. Model\-automatisering kan om twee verschillende redenen nuttig zijn in zakelijke contexten. Ten eerste, als er te veel analytische modellen zijn om te trainen, kan het voordelig zijn om een data-gedreven manier te vinden om deze model\-len te parametriseren op basis van hun input. Door dit proces te automatiseren, zijn er minder analytische experts nodig en kunnen de modellen gemakkelijker worden gedeeld. In dit proefschrift onderzoeken we daarom hoe we de verwachte winst functie kunnen combineren met het automatisch selecteren van parameters en variabelen voor verkoopsvoorspellingen. We proberen zelfs de zoektocht naar de juiste parameters te optimali\-seren in plaats van de \textit{brute force} benadering te gebruiken door ons te richten op evolutionaire algoritmes. Het tweede gebruik voor geautomatiseerde ana\-lyses wordt vooral duidelijk bij een volledig gebrek aan analytische expertise, b.v. in kleinere bedrijven. Analytics-as-a-Service (AaaS) biedt een mogelijke oplossing voor dit probleem door web-gebaseerde platforms aan te bieden die kunnen worden gebruikt om kant-en-klare modellen te implementeren. Ons onderzoek focust op de potentiële gebruikers van deze AaaS-tools en concludeert dat sommige beginnende gebruikers voldoende resultaten kunnen behalen als ze aan bepaalde eisen voldoen.

Het laatste onderwerp van dit proefschrift is moeilijk te generaliseren, omdat alle conclusies onvermijdelijk gelinkt zijn aan de specifieke toepas\-sing van het betreffende hoofstuk. In de eerste studie gebruiken we de hiërar\-chische structuur van de tijdreeksgegevens om betere voorspellingen te genere\-ren door een \textit{bottom-up} benadering te gebruiken. Verder bekijken we het potentieel van gegevens over websitebezoeken om de intentie vast te leggen van een donor om in de nabije toekomst te doneren. In het tweede project richten we ons op tijdreeksen als middel om dynamische kenmerken aan te pakken voor een churn toepassing. In een wereld waar dagelijks een grote hoeveelheid aan gegevens wordt aangemaakt en verzameld, moeten we ons meer bewust worden van het dynamische aspect van al deze gegevens. Veel analytische taken houden bijvoorbeeld rekening met het gedrag van gebruik\-ers en gaan ervan uit dat de meest recente gegevens over een persoon de hoogste voorspellende waarde hebben. Wij wilden echter onderzoeken of het vastleggen van een verandering in dit gedrag uiteindelijk tot een beter presterend model zou leiden of niet. Concreet bekijken we een classificatie die erop gericht is om churners van een telecommunicatiebedrijf te identificeren door de veranderingen in hun records met belgegevens te modelleren.

Kortom, dit proefschrift onderzoekt de verschillende gebruiken van tijd\-reeksgegevens in verscheidene bedrijfstoepassingen. Dit werk toont de mogelijkheden voor dit type van gegevens aan, dat al wel in veel bedrijven aanwezig is, maar nog niet zijn volledige potentieel heeft bereikt.

Datum:1 okt 2014 →  22 jun 2018
Trefwoorden:Forecasting, Time series, Predictive analytics
Disciplines:Artificiële intelligentie, Cognitieve wetenschappen en intelligente systemen, Toegepaste wiskunde, Economische ontwikkeling, innovatie, technologische verandering en groei, Bedrijfsadministratie en boekhouding, Management
Project type:PhD project