Project

Machine learning-methoden met een afwijsoptie voor selectieve bevoorschotting en meer

Hoewel het ontwerp en de toepassing van kredietrisicomodellen uitgebreid onderzocht is in literatuur over operationeel onderzoek, kreeg de gebruikssituatie van selectieve bevoorschotting (i.e. 'spot factoring') veel minder aandacht, ondanks de subtiele verschillen met typische kredietoplossingen en het toenemende belang ervan als financieringsoplossing voor bedrijven met een hoger risico na de financiële en covidcrisis. Vanuit deze onderzoekskloof onderzoeken we methoden voor machine learning (ML) die de uitkomst van facturen voorspellen. Gemotiveerd door het toepassingsdomein gaan we vervolgens verder met het ontwikkelen van generieke ML-technieken voor classificatie met een afwijsoptie.

In het eerste deel van dit werk breiden we het concept uit van op ML gebaseerd wanbetalingsrisico op de korte termijn (i.e. 'short-term probability of default') naar de context van selectieve bevoorschotting. We identificeren een fijnkorreligere taak voor het inschatten van risico's met betrekking tot de achterstalligheid van facturen en stellen drie mogelijke ML-benaderingen voor deze taak voor. We bespreken hun geschiktheid op basis van taakgebaseerde en winstgestuurde evaluatiemetrieken bij vergelijkingen op een dataset i.v.m. selectieve bevoorschotting uit de praktijk. Regressiemodellen en - in mindere mate - learning-to-rank-methoden laten over het algemeen goede prestaties zien voor deze metrieken.

De toepasbaarheid in het echte leven van ML-methoden op de binnenkomende populatie bij een zogenaamde 'spot factor' blijft beperkt vanwege een probleem dat bekend is in de kredietrisicogemeenschap: steekproefselectiebias. Deze vertekening treedt op omdat de modellen geen kennis hebben van de uitkomst van gevallen die door de factor zijn afgewezen. We behandelen dit probleem in het tweede deel van de dissertatie en stellen de oplossing voor om geen voorspellingen te doen voor gevallen die anders zijn dan die waarop het model is getraind. We leggen de link tussen dit probleem en domeinen als de detectie van nieuwigheden, classificatie met een afwijsoptie en afwijsinferentie (i.e. 'reject inference'). Een vergelijking tussen vier classifiers, uitgerust met de mogelijkheid om af te zien van voorspellingen, biedt inzicht in hun prestaties voor de taak van zowel nieuwigheidsafwijzing als ambiguïteitsafwijzing in de context van selectieve bevoorschotting en daarbuiten.

Hoewel classificatie met een afwijsoptie recentelijk aan onderzoeksinteresse heeft gewonnen, zijn er maar weinig methoden die zowel ambiguïteit als nieuwigheden afwijzen. In de laatste fase van deze studie stellen we daarom een methodologie voor, voor zowel ambiguïteits- als nieuwigheidsafwijzing door generatieve klasse-specifieke modellen te combineren om classificatie met subsets als output uit te voeren. We bepalen drempelwaarden voor elke klasse door verschillende metrieken te optimaliseren met behulp van ROC-analyse. Op deze manier kan de methode zowel ambiguïteit (tussen enkele klassen) als nieuwigheid aangeven. Een experimenteel onderzoek met verschillende datasets uit het echte leven verifieert de verdiensten van de voorgestelde aanpak.

Datum:7 jun 2021 → 20 okt 2022

Trefwoorden:Machine learning, Supervised learning, Credit scoring

Disciplines:Machine learning en besluitvorming

Project type:PhD project

Project

Machine learning-methoden met een afwijsoptie voor selectieve bevoorschotting en meer

Onderzoekers

Project partners

Financiering

Publicaties