< Terug naar vorige pagina

Project

Methodes om tijdreeksanalyse te automatiseren met toepassingen in gezondheidszorg

bijvoorbeeld, meten continu onze hartslag, aandelenhandelaars observeren dagelijks de aandelenkoersen, en meteorologen analyseren veranderingen in het weer. Tijdreeksen bestaan vaak uit een groot aantal observaties, en een manuele analyse van deze observaties kan complex en tijdsintensief zijn. Daarom hebben we methodes nodig die gebruikers helpen door de analyse van tijdreeksen te automatiseren.

Deze thesis focust zich op twee taken: feature constructie en wisselpunt detectie. Het doel is om drie uitdagingen aan te pakken die momenteel niet opgelost worden door bestaande methodes om automatisch tijdreeksen te analyseren.

Ten eerste, huidige feature constructie methodes analyseren elke tijdreeks afzonderlijk. Door relaties tussen verschillende tijdreeksen achterwege te laten, kunnen deze methodes belangrijke features over het hoofd zien.

Ten tweede, automatische feature constructie methodes zijn volledig datagedreven. Echter, domeinexperten kunnen vaak nuttige suggesties maken over welke features al dan niet relevant kunnen zijn. Helaas maken huidige methodes geen gebruik van zulke suggesties.

Ten derde, wisselpunt detectie methodes zijn vaak volledig gesuperviseerd of volledig niet-gesuperviseerd. Enerzijds kunnen gesuperviseerde methodes accuraat wisselpunten vinden door gebruik te maken van geannoteerde data. Het nadeel van deze methodes is echter dat het annoteren van de data tijdsintensief is. Anderzijds hebben niet-gesuperviseerde methodes geen geannoteerde data nodig. Echter, deze methodes moeten in de plaats daarvan assumpties maken over welke veranderende eigenschappen van de tijdreeks gerelateerd zijn aan de toestand van de reeks. Deze assumpties kunnen helaas fout zijn en tot andere wisselpunten leiden dan de wisselpunten die de gebruiker verwacht.

Deze thesis heeft vijf hoofdbijdragen. De eerste twee bijdragen bestaan uit twee methodes voor automatische tijdreeksanalyse die de hierboven beschreven uitdagingen aanpakken. De eerste bijdrage is een automatische feature constructie methode die gebruik maakt van relaties tussen meerdere tijdreeksen door verschillende tijdreeksen met elkaar te combineren. Deze methode kan domeinkennis gebruiken in de vorm van metadata en compatibiliteitsbeperkingen. De tweede bijdrage is een semi-gesuperviseerde wisselpunt detectie methode die gebruik maakt van actief leren om geannoteerde date te verkrijgen.

In de laatste drie bijdragen evalueren we de performantie van onze automatische feature constructie methode op tijdreeksen verzameld in gezondheidstoepassingen. De eerste toepassing is een model voor activiteitsherkenning, waarin we nagaan hoe we de accuraatheid van het model kunnen verbeteren voor data verzameld in het dagelijks leven van patiënten. De tweede toepassing is een model om gewrichtsbelasting te schatten gebaseerd op data verzameld door een mobiele telefoon. De derde toepassing is een vergelijkende studie van manuele en automatisch gegenereerde features om epileptische aanvallen te detecteren.

Datum:20 sep 2017 →  19 okt 2022
Trefwoorden:machine learning, sensor data
Disciplines:Toegepaste wiskunde, Computerarchitectuur en -netwerken, Distributed computing, Informatiewetenschappen, Informatiesystemen, Programmeertalen, Scientific computing, Theoretische informatica, Visual computing, Andere informatie- en computerwetenschappen
Project type:PhD project