Project
Gestructureerde coalescentiemodellen voor nauwkeurige Bayesiaanse phylodynamische inferentie
Het aantal gevallen van infectieziekten, vooral die het gevolg zijn van nieuwe opkomende pathogenen, zijn in de afgelopen decennia aanzienlijk toegenomen. Deze toename is een gevolg door verschillende veranderingen van ecologische, biologische, sociaal-economische en politieke factoren (Chan et al., 2010). Deze factoren – waaronder de toegenomen wereldbevolking, vergrijzing, uitbreiding van het internationale reizen en handelen, verstedelijking en klimaatverandering – bevorderen de opkomst, evolutie en verspreiding van nieuwe pathogenen (Bloom et al., 2017), een die ook zeer waarschijnlijk zal blijven bestaan. De term fylodynamica beschrijft het gedrag van infectieziekten dat voortkomt uit een combinatie van evolutionaire en ecologische processen (Grenfell et al., 2004). In de laatste jaren zijn er verschillende toepassingen ontwikkeled om fylodynamische inferenties uit te voeren. Centraal in deze softwarepakketten staan statistische en computationele benaderingen die het mogelijk maken om de niet-geobserveerde – en doorgaans tijdsafhankelijke – fylogenie te reconstrueren gebaseerd op moleculaire sequenties die als het belangrijkste instrument van moleculaire epidemiologen dienen om biologische vragen over (virale) epidemieën te beantwoorden(Pybus en Rambaut, 2009). De doelstellingen van mijn doctoraat zijn drieledig en dragen allemaal bij aan het grondig begrijpen van de evolutie en verspreiding van pathogenen en het ontwikkelen van nieuwe hulpmiddelen en methodologieën. Doelstelling 1) Een gedetailleerd overzicht van de literatuur over fylogeografische analyses toegepast op het rabiësvirus (RABV). Rabiës of hondsdolheid is een zoönotische ziekte waar weinig aandacht aan word besteed. Desondanks, sterven er jaarlijks naar schatting 60.000 mensen aan hondsdolheid het begrijpen van de verspreiding en evolutie van het RABV is daarom ook van groot belang. Fylogeografische en fylodynamische analyses spelen hier dan ook een cruciale rol . Mijn doel was om een grondig overzicht te geven van gepubliceerde onderzoeken naar RABV die gebruik maakten van fylodynamische analyses, waarbij onderscheid wordt gemaakt op basis van de geografische resolutie geassocieerd met de beschikbare sequentiegegevens.". Ik heb speciale aandacht besteed aan omgevingsfactoren die volgens deze onderzoeken relevant zijn voor de verspreiding van RABV en adresseerde enkele hiaten in kennis omdat de beschikbare resultaten niet volledig werden benut. Doelstelling 2) Het ontwikkelen van een visualisatietool om fylogeografische resultaten gemakkelijk te interpreteren. Fylogeografische analyses bieden directe en bruikbare informatie, niet alleen voor onderzoekers en volksgezondheidsinstanties, maar ook voor artsen, zorgverleners en epidemiologen, die een belangrijke rol spelen bij het verzamelen van stalen voor sequencing. Met visualisatietools kunnen onderzoekers en zorgverleners het geografische bereik en de transmissie keten verkennen via een eenvoudig te gebruiken grafische interface. Hierdoor kan de output van fylogeografische analyses worden vertaald in concrete reacties. Doelstelling 3) Het ontwikkelen van een Bayesianse selectie algoritme voor het selecteren van een optimaal moleculaire klokmodel.Tijdenshet bestuderen van de evolutie van pathogenen maken moleculaire klokken het mogelijk om de genetische verschillen tussen stalen en het tijdstip van afname te combineren om tijd-gekalibreerde fylogenieën te schatten. Samen met de ontwikkeling van steeds complexere moleculaire klokmodellen komt de noodzaak om het meest geschikte model te bepalen om een bepaalde dataset nauwkeurig te analyseren. Het gebruik van een suboptimaal model kan tot onnauwkeurige resultaten leiden. Voor dit doel zijn de afgelopen jaren steeds nauwkeurigere marginale likelihood schatter ontwikkeld om de relatieve accuraatheid van modellen te vergelijken op basis van Bayesiaanse statistiek(Baele et al., 2016). Via gedetailleerde simulaties zal ik onderzoeken hoe deze schatters kunnen worden gebruikt om het optimale moleculaire klokmodel voor een gegeven dataset te bepalen. Ik zal speciale aandacht besteden aan vergelijkingen van moleculaire klokmodellen die sterk verschillende fylogenetische variablen verkennen.