Project
Evolutionaire Genoomstudie van Melkzuurbacteriën
Melkzuurbacteriën zijn verantwoordelijk voor verschillende types van gefermenteerde voeding en vormen een onderdeel van onze natuurlijke microbiota. Het doel van dit doctoraat was om gebruik te maken van publiek beschikbare genomen van melkzuurbacteriën om nieuwe inzichten te genereren in hun evolutionaire geschiedenis en habitat-adaptatie. Om dit mogelijk te maken werden belangrijke taxonomische en computationele uitdagingen overwonnen.
Drie groepen van melkzuurbacteriën werden bestudeerd in deze thesis. De eerste was de Lacticaseibacillus casei groep. Dit is een cluster van drie nauw verwante species waarvan veel stammen toepassingen hebben als orale probiotica en voor de fermentatie van zuivelproducten, maar waarover veel verwarring bestaat rond de classificatie van stammen van de species L. casei, L. paracasei en L. zeae. Gebaseerd op een vergelijking van publiek beschikbare genomen van deze groep, werd de taxonomische verwarring opgehelderd. Verder werden een aantal potentieel habitat-gerelateerde eigenschappen geïdentificeerd die de species van elkaar konden onderscheiden. Bijvoorbeeld, genen die codeerden voor catalases en potentiële epitheeladhesines werden gedetecteerd in L. casei genomes, en superoxide dismutase genen werden gevonden in L. paracasei genomen. Die eersten waren zeer relevant, aangezien een L. casei stam met probiotisch potentieel voordien geïsoleerd was uit de bovenste luchtwegen van een gezonde vrijwilliger. De volgende groep die bestudeerd werd in de thesis was de familie Lactobacillaceae. Hiervoor werd een nieuwe computationele tool ontwikkeld om de core genen van een set genomen te identificeren in lineaire tijd. Deze tool werd dan gebruikt om verschillende foute classificaties op species niveau te corrigeren van stammen die tot deze familie behoren, en om fusies en splitsingen van gepubliceerde species voor te stellen. Bijvoorbeeld, een fusie van de species Weissella thailandensis en Weissella jogaejeotgali werd voorgesteld, en ook een splitsing van het species Ligilactobacillus aviarius. Daarbovenop werd het genus Lactobacillus gesplitst in 25 kleinere genera en werden de families Leuconostocaceae en Lactobacillaceae samengevoegd gebaseerd op een analyse van onder andere signature genen om biologische relevante clades te vinden. Ten slotte werd er een nieuwe tool ontwikkeld die een pangenoom (de collectie van alle genenfamilies in een set genomen) kan bepalen in bijna-lineaire tijd. Deze tool werd dan toegepast om een pangenoom database te creëren voor de orde Lactobacillales. De database werd vervolgens geëxploreerd om een aantal trends te identificeren in de evolutie van deze bacteriën. Het werd bijvoorbeeld gevonden dat het aantal core genen van een species relatief traag verandert, en dat genen die coderen voor aminozuurtransporters veel duplicaties hebben ondergaan in de evolutionaire geschiedenis van deze orde.