< Terug naar vorige pagina

Project

Verrijking van context-bewuste vectorrepresentatiemodellen met 3-D structure informatie voor eiwitten, voor verbeterde voorspelling van eiwit-secreteerbaarheid en van de plaatsen op eiwitten die door kinases gemodificeerd kunnen worden

Diep machinaal leren forceert momenteel doorbraken in een variëteit aan voorspellingstaken in proteoomstudies. Langeafstandsinteracties tussen verschillende regio’s in eiwitsequenties worden hier nog niet optimaal in benut. Recentelijk hebben context-bewuste vectorrepresentatiemodellen een revolutionaire verbetering bewerkstelligd in het veld van natuurlijke taalverwerking, en ook voor het leren van eiwitrepresentaties werden hiermee al veelbelovende resultaten behaald. Ons doel is om deze zelf-superviserende representatiemodellen te verrijken door deze ook op structuurpredictie te trainen. We zullen bestuderen hoe dit kan bijdragen bij twee structuur-afhankelijke predictietaken. De eerste is eiwit-secreteerbaarheid in gist, een essentieel kenmerk in fundamentele biologie en biotechnologie. De tweede is de predictie van locaties in eiwitten die door kinases gemodificeerd kunnen worden. Voor beiden zijn er geannoteerde datasets voorhanden in ons labo, via nieuwe experimentele en data-extractiemethoden. Bovendien zullen we attributiemethoden gebruiken om te kijken welke sequentiële en structurele eigenschappen in de ingevoerde data doorslaggevend bleken te zijn in de predictiemodellen. In samenwerking met onze onderzoekers zullen we ook de fragmenten in het humane proteoom die door de nieuwe predictiemodellen als secreteerbaar voorspeld worden, experimenteel verifiëren, en zullen we voorspelde secreteerbaarheid-verbeterende modificaties evalueren.

Datum:1 nov 2020 →  31 okt 2023
Trefwoorden:contextbewuste inbeddingsmodellen
Disciplines:Computationele biomodellering en machine learning, Structurele bio-informatica en computationele proteomics, Machine learning en besluitvorming