< Terug naar vorige pagina

Project

Data compressie voor probabilistische logica

Het leren van propositionele logische theorieën uit voorbeelden is één van de belangrijkste problemen bij machine learning, evenals de meest basale setting voor inductief logisch programmeren en logisch en relationeel leren. Een van de meest fascinerende aspecten van logisch leren is dat van het uitvinden van predikaten, dat wil zeggen het vermogen om automatisch nieuwe predikaten in de taal te introduceren die niet alleen de gegevens comprimeren, maar ook inzicht verschaffen in de onderliggende regelmatigheden. In dit proefschrift zullen we datacompressie en predikatenuitvindingstechnieken onderzoeken in de context van probabilistische logica, dat wil zeggen in een setting die expliciet onzekerheid ondersteunt op het niveau van zowel de gegevens als de beschreven regelmatigheden. Dit is op zichzelf een interessante omgeving, omdat het nieuwe manieren mogelijk maakt om inzichten te verkrijgen in onzekere, gestructureerde domeinen en in de bredere context van inferentiebenaderingen voor probabilistische logica. De modernste inferentietechnieken voor probabilistische logische talen, waaronder DTAI's probabilistische logische programmeertaal ProbLog, zijn inderdaad gebaseerd op een reductie tot gewogen modeltelling, waarbij gewogen propositionele CNF-formules de centrale gegevensstructuur zijn. De grootte van deze formules is een belangrijke beperkende factor, en het kunnen comprimeren ervan is daarom een veelbelovende richting om de stand van de techniek verder te ontwikkelen. Dit proefschrift zal datacompressietechnieken ontwikkelen voor probabilistische logica in twee fasen. In de eerste fase zullen we ons concentreren op het fundamentele geval van het comprimeren van gewogen propositionele CNF-formules, inclusief degene die zijn gegenereerd tijdens ProbLog-inferentie. In de tweede fase zullen we voortbouwen op de inzichten verkregen uit de eerste fase om technieken te ontwikkelen die het potentiële knelpunt van het eerst construeren van de volledig ongecomprimeerde CNF vermijden, en direct opereren op het niveau van relationele representaties.

Datum:17 feb 2021 →  Heden
Trefwoorden:probabilistic datacompression
Disciplines:Computationele logica en formele talen
Project type:PhD project