< Terug naar vorige pagina

Project

Gebruiker modellering voor gepersonaliseerde Ad retrieval

Het tijdperk van Sociale Media-zoals we het vandaag kennen-begon in het begin van de jaren 2000. Sociale media maken het delen van virtuele content mogelijk op een manier die fundamenteel verschillend is dan voorheen. Sociale media bijdragen worden niet langer gemaakt en gepubliceerd door specifieke individuen, maar worden continu aangepast door alle gebruikers op collaboratieve wijze. Tegenwoordig gebruiken mensen over de hele wereld sociale media als \'e\'en van hun belangrijke vormen van communicatie en vertrouwen ze op sociale media voor nieuws en informatie. Het grote aantal sociale media gebruikers schept een unieke gelegenheid voor onderzoekers om het modelleren van gebruikers (``user modeling'') te bestuderen. Er bestaan veel toepassingen in een breed gamma aan domeinen zoals marketing, rechtshandhaving, en gerichte reclame, die baat hebben bij betrouwbare methoden om gebruikers te modelleren.  De traditionele aanpak om informatie van gebruikers te vergaren, doet een beroep op enquêtes die door de gebruiker ingevuld moeten worden. Dit is tijdrovend en onpraktisch voor online gebruikers. Gebruikers genereren constant content over zichzelf, hun levensstijl, smaken en voorkeuren op sociale media platformen. Deze door de gebruiker gegenereerde content en sociale relaties tussen gebruikers en het platform op zich, bevatten een rijke hoeveelheid aan gebruikersdata. In deze thesis leggen we ons toe op het modelleren van gebruikers door het verwerken van gebruikersdata die beschikbaar is op sociale media platformen. We maken gebruik van zowel door de gebruiker gegenereerde content als data over de relaties tussen gebruikers om automatisch eigenschappen van gebruikers, zoals leeftijd, geslacht en persoonlijkheidskenmerken af te leiden.

Deze thesis heeft vijf hoofdcontributies. Ten eerste, om gebruikers van sociale media te modelleren op basis van hun gegenereerde content, maken we een vergelijkende analyse van de state-of-the-art van automatisch lerende methoden voor computationele persoonlijkheidsherkenning op een gevarieerde verzameling van sociale media benchmark datasets. Aanvullend aan de door de gebruiker gegenereerde content, modelleren we gebruikers a.d.h.v.~hun sociale relationele content zoals hun vriendschap-connecties. Onze tweede contributie is een nieuw graaf mining techniek die zich dynamisch aanpast aan de onderliggende karakteristieken van de connecties in het netwerk om het profiel van sociale media gebruikers te infereren. Ten derde, stellen we het eerste raamwerk voor statistisch relationeel leren (SRL) voor dat het redeneren met zachte kwantoren zoals `de meeste' en `enkele' mogelijk maakt, om een betere modellering van relationele content in sociale media mogelijk te maken. We tonen aan dat het gebruik van de zachte kwantoren niet alleen de expressiviteit van de taal verhoogt, wat toelaat het gedrag van gebruikers beter te modelleren, maar dat dit ook accuratere voorspellingen over het profiel van de gebruiker zoals leeftijd en geslacht toelaat. Onze vierde contributie is een nieuw SRL model dat door de gebruiker gegenereerde content integreert met content over de relaties tussen gebruikers om het gedrag van de gebruiker gezamenlijk te modelleren. We stellen nieuwe sub-modellen voor gebaseerd op gebruiker-item relaties in ons SRL fusie model. Ons fusie model incorporeert op succesvolle wijze meerdere informatiebronnen en overtreft de performantie van competitieve methoden die enkel één informatiebron gebruiken om gebruikers in sociale media te modelleren. Ten vijfde, stellen we een nieuw diep neuraal netwerk fusie raamwerk voor om sociale media gebruikers te modelleren gegeven hun berichten, profielfoto en pagina's die ze leuk vinden, om de leeftijd, geslacht en persoonlijkheidskenmerken van een gebruiker af te leiden. We stellen een stapelstrategie voor om de capaciteiten van het fusie raamwerk voor multi-task leren te benutten en stellen een hybride fusie proces voor dat modaliteiten op zowel feature- als beslissingsniveau integreert. De resultaten tonen het voordeel van een hybride fusie framework aan in het voorspellen van gebruikersprofielen, met zeer accurate resultaten in leeftijds- en geslachtspredictie.

De technieken die we presenteren in de deze thesis zijn empirisch ge\"evalueerd op benchmark datasets van Facebook, Youtube, Twitter en Netlog met data van duizenden tot miljoenen gebruikers.

Datum:5 nov 2012 →  27 jun 2017
Trefwoorden:User modeling, Social media, Machine learning
Disciplines:Computer hardware, Computertheorie, Scientific computing, Andere computer ingenieurswetenschappen, informatietechnologie en mathematische ingenieurswetenschappen, Toegepaste wiskunde, Computerarchitectuur en -netwerken, Distributed computing, Informatiewetenschappen, Informatiesystemen, Programmeertalen, Theoretische informatica, Visual computing, Andere informatie- en computerwetenschappen
Project type:PhD project