< Terug naar vorige pagina

Project

SPRAAK2TAAL: extractie van geladenheid en ideologische context uit politieke redevoeringen - een onderzoek naar integratie van spraak- & taalverwerking.

Het SPRAAK2TAAL project onderzoekt hoe spraakherkenning (bijvoorbeeld het automatisch neerschrijven van interviews) en een taalmodule (bijvoorbeeld automatisch samenvatten) optimaal kunnen samenwerken in het Clarin raamwerk. Als case-studie is gekozen voor "extractie van geladenheid en ideologische context uit politieke redevoeringen". Deze keuze is gebaseerd op haalbaarheid (verzorgde spraak, geen afhankelijkheden van nog te ontwikkelen Clarin modules, een taalmodule die met alle modaliteiten van een spraakherkenner kan weerken), interesse vanuit de humane wetenschappen en uitbreidbaarheid van de techniek. Het SPRAAK2TAAL project zal: - Het nut onderzoeken van de verschillende types uitvoer die de spraakherkenner kan genereren (beste zin, zin met parallelle alternatieven of woordgrafe) voor de taalmodule. - De open-source spraakherkenner SPRAAK daartoe aanpassen, met aandacht voor het conform maken van in- en uitvoer aan de Clarin standaarden. - D.m.v. probabilistische latente modellen - een techniek die zowel biij taal- als spraakverwerking gebruikt wordt - het taalmodel van de spraakherkenner automatisch aanpassen aan het type taalgebruik (politieke redevoeringen).
Datum:1 okt 2010 →  30 sep 2012
Trefwoorden:Automatic summarization, Speech recognition
Disciplines:Computer hardware, Computertheorie, Scientific computing, Andere computer ingenieurswetenschappen, informatietechnologie en mathematische ingenieurswetenschappen, Artificiële intelligentie, Cognitieve wetenschappen en intelligente systemen, Modellering, Biologische systeemtechnologie, Signaalverwerking