< Terug naar vorige pagina

Project

NEON: Nederlandstalige Ondertiteling.

Er is een grote nood aan ondertitelde nederlandstalige tv-programma's. Gebruikersgroepen dringen aan bij omroepen en overheid om de hoeveelheid ondertiteld materiaal op te voeren. Momenteel ondertitelt de VRT 65% van de nederlandstalige programma's, met de belofte om te stijgen tot 95% tegen 2010. Evenzo zal in Nederland NPO 95% van de uitzendingen moeten ondertitelen tegen 2010. Deze enorme toename van te ondertitelen programma's vereist grote investeringen in nieuwe technologieën en vraagt bijkomende mankracht. Eén van de technologieën die kan helpen, is spraakherkenning. Experimenten met spraakherkenning voor ondertiteling werden al uitgevoerd sinds de jaren '90. Sindsdien is de technologie snel geëvolueerd en momenteel wordt ze routinematig ingezet door verschillende omroepen, meestal in de vorm van 'respeaking" (waarbij de ondertitel uitgesproken wordt door een getraind persoon en daarna met een spraakherkenner wordt herkend). In dit project wordt een meer geavanceerde en minder arbeidsintensieve toepassinge van spraakherkenning voor ondertiteling geïmplementeerd, met name de alignering van bestaande teksten of scripts met gesproken woorden zodat ondertitels op de juiste momenten in beeld kunnen gebracht worden. Na alignering kan de gealigneerde tekst als dusdanig gebruikt worden, maar die kan ook verder gecomprimeerd worden tot kortere zinnen die beter geschikt zijn als ondertitels. De binnenkomende audiostroom wordt ook gesegmenteerd en geclusterd in verschillende sprekeres, zodat een visuele aanduiding op het scherm kan worden gegeven van de identiteit van de spreker (bv. met gekleurde ondertitels). Dit alles zal leiden tot een demonstrator voor (semi-)automatische ondertiteling in het Nederlands. Hiervoor wordt een spraakherkenner gebruikt, zodat in de achtergrond en als terugvalpositie ook het spraakherkenningsresultaat beschikbaar is als een transcriptie van de audiostroom. Deze demonstrator zal de leveranciers van programma's die al "respeaking" gebruiken, in staat stellen om de meer geavanceerde toepassing van spraakherkenning te evalueren.
Datum:1 apr 2008 →  30 nov 2009
Trefwoorden:Speech and text alignment, Automated subtitling, Speaker segmentation, Speech recognition
Disciplines:Linguïstiek, Theorie en methodologie van de linguïstiek, Andere linguïstiek en literatuurwetenschappen, Modellering, Biologische systeemtechnologie, Signaalverwerking