< Terug naar vorige pagina

Project

Termwise: De ontwikkeling van terminologische hulpbronnen.

Het TermWise Kennisplatform is een multidisciplinaire samenwerking tussen (toegepaste) linguïsten en computerwetenschappers van de K.U.Leuven-Associatie, gefinancierd door het Industrieel Onderzoeksfonds en met de expliciete doelstelling om gebruikersgeoriënteerde toepassingen te ontwikkelen op basis van bestaand fundamenteel wetenschappelijk onderzoek. In het bijzonder wil het platform software ontwikkelen die professionele taalgebruikers, zoals vertalers en tekstschrijvers, zal helpen om effectiever om te gaan met gespecialiseerde teksten. Deze teksten, bv. medische of juridische teksten, zijn immers doorspekt met domeinspecifiek jargon en terminologie. Een diepgaande kennis over de typische woorden en uitdrukkingen in een bepaalde discipline is onontbeerlijk om hoogstaande vertalingen of teksten af te leveren, maar helaas bieden de momenteel beschikbare hulpbronnen onvoldoende ondersteuning in verschillende opzichten. Daarom zal het kennisplatform computationele algoritmen voor kennisvergaring toepassen en verder ontwikkelen om zo rijke terminologische databanken te kunnen aanleggen op een tijds- en kostenefficiënte manier. De algoritmen zullen getest en gevalideerd worden in het domein van de Belgische rechtsterminologie in het Nederlands en Frans en dit in samenwerking met de Federale Overheidsdienst Justitie. De algoritmen zullen echter op een generische manier ontworpen worden met de expliciete bedoeling hen makkelijke overdraagbaar te maken naar andere talen en domeinen. Het kennisplatform concentreert zich op drie aspecten van de terminologische kennisverwerving: · Termextractie: De identificatie van woorden en uitdrukkingen die typisch zijn voor een bepaald domein, in dit geval de rechtstaal. Het platform beoogt een volledigere beschrijving van terminologische eenheden dankzij een geavanceerder termmodel dat rekening houdt met mogelijke variatie tussen juridische subdomeinen en door de integratie van recent ontwikkelde methodes uit de statistische corpuslinguïstiek. · Termalignering: Het vinden van equivalente termen in verschillende talen, in dit geval Nederlands en Frans. Het platform zal hiervoor statistische aligneringsalgortimen optimaliseren voor parallelle en vergelijkbare corpora. · Semantische modellering: De analyse van termbetekenis en hun typische gebruikscontexten. Het platform zal semantische vectorruimtes gebruiken om relatie tussen context en betekenis te modelleren. Het uiteindelijke doel van het kennisplatform is om de verworven terminologische kennis beschikbaar te stellen aan gebruikers in de vorm van een softwaretool die meertalige terminologische ondersteuning biedt. /* Style Definitions */ table.MsoNormalTable {mso-style-name:Standaardtabel; mso-tstyle-rowband-size:0; mso-tstyle-colband-size:0; mso-style-noshow:yes; mso-style-priority:99; mso-style-qformat:yes; mso-style-parent:""; mso-padding-alt:0cm 5.4pt 0cm 5.4pt; mso-para-margin-top:0cm; mso-para-margin-right:0cm; mso-para-margin-bottom:10.0pt; mso-para-margin-left:0cm; line-height:115%; mso-pagination:widow-orphan; font-size:11.0pt; font-family:"Calibri","sans-serif"; mso-ascii-font-family:Calibri; mso-ascii-theme-font:minor-latin; mso-hansi-font-family:Calibri; mso-hansi-theme-font:minor-latin; mso-fareast-language:EN-US;} TermWise: De Ontwikkeling van Terminologische Hulpbronnen Normal 0 21 false false false NL-BE X-NONE X-NONE /* Style Definitions */ table.MsoNormalTable {mso-style-name:Standaardtabel; mso-tstyle-rowband-size:0; mso-tstyle-colband-size:0; mso-style-noshow:yes; mso-style-priority:99; mso-style-qformat:yes; mso-style-parent:""; mso-padding-alt:0cm 5.4pt 0cm 5.4pt; mso-para-margin-top:0cm; mso-para-margin-right:0cm; mso-para-margin-bottom:10.0pt; mso-para-margin-left:0cm; line-height:115%; mso-pagination:widow-orphan; font-size:11.0pt; font-family:"Calibri","sans-serif"; mso-ascii-font-family:Calibri; mso-ascii-theme-font:minor-latin; mso-hansi-font-family:Calibri; mso-hansi-theme-font:minor-latin; mso-fareast-language:EN-US;} Het TermWise Kennisplatform is een multidisciplinaire samenwerking tussen (toegepaste) linguïsten en computerwetenschappers van de K.U.Leuven-Associatie, gefinancierd door het Industrieel Onderzoeksfonds en met de expliciete doelstelling om gebruikersgeoriënteerde toepassingen te ontwikkelen op basis van bestaand fundamenteel wetenschappelijk onderzoek. In het bijzonder wil het platform software ontwikkelen die professionele taalgebruikers, zoals vertalers en tekstschrijvers, zal helpen om effectiever om te gaan met gespecialiseerde teksten. Deze teksten, bv. medische of juridische teksten, zijn immers doorspekt met domeinspecifiek jargon en terminologie. Een diepgaande kennis over de typische woorden en uitdrukkingen in een bepaalde discipline is onontbeerlijk om hoogstaande vertalingen of teksten af te leveren, maar helaas bieden de momenteel beschikbare hulpbronnen onvoldoende ondersteuning in verschillende opzichten. Daarom zal het kennisplatform computationele algoritmen voor kennisvergaring toepassen en verder ontwikkelen om zo rijke terminologische databanken te kunnen aanleggen op een tijds- en kostenefficiënte manier. De algoritmen zullen getest en gevalideerd worden in het domein van de Belgische rechtsterminologie in het Nederlands en Frans en dit in samenwerking met de Federale Overheidsdienst Justitie. De algoritmen zullen echter op een generische manier ontworpen worden met de expliciete bedoeling hen makkelijke overdraagbaar te maken naar andere talen en domeinen. Het kennisplatform concentreert zich op drie aspecten van de terminologische kennisverwerving: · Termextractie: De identificatie van woorden en uitdrukkingen die typisch zijn voor een bepaald domein, in dit geval de rechtstaal. Het platform beoogt een volledigere beschrijving van terminologische eenheden dankzij een geavanceerder termmodel dat rekening houdt met mogelijke variatie tussen juridische subdomeinen en door de integratie van recent ontwikkelde methodes uit de statistische corpuslinguïstiek. · Termalignering: Het vinden van equivalente termen in verschillende talen, in dit geval Nederlands en Frans. Het platform zal hiervoor statistische aligneringsalgortimen optimaliseren voor parallelle en vergelijkbare corpora. · Semantische modellering: De analyse van termbetekenis en hun typische gebruikscontexten. Het platform zal semantische vectorruimtes gebruiken om relatie tussen context en betekenis te modelleren. Het uiteindelijke doel van het kennisplatform is om de verworven terminologische kennis beschikbaar te stellen aan gebruikers in de vorm van een softwaretool die meertalige terminologische ondersteuning biedt.
Datum:1 okt 2009  →  30 sep 2013
Trefwoorden:Specialised language use
Disciplines:Linguïstiek, Theorie en methodologie van de linguïstiek, Andere linguïstiek en literatuurwetenschappen