Categorieën
Nieuws

GaLAHaD & LAnCeLoT

Tijdens een workshop op 9 april introduceerden we twee tools voor het (automatisch) taalkundig verrijken van historische teksten.

Historische teksten vormen een belangrijke bron voor onderzoek in de historische taalkunde en digital humanities. Taalkundige verrijking (annotatie), zoals het toekennen van een modern Nederlands lemma en een woordsoort, vergemakkelijkt het doorzoeken en analyseren van deze teksten, zonder dat spellingvariatie een hindernis vormt. 

Tijdens de workshop in het kader van SSHOC-NL Taak 3.1 introduceerden we GaLAHaD en LAnCeLoT, twee krachtige tools ontwikkeld door het Instituut voor de Nederlandse Taal voor het automatisch verrijken en manueel verbeteren van taalkundige annotatie in historische corpora

  • GaLAHaD (Generating Linguistic Annotations for Historical Dutch) biedt een flexibele omgeving voor automatische verrijking en evaluatie. Gebruikers kunnen automatisch woordsoort en lemma laten toevoegen door de machine en daarna de resultaten inspecteren, en de prestaties van verschillende tools analyseren aan de hand van een opgegeven gouden standaard. 
  • LAnCeLoT (Linguistic Annotation Corpus Laundry Tool) stelt onderzoekers in staat om verrijkingen handmatig te corrigeren en te verfijnen, wat essentieel is voor hoogwaardige corpusanalyse. 

Laatste nieuwsberichten:

Of bekijk alle nieuwsberichten.