Lancering Gesproken Corpus van de Zuidelijk-Nederlandse Dialecten

Berichtauteur Door Redactie
Berichtdatum 05/02/2025
Leestijd 1 minuut Leestijd 1 minuut

/ Actueel / Nieuws / Lancering Gesproken Corpus van de Zuidelijk-Nederlandse Dialecten /

Het Gesproken Corpus van de Zuidelijk-Nederlandse Dialecten (GCND) is het allereerste geparsete corpus van gesproken Nederlandse dialecten. Dit unieke taalkundige hulpmiddel biedt waardevolle data voor onderzoek naar dialecten in België, Nederland en Noord-Frankrijk. Het Instituut voor de Nederlandse Taal (INT) ontwikkelde de applicaties om in het corpus te kunnen zoeken.

De inhoud van het corpus bestaat uit:

1.206 sprekers, de oudste geboren in 1871
Opnames uit 639 unieke locaties
Meer dan 430 uur aan dialectopnames
650 opnamesessies met gedetailleerde transcripties
4,77 miljoen tokens, waaronder 50.111 handmatig geverifieerde zinnen in de GrETEL Treebank

Dankzij extra financiering van het Fonds Wetenschappelijk Onderzoek – Vlaanderen (GCND+) breiden we het corpus verder uit met meer transcripties, inclusief noordelijke dialecten uit de collectie van het Meertens Instituut, en verfijnen we de grammaticale annotaties.

Zelf aan de slag met het GCND? Het corpus is online beschikbaar via CLARIN: gcnd.ivdnt.org. Vanuit die applicatie is er een link naar nog een applicatie in GrETEL, waarin de syntactische annotatielaag benut kan worden.

Meer info: gcnd.ugent.be

Laatste nieuwsberichten:

Of bekijk alle nieuwsberichten.

Aanmelden nieuwsbrief

/ Alle nieuwsbrieven /

Laatste nieuwsberichten:

INT-nieuwsbrief

Terminologienieuwsbrief