Het Gesproken Corpus van de Zuidelijk-Nederlandse Dialecten (GCND) is het allereerste geparsete corpus van gesproken Nederlandse dialecten. Dit unieke taalkundige hulpmiddel biedt waardevolle data voor onderzoek naar dialecten in België, Nederland en Noord-Frankrijk. Het Instituut voor de Nederlandse Taal (INT) ontwikkelde de applicaties om in het corpus te kunnen zoeken.
De inhoud van het corpus bestaat uit:
- 1.206 sprekers, de oudste geboren in 1871
- Opnames uit 639 unieke locaties
- Meer dan 430 uur aan dialectopnames
- 650 opnamesessies met gedetailleerde transcripties
- 4,77 miljoen tokens, waaronder 50.111 handmatig geverifieerde zinnen in de GrETEL Treebank
Dankzij extra financiering van het Fonds Wetenschappelijk Onderzoek – Vlaanderen (GCND+) breiden we het corpus verder uit met meer transcripties, inclusief noordelijke dialecten uit de collectie van het Meertens Instituut, en verfijnen we de grammaticale annotaties.
Zelf aan de slag met het GCND? Het corpus is online beschikbaar via CLARIN: gcnd.ivdnt.org. Vanuit die applicatie is er een link naar nog een applicatie in GrETEL, waarin de syntactische annotatielaag benut kan worden.
Meer info: gcnd.ugent.be
Laatste nieuwsberichten:
- Vincent Vandeghinste toegetreden tot CLARIN ERIC Board of Directors
- Lancering Gesproken Corpus van de Zuidelijk-Nederlandse Dialecten
- CLARIAH-VL+ krijgt financiering voor vier extra jaren
- Persbericht: Sjef Barbiers nieuwe directeur-bestuurder Instituut voor de Nederlandse Taal
- Persbericht – Fatbikes, supernota en Europapa: de Woordpeiling van 2024
Of bekijk alle nieuwsberichten.