Op vrijdag 2 mei vond in de vergaderzaal van het Instituut voor de Nederlandse Taal (INT) een bijeenkomst plaats voor de zogeheten courantiers, vrijwilligers die hun medewerking verlenen aan het beter toegankelijk maken van 17e-eeuwse kranten.

Tijdens een kopje koffie met een stukje vlaai maakten deze vrijwilligers (nader) kennis met elkaar, wisselden zij ervaringen uit en luisterden zij naar een presentatie van Roland de Bonth waarin uitgelegd werd hoe je met behulp van het Couranten Corpus taalkundig onderzoek kunt doen.
Couranten Corpus
Het Couranten Corpus bestaat uit een selectie van zeventiende-eeuwse Nederlandse kranten die op Delpher beschikbaar zijn. De eerste versie ervan kwam op 12 mei 2022 online. Momenteel bevat dit corpus 109.532 artikelen uit 13 kranten, samen goed voor 18.926.425 woorden.
In het najaar van 2022 is een vervolgproject gestart om de complete Amsterdamse Courant beschikbaar te maken voor onderzoekers en andere belangstellenden. Anders dan bij het oorspronkelijke project uit 2014 worden de kranten niet letter voor letter overgetypt, maar wordt uitgegaan van de tekst zoals die automatisch is herkend door het aan de universiteit van Innsbruck ontwikkelde computerprogramma Transkribus.
Het INT heeft een op dit project toegesneden handleiding gemaakt. De vrijwilligers controleren aan de hand daarvan eerst de toegekende lay-out, vervolgens de tekst en voorzien tenslotte de verschillende tekstelementen zoals koppen en advertenties van een tag. De Amsterdamse Courant bestaat uit 2402 exemplaren, die tezamen 5235 pagina’s tellen. Eind augustus 2024 was de controle ervan afgerond. De Oprechte Haerlemse Courant met 2733 exemplaren, die 5470 pagina’s tellen, werd vanaf dat moment onder handen genomen. Inmiddels is exact 50% daarvan klaar.
Ook vrijwilliger worden?
Mensen die interesse hebben om als vrijwilliger mee te werken aan het beter toegankelijk maken van zeventiende-eeuwse kranten, zijn van harte welkom; zij kunnen zich melden bij Nicoline van der Sijs.