Wilt u uit de eerste hand weten wat er in het Rampjaar 1672 gebeurde? Bent u benieuwd in welke jaren er wolvenplagen waren? Of zoekt u de oudste advertenties voor een geneesmiddel ‘voor alle Qualen op de Borst, Benaeutheden, Hoest en Sinckingen’? Dan kunt u te rade gaan in het Couranten Corpus, dat op 12 mei beschikbaar is gekomen bij het INT.
300 vrijwilligers
Het Couranten Corpus omvat de zeventiende-eeuwse Nederlandse kranten die op Delpher te vinden zijn. De kranten zijn door driehonderd vrijwilligers onder leiding van Nicoline van der Sijs zorgvuldig getranscribeerd en gecorrigeerd via een op het Meertens Instituut ontwikkelde crowdsource-omgeving. In 2020 ontving de dataset de Nederlandse dataprijs.
Metadata
De metadata van de artikelen zijn door stagiairs en medewerkers van het INT gecorrigeerd, waarbij alle artikelen eigen metadata hebben gekregen en alle dubbele kranten uit de dataset zijn verwijderd. Ook zijn nieuwe metadata toegevoegd, bijvoorbeeld over genre en nieuwssoort (advertenties, binnenlands nieuws, buitenlands nieuws, etc.). De gegevens zijn automatisch taalkundig verrijkt, zodat ze beter doorzoekbaar zijn. Het historisch lexicon van het INT helpt bovendien bij het vinden van spellingvarianten.
109.532 artikelen
Het omvangrijke corpus bevat momenteel de inhoud van 13 kranten, namelijk:
- Amsterdamse courant
- Courante uyt Italien, Duytslandt, &c.
- Europische courant
- Extraordinarisse Post-tijdinghe
- Haegse post-tydinge
- Haerlemse courante
- Oprechte Haerlemsche courant
- Opregte Leydse courant
- Ordinaris dingsdaeghse courante
- Ordinarisse middel-weeckse courante
- Tijdinghe uyt verscheyde quartieren
- Utrechtse courant
- VVeeckelycke courante van Europa
De kranten bevatten 109.532 artikelen en bijna 19 miljoen woorden. De informatie in deze kranten is interessant voor onderzoekers van verschillende disciplines, variërend van historici en historisch taalkundigen tot literatuurwetenschappers en kunsthistorici. Voor vragen kunt u zich richten tot projectleider Nicoline van der Sijs.