Het Couranten Corpus omvat de zeventiende-eeuwse Nederlandse kranten die op Delpher beschikbaar zijn. De oudst overgeleverde kranten zijn gepubliceerd in 1618. Dit corpus bevat momenteel de inhoud van 13 kranten, 109.532 artikelen en 18.926.425 woorden. De informatie in deze kranten is van belang voor onderzoekers van verschillende disciplines, variërend van historici tot historische taalkundigen, literatuurwetenschappers en kunsthistorici.
Citizen science
Voor de Delpher-website heeft de Koninklijke Bibliotheek in Den Haag deze zeventiende-eeuwse kranten gescand. Deze scans zijn gelezen met optische tekenherkenning (OCR). OCR kon echter niet overweg met de oude lettertypen en teksten van deze kranten. Daarom heeft het Meertens Instituut een citizen science project opgezet, onder leiding van Nicoline van der Sijs. Met behulp van een collaboratieve webapplicatie, gemaakt door Rob Zeeman, werden alle kranten getranscribeerd en gecorrigeerd door meer dan 300 vrijwilligers van de Stichting Vrijwilligersnetwerk Nederlandse Taal. Vervolgens hebben de stagiaires Thomas Angenent, Aafje Baarslag, Rianne de Koning, Guido Moerdijk, Jeroen Pelkman en Lennart van Winzum de metadata gecontroleerd en gecorrigeerd en nieuwe metadata toegevoegd, bijvoorbeeld over genre (advertenties, landelijk nieuws, internationaal nieuws, etc.). De laatste correctie van de metadata werd uitgevoerd op de INT.
In de toekomst zullen transcripties van nieuw gedigitaliseerde kranten uit de zeventiende eeuw en kranten uit de achttiende eeuw aan het Couranten Corpus worden toegevoegd.