Crowdsourcing maakt 17e-eeuwse kranten op Delpher beter doorzoekbaar

Op Delpher, de website met historisch Nederlandse publicaties, is vanaf vandaag de transcriptie van 6000 Nederlandstalige kranten uit de 17e eeuw en een deel van de Tweede Wereldoorlogskranten doorzoekbaar. Op het Instituut voor de Nederlandse Taal (INT) wordt verder gewerkt aan het krantenmateriaal, ten behoeve van onderzoek naar het taalgebruik in de 17e eeuw.

Ruim 200 vrijwilligers hebben de afgelopen vijf jaar de krantenartikelen handmatig overgetikt en daarna het resultaat nog eens gecorrigeerd. Het crowdsourcingproject is uitgevoerd als samenwerking tussen de Koninklijke Bibliotheek, de nationale bibliotheek van Nederland, en het Meertens Instituut, onder leiding van senior-onderzoeker Nicoline van der Sijs.

Computertechnologie en oude schriften

Al die 17-eeuwse kranten stonden al geruime tijd op Delpher, tot nu toe waren ze alleen niet tot nauwelijks doorzoekbaar. De computertechnologie waarmee de kranten automatisch waren gelezen, kon namelijk niet overweg met de oude schriften waarin de kranten waren gezet: het gotische schrift en later een Romeins schrift dat afwijkt van het moderne. Als gevolg hiervan werden de meeste woorden die gebruikers in de oude kranten zochten, niet gevonden en áls een woord werd gevonden, stond er meestal iets anders in het origineel.

Verdere uitbreiding

Op het INT wordt er verder gewerkt aan het 17e-eeuwse krantenmateriaal: de metadata worden opgeschoond en verder uitgebreid met informatie over het genre, zoals binnenlands nieuws, buitenlands nieuws of advertenties. Daarnaast worden de data voorzien van taalkundige informatie zoals lemma (trefwoord) en woordsoort. De resultaten komen op termijn via een zoekapplicatie beschikbaar. Onderzoeker Nicoline van der Sijs en promovenda Machteld de Vos doen bovendien onderzoek naar verschillende aspecten van het taalgebruik van de 17e-eeuwse kranten.

Op deze website maken wij gebruik van cookies.