Brieven als Buit

Het corpus Brieven als Buit (origineel) bevat 1.000 Sailing Letters: Nederlandse brieven uit de tweede helft van de 17e tot de vroege 19e eeuw van en aan het thuisfront, die zijn buitgemaakt door kapers en in Britse archieven zijn bewaard. De teksten in het corpus zijn aangevuld met taalkundige informatie. Brieven als Buit-2 is een aanvulling op het originele corpus en bevat ruim 1.300 Sailing Letters. Deze teksten zijn niet taalkundig verrijkt maar wel voorzien van metadata.

Tags: ,

Nederlab

Nederlab is een webinterface die onderzoekers in staat stelt verspreide digitale historische corpora als eenheid te doorzoeken en te analyseren; dit geldt zowel voor de teksten zelf als voor de metadata.

Tags: ,

Eindhoven-corpus

Het Eindhoven-corpus is een verzameling Nederlandstalige geschreven en (uitgeschreven) gesproken teksten uit de periode van 1960 tot 1976. Het bevat materiaal uit kranten en tijdschriften en correspondentie tussen de regering en de Staten-Generaal, en diverse gesproken bronnen. Het is in diverse fases verbeterd en inmiddels bruikbaar gemaakt in een hedendaagse corpusapplicatie.

Tags: ,

Corpus Middel­nederlands

Het Corpus Middelnederlands is een verzameling van ruim 350 Middelnederlandse rijm- en prozateksten uit de periode 1300-1550. Het corpus bevat veel literair materiaal, waaronder de Beatrijs en de Reynaert.

Tags: ,

Corpus Gysseling

Het Corpus Gysseling is een verzameling 13e-eeuwse Middelnederlandse teksten. Het zijn voornamelijk ambtelijke en literaire teksten die gebruikt zijn als bronnenmateriaal voor het Vroegmiddelnederlands Woordenboek (VMNW). De teksten in het corpus zijn aangevuld met taalkundige informatie.

Tags: ,

Corpus Oudnederlands

Het Corpus Oudnederlands is een verzameling van al het bekende Nederlandse woordmateriaal uit de periode 475-1200. Het bestaat uit drie grote teksten (Wachtendonkse Psalmen, Leidse Willeram, Mittelfränkische Reimbibel) en een aantal kleinere teksten, fragmenten, losse woorden en plaatsnamen. Het corpus is taalkundig verrijkt met woordsoort en lemma, en is gebruikt als bronnenmateriaal voor het Oudnederlands Woordenboek (ONW).

Tags: ,

Corpus Hedendaags Nederlands

Het Corpus Hedendaags Nederlands (CHN) is een groeiende tekstverzameling van meer dan 800.000 teksten uit kranten, tijdschriften, journaaluitzendingen en juridisch materiaal. Het corpus is automatisch aangevuld met taalkundige informatie zoals woordsoort en lemma.

Tags: ,

Corpora

Een corpus is een grote verzameling geschreven of gesproken teksten, gemaakt om een taal te kunnen bestuderen en beschrijven. Onze historische corpora zijn: het Corpus Gysseling, het Corpus Oudnederlands en het Corpus Middelnederlands. Ons hedendaagse corpus is het Corpus Hedendaags Nederlands (CHN).

Tags: , ,


Terug naar 'Zoeken op tags'