Instituut voor de Nederlandse Taal

Gesproken Corpus van de zuidelijk-Nederlandse Dialecten (GCND)

Het GCND is een taalkundig geannoteerd corpus met een unieke collectie dialectopnames uit 768 verschillende plaatsen in Nederland, het noorden van Frankrijk en het zuiden van Nederland.

Tags: corpus, historisch

SABeD

Het SABeD Corpus bestaat uit transcripties van 200 colleges die zijn gegeven aan instellingen voor hoger onderwijs in Vlaanderen.

Tags: corpus

Het Historical Corpus of Dutch (HCD) wil een belangrijke leemte opvullen in de onderzoeksinfrastructuur voor historisch Nederlands, dat lange tijd geen evenwichtig corpus heeft gehad met gegevens uit alle eeuwen en uit verschillende regio’s en genres. Het HCD beslaat de zestiende tot en met de negentiende eeuw. Tekstmateriaal werd gekozen rond het midden van elke eeuw: 1550, 1650, 1750 en 1850.

Tags: corpus, historisch

Corpus Oudfries

Het Corpus Oudfries bevat een grote steekproef van de Oudfriese taal van ca. 1200-1550. Op dit moment bevat het corpus Oudfries 235.462 tokens, 177 tekstgetuigenissen uit 11 handschriften (114 verschillende teksten).

Tags: corpus, historisch

Gekaapte Brieven

Het corpus Gekaapte Brieven bevat 6000 brieven en andere documenten uit de Sailing Letters: Nederlandse brieven uit de tweede helft van de 17e tot de vroege 19e eeuw van en aan het thuisfront, die zijn buitgemaakt door kapers en in Britse archieven zijn bewaard. De teksten in het corpus zijn aangevuld met taalkundige informatie.

Tags: corpus, historisch

Couranten Corpus

Het Couranten Corpus omvat de zeventiende-eeuwse Nederlandse kranten die op Delpher beschikbaar zijn. De informatie in deze kranten is van belang voor onderzoekers van verschillende disciplines, variërend van historici tot historische taalkundigen, literatuurwetenschappers en kunsthistorici.

Tags: corpus, historisch

Corpus Juridisch Nederlands

Het Corpus Juridisch Nederlands omvat een verzameling van 5.856 wetsteksten uit de periode 1814 tot 1989, die per jaar zijn samengesteld.

Tags: corpus, historisch

Uitbreiding Corpus Hedendaags Nederlands

Het vernieuwde Corpus Hedendaags Nederlands (CHN) is sterk uitgebreid en bevat nu meer dan 2,5 miljoen teksten uit onder meer boeken, blogs, kranten, tijdschriften en journaaluitzendingen uit Nederland en de Caribische rijksdelen, Vlaanderen en Suriname. In de nieuwe versie van het CHN zijn 1.700.000 teksten toegevoegd: het corpus bestaat nu uit bijna 1 miljard woorden.…

Tags: corpus, hedendaags

Brieven als Buit

Het corpus Brieven als Buit (origineel) bevat 1.000 Sailing Letters: Nederlandse brieven uit de tweede helft van de 17e tot de vroege 19e eeuw van en aan het thuisfront, die zijn buitgemaakt door kapers en in Britse archieven zijn bewaard. De teksten in het corpus zijn aangevuld met taalkundige informatie. Brieven als Buit-2 is een aanvulling op het originele corpus en bevat ruim 1.300 Sailing Letters. Deze teksten zijn niet taalkundig verrijkt maar wel voorzien van metadata.

Tags: corpus, historisch

Nederlab

Nederlab is een webinterface die onderzoekers in staat stelt verspreide digitale historische corpora als eenheid te doorzoeken en te analyseren; dit geldt zowel voor de teksten zelf als voor de metadata.

Tags: corpus, historisch

Eindhoven-corpus

Het Eindhoven-corpus is een verzameling Nederlandstalige geschreven en (uitgeschreven) gesproken teksten uit de periode van 1960 tot 1976. Het bevat materiaal uit kranten en tijdschriften en correspondentie tussen de regering en de Staten-Generaal, en diverse gesproken bronnen. Het is in diverse fases verbeterd en inmiddels bruikbaar gemaakt in een hedendaagse corpusapplicatie.

Tags: corpus, historisch

Corpus Middelnederlands

Het Corpus Middelnederlands is een verzameling van ruim 350 Middelnederlandse rijm- en prozateksten uit de periode 1300-1550. Het corpus bevat veel literair materiaal, waaronder de Beatrijs en de Reynaert.

Tags: corpus, historisch

Corpus Gysseling

Het Corpus Gysseling is een verzameling 13e-eeuwse Middelnederlandse teksten. Het zijn voornamelijk ambtelijke en literaire teksten die gebruikt zijn als bronnenmateriaal voor het Vroegmiddelnederlands Woordenboek (VMNW). De teksten in het corpus zijn aangevuld met taalkundige informatie.

Tags: corpus, historisch

Corpus Oudnederlands

Het Corpus Oudnederlands is de verzameling van al het bekende Nederlandse woordmateriaal uit de periode 475-1200. Het bestaat uit drie grote teksten (Wachtendonkse Psalmen, Leidse Willeram, Mittelfränkische Reimbibel) en een aantal kleinere teksten, fragmenten, losse woorden en plaatsnamen. Het corpus is taalkundig verrijkt met woordsoort en lemma, en is gebruikt als bronnenmateriaal voor het Oudnederlands Woordenboek (ONW).

Tags: corpus, historisch

Corpus Hedendaags Nederlands

Het Corpus Hedendaags Nederlands (CHN) is een groeiende tekstverzameling van meer dan 2.500.000 teksten uit kranten, tijdschriften, journaaluitzendingen, blogs, websites en romans. Het corpus is automatisch aangevuld met taalkundige informatie zoals woordsoort en lemma.

Tags: corpus, hedendaags

Corpora

Een corpus is een grote verzameling geschreven of gesproken teksten, gemaakt om een taal te kunnen bestuderen en beschrijven. Onze historische corpora zijn: het Corpus Gysseling, het Corpus Oudnederlands en het Corpus Middelnederlands. Ons hedendaagse corpus is het Corpus Hedendaags Nederlands (CHN).

Tags: corpus, hedendaags, historisch

Terug naar 'Zoeken op tags'

INT-nieuwsbrief

Terminologienieuwsbrief