Categorieën
Woordenboeken

Beschrijving van de woordenschat

Op het Instituut voor de Nederlandse Taal (INT) wordt zowel de historische als de hedendaagse woordenschat beschreven, bijvoorbeeld in woordenboeken. Dat gebeurt op verschillende manieren, omdat iedere tijd zijn eigen bronnen heeft.

English version

Description of the vocabulary

The Dutch Language Institute (INT) describes the Dutch vocabulary on the basis of large amounts of source material. When compiling historical dictionaries, the researchers describe what the historical source material shows, without making any value judgements. That would be difficult to do anyway, given that in previous centuries there was no such thing as a standard language, let alone spelling rules. For contemporary dictionaries, the content of the sources is of course described as well, but deviations from the current spelling rules are always mentioned explicitly.

What determines the meanings of words?

The meanings of words are determined by the context in which they occur. By going through the material and studying a word in various contexts, the meaning profile of the word at hand will become clear, and the dictionary editor will be able to provide it with an adequate description. For some historical material, this process is complicated by the fact that certain words and meanings, although we know that they must have existed at some point, have not been passed on, causing gaps in the descriptions.

When it comes to contemporary material, on the other hand, we need to be always on the lookout for new meanings and uses of words. As such, a dictionary of contemporary Dutch is never really finished, and needs constant updating.

Material and selection

The material that serves as the basis of the dictionaries is taken from a selection of texts that date from the relevant period and are as varied as possible. Relatively little material was saved from the very early periods. This is why the material for the Dictionary of Old Dutch consists of simply anything that could be collected. The same goes for the Early Middle Dutch Dictionary. For the Dictionary of the Dutch Language and the Dictionary of Contemporary Dutch a selection had to be made from the available sources, or there would have been too much material. For these dictionaries, an optimal balance was strived for between words taken from literature, newspapers, specialist books, and so on.

Description in clusters

Based on this material, which is called a corpus, a list is made of all words that qualify to be described in the dictionary. The length of this list depends on the pre-established size of the dictionary. It is this list that the editors of the dictionary start working on. Previously, many dictionaries were published in printed parts, making it necessary to work on the vocabulary in alphabetical order. Thanks to digitization, this is no longer necessary. The relatively small dictionaries of Old Dutch and Early Middle Dutch have been edited in clusters in which related words were described alongside each other, even if they were far apart alphabetically. This method is far more efficient for the editor, and provides the user with a more uniform result. This approach has been copied for the Dictionary of Contemporary Dutch, which is daily updated with newly edited words.

Available for research

Researchers have the option of using both our dictionaries and our corpora for their own research. By using the extensive search options available in the dictionary applications, they can pose almost any research question. Most corpora are accessible for scientific research as well. In addition to the text material itself they contain other information, such as, in most cases, the date and geographical origin of the text, plus a specification of word class, morphological parsing and combinatory patterns.

Het Instituut voor de Nederlandse Taal (INT) beschrijft de woordenschat van het Nederlands op basis van grote hoeveelheden bronnenmateriaal. Voor historische woordenboeken beschrijven de onderzoekers wat in het historische tekstmateriaal zichtbaar is. Dat gebeurt op een andere manier dan de beschrijving van de hedendaagse woordenschat, omdat er in vroeger eeuwen nog geen standaardtaal was en er nog geen officiële spellingregels waren. Voor hedendaagse woordenboeken wordt uiteraard ook beschreven wat er in de bronnen staat, maar wordt de officiële spelling volgens het Groene Boekje gevolgd en worden eventuele afwijkingen van de geldende spellingnorm wel expliciet gesignaleerd.

Wat bepaalt de betekenis van woorden?

De betekenis van woorden wordt bepaald op basis van de context waarin ze voorkomen. Door het gebruik van een bepaald woord in allerlei contexten te onderzoeken wordt het betekenisprofiel van dat woord duidelijk en kan een woordenboekredacteur een adequate beschrijving van dat woord maken. Een complicatie bij het bestuderen van historische teksten is dat je weet dat bepaalde woorden en betekenissen wel bestaan moeten hebben, maar dat die niet zijn overgeleverd in het beschikbare materiaal, waardoor de betekenisbeschrijvingen dus niet compleet zijn.

Voor hedendaags materiaal geldt dat je continu alert moet zijn op nieuwe betekenissen en gebruiksmogelijkheden van woorden. Een woordenboek van het hedendaags Nederlands is dus eigenlijk nooit af en moet voortdurend bijgewerkt worden.

Materiaal en selectie

Het materiaal op basis waarvan de woordenboeken worden gemaakt is een zo divers mogelijke selectie van teksten uit de periode die het woordenboek beschrijft. Uit oudere periodes zijn relatief weinig teksten bewaard gebleven. Voor het Oudnederlands Woordenboek (ONW) en het Vroegmiddelnederlands Woordenboek (VMNW) bestaat het materiaal daarom uit alles wat er maar verzameld kon worden. Voor het Woordenboek der Nederlandsche Taal (WNT) en het Algemeen Nederlands Woordenboek (ANW) is er wel een selectie gemaakt uit de beschikbare bronnen, omdat er heel veel teksten beschikbaar waren. Bij die woordenboeken is geprobeerd om de selectie zo evenwichtig mogelijk te maken, met gelijke aandacht voor teksten uit de literatuur, uit kranten, uit vakboeken, enz.

Beschrijving in clusters

Op basis van deze verzameling teksten, die een corpus genoemd wordt, wordt een lijst gemaakt met de woorden die voor beschrijving in het woordenboek in aanmerking komen. Het hangt van de omvang van het woordenboek af hoe groot deze lijst uiteindelijk wordt. Met deze lijst gaat de redactie van het woordenboek aan de slag. Vroeger verschenen veel woordenboeken in gedrukte afleveringen en was het noodzakelijk om de woordenschat strikt alfabetisch te bewerken. Door de digitalisering is dat inmiddels niet meer nodig. De relatief kleine woordenboeken van het Oudnederlands en het Vroegmiddelnederlands zijn door de redactie in clusters bewerkt, waarbij verwante woorden gezamenlijk werden beschreven, ook als ze alfabetisch ver uit elkaar staan. Dat is voor de redacteur veel efficiënter en deze werkwijze levert voor de gebruiker een uniformer resultaat op. Deze aanpak is overgenomen voor het Algemeen Nederlands Woordenboek, waarvan dagelijks een update met nieuw toegevoegde woorden verschijnt.

Beschikbaar voor onderzoek

Onderzoekers kunnen zowel onze woordenboeken als corpora gebruiken voor eigen onderzoek. Met de uitgebreide zoekmogelijkheden van de woordenboekapplicaties kan men zelf de meeste onderzoeksvragen stellen. Ook de meeste corpora zijn toegankelijk voor wetenschappelijk onderzoek. Bovendien bevatten de corpora behalve het tekstmateriaal zelf over het algemeen ook nog andere informatie, bijvoorbeeld datering en geografische herkomst van de tekst, aanduiding van woordsoort en combinatiemogelijkheden van het trefwoord.