Beschrijving van de woordenschat

English

Het Instituut voor de Nederlandse Taal beschrijft de woordenschat van het Nederlands op basis van grote hoeveelheden bronnenmateriaal. Voor historische woordenboeken beschrijven de onderzoekers wat in het historische tekstmateriaal zichtbaar is, zonder daar een waardeoordeel aan te hechten. Dat kan ook moeilijk, want in vroeger eeuwen was er geen standaardtaal en waren er al helemaal geen spellingregels. Voor hedendaagse woordenboeken wordt uiteraard beschreven wat er in de bronnen staat, maar worden afwijkingen van de geldende spellingnorm wel expliciet gesignaleerd.

Wat bepaalt de betekenis van woorden?

De betekenis van de woorden wordt bepaald op basis van de context waarin ze voorkomen. Door het materiaal door te nemen, wordt het betekenisprofiel van het betreffende woord duidelijk en kan de redacteur een adequate beschrijving maken. Bij historisch materiaal geldt daarbij als complicatie dat sommige woorden en betekenissen wel bestaan moeten hebben, maar niet zijn overgeleverd, waardoor er hiaten in de beschrijving kunnen ontstaan. Voor hedendaags materiaal geldt dat men continu alert moet zijn op nieuwe betekenissen en gebruikstoepassingen van woorden. Een woordenboek van het hedendaags Nederlands is dus eigenlijk nooit af en moet voortdurend bijgewerkt worden.

Materiaal en selectie

Het materiaal op basis waarvan de woordenboeken worden gemaakt, is een zo divers mogelijke selectie van teksten uit de betreffende periode. Uit oudere periodes is relatief weinig materiaal bewaard gebleven. Voor het Oudnederlands Woordenboek bestaat het materiaal daarom uit alles wat er maar verzameld kon worden. Dat geldt eigenlijk ook voor het Vroegmiddelnederlands Woordenboek. Voor het Woordenboek der Nederlandsche Taal en het Algemeen Nederlands Woordenboek is wel een selectie gemaakt uit het beschikbare materiaal, anders zou het teveel worden. Bij die woordenboeken is geprobeerd om de selectie zo evenwichtig mogelijk te maken, met gelijke aandacht voor woorden uit de literatuur, uit krantenmateriaal, uit vakboeken, enzovoorts.

Beschrijving in clusters

Op basis van dit materiaal, dat een corpus genoemd wordt, wordt een lijst gemaakt met de woorden die voor beschrijving in het woordenboek in aanmerking komen. Het hangt van de omvang van het woordenboek af hoe groot deze lijst uiteindelijk wordt. Met deze lijst gaat de redactie van het woordenboek aan de slag. Vroeger verschenen veel woordenboeken in gedrukte afleveringen en was het noodzakelijk om de woordenschat strikt alfabetisch te bewerken. Door de digitalisering is dat inmiddels niet meer nodig. De relatief kleine woordenboeken van het Oudnederlands en het Vroegmiddelnederlands zijn door de redactie in clusters bewerkt, waarbij verwante woorden gezamenlijk werden beschreven, ook als ze alfabetisch ver uit elkaar staan. Dat is voor de redacteur veel efficiënter en levert voor de gebruiker een veel uniformer resultaat op. Deze aanpak is overgenomen voor het Algemeen Nederlands Woordenboek, waarvan tweemaandelijks een update met nieuw bewerkte woorden verschijnt.

Beschikbaar voor onderzoek

Onderzoekers kunnen zowel onze woordenboeken als corpora gebruiken voor eigen onderzoek. Met de uitgebreide zoekmogelijkheden van de woordenboekapplicaties kan men zelf de meeste onderzoeksvragen stellen. Ook de meeste corpora zijn toegankelijk voor wetenschappelijk onderzoek. Ze bevatten, behalve het tekstmateriaal zelf, over het algemeen ook informatie op diverse niveaus, bijvoorbeeld datering en geografische herkomst van de tekst, aanduiding van woordsoort en morfologische geleding en combinatiemogelijkheden. Niet alle corpora bieden dit in dezelfde mate, maar veel corpora bieden in elk geval meer dan alleen het tekstmateriaal.

Description of the vocabulary

The Dutch Language Institute describes the Dutch vocabulary on the basis of large amounts of source material. When compiling historical dictionaries, the researchers describe what the historical source material shows, without making any value judgements. That would be difficult to do anyway, given that in previous centuries no language standard existed, let alone any rules for spelling. For contemporary dictionaries, the content of the sources is of course described, but deviations from the current spelling norms are always mentioned explicitly.

What determines the meanings of words?

The meanings of words are determined by the context in which they occur. By going through the material, the meaning profile of the word at hand will become clear, and the editor will be able to provide an adequate description. For some historical material, this process is complicated by the fact that certain words and meanings, although we know that they must have existed at some point, have not been passed on, causing gaps in the descriptions. For contemporary material, on the other hand, we are always on the look-out for new meanings and uses of words. As such, a dictionary of contemporary Dutch is never really finished, and needs constant updating.

Material and selection

The material based on which the dictionaries are compiled is taken from a selection of texts from the relevant period that is as varied as possible. Relatively little material was saved from the older time periods. This is why the material for the Dictionary of Old Dutch consists of simply anything that could be collected. The same goes for the Early Middle Dutch Dictionary. For the Dictionary of the Dutch Language and the Dictionary of Contemporary Dutch a selection had to be made, or there would have been too much material. For these dictionaries, an optimal balance was strived for between words taken from literature, newspapers, specialist books, and so on.

Description in clusters

Based on this material, which is called a corpus, a list is made of all words that qualify to be described in the dictionary. The length of this list depends on the pre-established size of the dictionary. It is this list that the editors of the dictionary start working on. Previously, many dictionaries were published in printed parts, making it necessary to work on the vocabulary in alphabetical order. Thanks to digitization, this is no longer necessary. The relatively short dictionaries of Old Dutch and Early Middle Dutch have been edited in clusters in which related words were described alongside each other, even if they were far apart alphabetically. This method is more efficient for the editor, and provides the user with a much more uniform result. This approach has been copied for the Dictionary of Contemporary Dutch, for which an update with newly edited words is released bi-monthly.

Available for research

Researchers have the option of using both our dictionaries and our corpora for their own research. By using the extensive search options available in the dictionary applications, they can pose almost any research question. Most corpora are accessible for scientific research as well. They typically contain, in addition to the text material itself, the date and geographical origin of the text, plus a specification of word class, morphological parsing and combinatory patterns. Not all corpora offer this information in equal measure, but many offer at least more than the bare text material.

Op deze website maken wij gebruik van cookies.